CVPR二十年最有影响力的10篇论文

 

CVPR二十年最有影响力的10篇论文

10、Inception-v3

做出的主要改进是将卷积进行非对称拆分,显著降低了参数量,同时使得空间特征更为丰富。    

9、DenseNet——CVPR2017年最佳论文

当时神经网路ode普遍问题:随着网络层数的加深,训练过程中的前传信号和梯度信号在经过多层之后可能会逐渐消失。    

而DenseNet对前每一层都加一个单独的shortcut,使得任意两层网络都可以直接沟通。但是其内存占用十分大。    

8、YOLO——目标检测

YOLO,即只需要浏览一次就能识别出物体的类别和数量    

7、RCNN——将CNN引入目标检测的开山之作

RCNN前,经典的目标检测算法是使用“滑动窗口”依次判断所有可能的区域,而RCNN采用Selective Search方法,预先提取一系列较可能是物体的候选区域,之后仅在这些候选区域上提取特征,这使得检测速度大大提升。    

6、Rapid Object Detection using a Boosted Cascade of Simple Features

主要解决了三个问题:    

减少计算特征的时间
构建了简单而又高效的单分支决策树分类器
从简单到复杂的多可分类器级联,都可能包含人脸的区域进行重点检测

5、GoogLeNet

开辟了inception家族、并在CNN分类器发展史上留下了浓墨重彩的一笔。    

在Inception之前,大部分流行的CNN是将卷积层不断堆叠,让网络越来越深得到更好的性能,GooLeNet最大的特点是使用Inception模块设计一种具有优良局部拓扑结构的网络,对输入图像并行地进行多个卷积运算或池化操作,将所有输出结果拼接成为一个非常深的特征图    

4、ImageNet

海量带标注图像数据集,有1500万+图片,可以说是图像处理算法的试金石    

3、FCN

高居图像分割排行榜第一位(图像分割TOP1),语义分割的开山之作,所提出的全卷积网络的概念开创了用FCN做实例和像素级别理解系列方法的先河。    

2、HOG

非常经典的图像特征提取算法。HOG将图像分成小的连通区域,并将之成为细胞单元,采集细胞单元中各像素点的梯度或边缘的方向直方图,并将这些直方图组合起来构成特征描述器。    

1、ResNet——残差模块

2016CVPR最佳论文奖,横扫ImageNet 2015和COCO榜单,在深度学习领域都带来了颠覆式的影响。(第一作者:何凯明)    

最初设计用来处理深层次CNN结构中梯度消失和梯度爆炸问题,它将输入从卷积层的每个块添加到输出,让每一层更容易学习恒等映射,并减少了梯度消失的问题。    

附录——参考资料:

视频素材:

1、https://www.youtube.com/watch?v=VxhSouuSZDY

(Inception Module)

2、https://www.youtube.com/watch?v=-W6y8xnd–U
(Densely Connected Convolutional Networks,CVPR2017)
3、https://www.youtube.com/watch?v=NM6lrxy0bxs
(You Only Look Once: Unified, Real-Time Object Detection,CVPR2016)
4、https://www.youtube.com/watch?v=TxPimS50PU8
(YOLO Basic Introduction. | You only LIVE once. | Object Detection.)
5、https://www.youtube.com/watch?v=v5bFVbQvFRk
(Introduction to How Faster R-CNN, Fast R-CNN and R-CNN Works)
6、https://www.youtube.com/watch?v=_RAAptrW_1g
(rapid object detection using a boosted cascade of simple features)
7、https://www.youtube.com/watch?v=KfV8CJh7hE0
(C4W2L07 Inception Networ)
8、https://www.youtube.com/watch?v=jYvBmJo7qjc
(”ImageNet: Where Have We Been? Where Are We Going?” with Fei-Fei Li)
9、https://www.youtube.com/watch?v=7S5qXET179l(失效,估计是网址不对)

10、https://www.youtube.com/watch?v=C6tLw-rPQ2o

(Deep Residual Learning for Image Recognition,CVPR2016现场视频)
11、https://www.youtube.com/watch?v=ZILIbUvp5lk

(C4W2L03 ResNets)

文本素材:

1、【模型解读】Inception结构,你看懂了吗 - 知乎 (zhuanlan.zhihu.com/p/41691301)

2、https://www.zhihu.com/question/60109389/

 answer/203099761

3、You Only Look Once: Unified, Real-Time Object Detection(YOLO) - 知乎 (https://zhuanlan.zhihu.com/p/31427164)

4、RCNN- 将CNN引入目标检测的开山之作
(https://zhuanlan.zhihu.com/p/23006190)

5、《Rapid Object Detection using a Boosted Cascade of Simple Features》论文笔记(https://blog.csdn.net/weixin_37763809/article/details/88256828)
6、从Inception v1到Inception-ResNet,一文概览Inception家族的「奋斗史」(https://zhuanlan.zhihu.com/p/37505777)
7、21秒看尽ImageNet屠榜模型,60+模型架构同台献艺(https://zhuanlan.zhihu.com/p/77221549)
8、引用次数在15000次以上的都是什么论文? - 知乎 (https://www.zhihu.com/question/433702668/answer/1617092684)
9、目标检测的图像特征提取之(一)HOG特征(https://blog.csdn.net/zouxy09/article/details/7929348)
10、告别2019:属于深度学习的十年,那些我们必须知道的经典 | 机器之心(https://www.jiqizhixin.com/articles/2020-01-01)