- 52
- 0
- 约2.41千字
- 约 12页
- 2017-06-08 发布于湖北
- 举报
几种基于深度学习的目标检测(SPPNet,Fast,Faster R-CNN,YOLO)
SPP Net
1.结合空间金字塔方法实现CNNs的多尺度输入
一般CNNs后接full-connect layer或者classifier,它们都需要固定的输入尺寸。因此不得不对输入数据进行crop或warp,这些预处理会造成数据的丢失或几何学上的失真。 SPP Net 的第一个贡献是将空间金字塔的思想加入到CNNs中,实现了数据的多尺度输入。
Spatial Pyramid Pooling Layer(SPP)
如图,在卷基层和全连接层之间加入SPP layer。此时网络的输入可以是任意尺寸,在SPP layer中每一个pooling的filter会根据输入调整大小,而SPP的输出尺寸始终是固定的。
2.只对原图提取一次卷积特征
在R-CNN中,每个proposed region先rescale成统一大小,然后分别作为CNNs的输入,这样是很低效的。
在SPP Net中,只对原图进行一次卷积得到整张图的feature map,然后找到每个proposed region在feature map上的映射patch,将此patch作为每个proposed region的卷积特征输入到SPP layer和之后的层。节省了大量的计算时间,比R-CNN有一百倍左右的加速。
Fast R-CNN整体结构
如图,Fast R-CNN的网络有两个输出层,一个softmax,一个bbox regr
原创力文档

文档评论(0)