本文主要是介绍Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks----论文笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、为什么提出Faster R-CNN
Faster R-CNN
的前身Fast R-CNN
能达到实时检测,如果不考虑它用selective search
计算region proposal
所花时间的话。为此作者提出了Region Proposal Network(RPN)
,该深度网络通过共享卷积网络,使计算region proposal
的时间几乎可以忽略不计(10 ms/图)!
二、Faster R-CNN框架 = Fast R-CNN + RPN(取代selective search)
三、RPN结构
1)输入: 一张图像,输出: 多个矩形object proposal
。
注:每个object proposal
都有objectness score
,衡量此object proposal
有多大程度上是一个物体。
2)输入图像经过前面多个共享的卷积层,至最后一个共享卷积层输出的conv feature map
,才算刚到RPN
网络的开始。
注:conv feature map
有好多张。
3)RPN
与conv feature map
上滑动的 n×n 窗口全连接,每个窗口映射到一个固定长度的低维向量(图示中是256维)。
4)此向量再分别输入两个全连接层:cls layer
和reg layer
。
注:在每个窗口位置,会预测k个(文中k=9)region proposal
。所以 cls layer
输出2k个score
来衡量这k个region proposal
分别有多大程度属于物体,而reg layer
输出4k维来定位(中心坐标、长、宽)各个box
。
5)以上只是一个窗口产生的box
,一张图像一般会有2k左右的box
,也就有相应数量的感兴趣图像区域(RoI)输入到fast R-CNN
框架中。
三、Faster R-CNN的优点
1)替代掉费时的selective search
方法,速度提高了。
2)能与Fast R-CNN共享一部分卷积层,计算效率(速度)提高了。
3)RPN
产生的region proposal
质量高,准确率(mAP
)也提高了。
四、Faster R-CNN的缺点
1)文中采用的联合优化方法(joint optimizing)应该有更好的方法。
2)NPR
产生的在图像边缘的region proposal
信息被丢弃了。
五、Faster R-CNN的补充
联合优化方法。
1)用在
ImageNet
上训练好的模型初始化网络,然后微调网络以适用产生候选区域(region proposal
)任务。2)利用第一步训练好的
RPN
产生的proposal
,Fast R-CNN
训练一个独立的检测网络,该检测网络也是用在ImageNet
上训练好的模型初始化的。注:到目前两个网络还没有共享卷积层。
3)用检测网络初始化
RPN
训练网络,但固定共有卷积层,只微调RPN
网络独有的层。4)保持共有的卷积层固定,微调
Fast R-CNN
网络的fc
层。注:至此,两个网络便共享了同样的卷积层,形成了一个统一的网络 。
这篇关于Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks----论文笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!