本文主要是介绍Faster R-CNN中的RPN,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
今天在读Faster R-CNN。
之前读过一次,当时正在看SSD,感觉Faster R-CNN的网络结构和SSD有一些相似,所以Faster R-CNN就只是粗略地看了一下。今天当我有时间仔细读了一下以后,突然被一个问题卡住了——下图中从feature map到256-d向量的intermediate networks是什么?
从图中可以看出,我们截取了CNN(比如VGG-16)的前半部分用于提取特征(常常是直觉用pre-trained model就行了),然后在输出的Feature Map中应用一个3 x 3的Sliding Window,每一个位置输出k个bounding boxes。但是,从这个Feature Map到bounding box的intermediate layer输出的是一个256-d的特征向量,原文中说是这个特征向量通过了全连接层得到的k个bounding boxes,那么这里的intermediate layer究竟是什么呢?
从这部视频中我恍然大悟,从Feature Map到256-d特征向量是非常Straightforward的一件事(当我看懂了才觉得Straightforward以及我太菜了)所谓的S
这篇关于Faster R-CNN中的RPN的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!