本文主要是介绍文献阅读笔记6——《DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous ..》,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
0 写在前面
开源基于mmdetection
1 递归特征金字塔(RFP)
提出的递归特征金字塔(RFP)建立在特征金字塔上(FPN),通过额外的反馈链接从FPN层合并到自下而上的骨干层,将递归结构展开为顺序实现。该主干网络可以将图像查看两次或更多次。
- (a)为FPN的经典结构
- (b)中的连接线为RFP提出的反馈连接方式
- (c)展示了RFP按顺序展开的网络反馈链接为第一次FPN各层输出经过ASPP输出与主干网络的各层链接。最终输出为两次FPN输出结果的融合。
A ASPP结构
ASPP带有空洞卷积的空间金字塔池化模块。
- 去除了1*1卷积分支
- 四个并行通道,前三个使用卷积层->ReLU=输出通道是输入通道的1/4。
- 最后一个分支使用全局平均池化来压缩特征->1*1卷积层和ReLU将压缩后的特征转换为1/4。
空洞模块的配置kernel size = [1, 3, 3], atrous rate =[1, 3, 6], padding = [0, 3, 6]。
B ASPP输出与主干网络反馈连接结构
第一次FPN出来的feature map经过ASPP转换就是RFP Features
第二次出来的特征映射和第一次特征映射进行融合时,需要进行的操作。
2 可切换空洞卷积(SAC)
可将相同的输入特征与不同的的空洞率进行卷积,并使用切换功能来搜集结果。将自上而下的主干网络所有标准的3*3卷积层都换成SAC。
在SAC组件之前和之后都附加了两个全局上下文模式。主干网络中3*3都替换成SAC。
A 结构
B 锁定机制
原因:目标检测器通常使用预训练权值来初始化权重。 但是,对于从标准卷积层转换而来的SAC层,缺少较大atrous率的权重。 由于可以用相同的权重以不同的空洞率粗略地检测出不同尺度的目标,因此自然地用预训练模型中的权重来初始化丢失的权重是很自然的。
C 全局上下文机制
原因:
1.只有一个卷积层,没有任何非线性层
2.输出被加回到主流上,输入由sigmod计算的重新校准值。
3 baseline:HTC
这篇关于文献阅读笔记6——《DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous ..》的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!