本文主要是介绍Object Instance Mining for Weakly Supervised Object Detection,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
论文题目:Object Instance Mining for Weakly Supervised Object Detection
论文链接:https://arxiv.org/pdf/2002.01087.pdf
论文代码:https://github.com/bigvideoresearch/OIM
提出了一种端到端的物体实例挖掘(Object Instance Mining,OIM)弱监督目标检测框架。其实就是提供了一种充分挖掘proposals的方法。
从现有的多目标检测发现:
1、很容易陷入局部最优。因为这个学习机制倾向于对每一个类别学习一张图片中最明显的特征,其他被忽略的物体实例容易使学习网络陷入局部最优,进而影响弱监督目标检测的性能。在训练过程中可能会选择缺失的区域作为负样本,这可能会进一步降低CNN分类器的识别能力。
2、置信度最高的region proposal 很容易集中在目标的局部位置。这可能会导致只检测到物体的一小部分的问题。
两个 Contribution
1、提出了一个基于spatial graphs和appearance graphs模型的网络框架。(OIM)
2、提出了目标实例权重重调损失函数。(Instance Reweighted Loss)
OIM基于两个基本假设:
1、置信度最高的proposal 及其周围高度重叠的proposal 可能属于同一类 ——> spatial similarity 建立spatial graphs
2、同一类的对象应具有较高的相似度 ——>appearance similar建立appearance graphs
框架
该框架引入了基于Spatial Graph及Appearance Graph的信息传播机制,在网络迭代学习过程中,就可以只使用image-level的监督信息在每张图片中挖掘所有可能的目标实例。这样使得在基于多实例学习方法的网络学习过程中,特征不够显著的物体实例可以被检测到并加入训练,进而提升特征的表达能力和鲁棒性。
框架由两部分组成:MID + OIM
MID(多实例检测器)进行行候选区域的选择和分类。
OIM集成候选框的特征和MID的检测结果。
主要介绍OIM
OIM
给定一张图片 I,选定置信度最高的proposal P
-
建立spatial graphs:
G i c s = ( V i c s , E i c s ) G_{i_c}^s = (V_{i_c}^s , E_{i_c}^s ) Gics=(Vics,Eics)
V i c s V_{i_c}^s V
这篇关于Object Instance Mining for Weakly Supervised Object Detection的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!