Object Instance Mining for Weakly Supervised Object Detection

本文主要是介绍Object Instance Mining for Weakly Supervised Object Detection，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

论文题目：Object Instance Mining for Weakly Supervised Object Detection
论文链接：https://arxiv.org/pdf/2002.01087.pdf
论文代码：https://github.com/bigvideoresearch/OIM

提出了一种端到端的物体实例挖掘(Object Instance Mining,OIM)弱监督目标检测框架。其实就是提供了一种充分挖掘proposals的方法。

`从现有的多目标检测发现:`

1、很容易陷入局部最优。因为这个学习机制倾向于对每一个类别学习一张图片中最明显的特征，其他被忽略的物体实例容易使学习网络陷入局部最优，进而影响弱监督目标检测的性能。在训练过程中可能会选择缺失的区域作为负样本，这可能会进一步降低CNN分类器的识别能力。
2、置信度最高的region proposal 很容易集中在目标的局部位置。这可能会导致只检测到物体的一小部分的问题。

`两个 Contribution`

1、提出了一个基于spatial graphs和appearance graphs模型的网络框架。（OIM）
2、提出了目标实例权重重调损失函数。（Instance Reweighted Loss）

`OIM基于两个基本假设:`

1、置信度最高的proposal 及其周围高度重叠的proposal 可能属于同一类 ——> spatial similarity 建立spatial graphs
2、同一类的对象应具有较高的相似度 ——>appearance similar建立appearance graphs

`框架`

该框架引入了基于Spatial Graph及Appearance Graph的信息传播机制，在网络迭代学习过程中，就可以只使用image-level的监督信息在每张图片中挖掘所有可能的目标实例。这样使得在基于多实例学习方法的网络学习过程中，特征不够显著的物体实例可以被检测到并加入训练，进而提升特征的表达能力和鲁棒性。

框架由两部分组成：MID + OIM
MID（多实例检测器）进行行候选区域的选择和分类。
OIM集成候选框的特征和MID的检测结果。
主要介绍OIM

在这里插入图片描述

OIM

给定一张图片 I，选定置信度最高的proposal P

建立spatial graphs:
$G_{i_c}^s = (V_{i_c}^s , E_{i_c}^s )$
$V_{i_c}^s$

这篇关于Object Instance Mining for Weakly Supervised Object Detection的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

原文地址:
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.chinasem.cn/article/536776。如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈，一经查实，立即删除！我们的邮箱：23002807@qq.com