Training Region-based Object Detectors with Online Hard Example Mining(CVPR2016 Oral)

本文主要是介绍Training Region-based Object Detectors with Online Hard Example Mining(CVPR2016 Oral),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

转载自:http://zhangliliang.com/2016/04/13/paper-note-ohem/

Training Region-based Object Detectors with Online Hard Example Mining是CMU实验室和rbg大神合作的paper,cvpr16的oral,来源见这里:http://arxiv.org/pdf/1604.03540.pdf

其实文章的idea很简单,是将bootstrapping做成online的形式嵌入到Fast R-CNN的detection的pipeline里面,其实有点类似将SGD回传的时候,对样本进行一个重新选择(选择困难样本或者对困难样本赋予更高的权重)。

在正文开始之前,容我碎碎念一小段,读者可以跳过这一段。其实online boostrapping跟CNN结合的尝试也是蛮多的。比如将FCN跟boostrapping结合做detection的工作有DenseBox,SSD。但都是作为一个trick存在的,只写了一个小节。估计作者也是觉得很难用boostrapping作为核心idea来发paper吧。但这篇敢用bootstrapping作为核心idea并且还中了oral,自然也是有其高明之处。其中最重要的点可能会是,它把bootrapping这个trick做work了,而且是在VOC和COCO上做work,并且能够提高3个点,就显得比较solid了。相对来说,可能DenseBox和SSD相对来说没有做得很work,所以就没有那么confident了。那为何这篇文章就能够把bootrapping做solid呢?很可能是作者确实思考得比较深,用了一些别人没想到的细节(比如对困难样本做nms再选择)。将一个idea做work做solid,是一个难能可贵的能力。

回归正文,文章的核心idea是将bootstrapping,或者说是hard sample mining,直接integrate到SGD算法里面去,并且将这个修改的SGD算法叫Online Hard Example Mining(OHEM)。如下图所示,对于OHEM的一个iter,是这样做的。首先整张图片前传得到conv的featmap,然后将全图的所有的N(对于selective search算法来说,一般N=2000)个proposal都用roi pooling来提特征并且前传到fc中得到每个proposal的loss。显然,loss越大,代表这个proposal对于目前的分类器来说是hard sample,将B(比如B=128)个hard sample收集起来,并且将这些样本的loss求导成diff回传回去,来更新网络。

核心idea就是这样,另外作者提到需要注意的一点是,bbox交叠的propsoal往往比较相似,所以在选择hard sample的时候,sample与sample之间不宜IoU过大,所以作者做了一个IoU为0.7的nms。

这篇关于Training Region-based Object Detectors with Online Hard Example Mining(CVPR2016 Oral)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1050169

相关文章

Python: create object

# encoding: utf-8# 版权所有 2024 涂聚文有限公司# 许可信息查看:# 描述:# Author : geovindu,Geovin Du 涂聚文.# IDE : PyCharm 2023.1 python 3.11# Datetime : 2024/6/15 18:59# User : geovindu# Product :

【进阶篇-Day5:JAVA常用API的使用(Math、BigDecimal、Object、包装类等)】

目录 1、API的概念2、Object类2.1 Object类的介绍2.2 Object的toString()方法2.3 Object的equals()方法2.4 Objects概述 3、Math类4、System类5、BigDecimal类6、包装类6.1 包装类的概念6.2 几种包装类(1)手动转换包装类:(2)自动转换包装类:(3)Integet常用方法:(4)练习: 1

▶《强化学习的数学原理》(2024春)_西湖大学赵世钰 Ch5 蒙特卡洛方法【model-based ——> model-free】

PPT 截取必要信息。 课程网站做习题。总体 MOOC 过一遍 1、视频 + 学堂在线 习题 2、 过 电子书 是否遗漏 【下载:本章 PDF GitHub 页面链接 】 【第二轮 才整理的,忘光了。。。又看了一遍视频】 3、 过 MOOC 习题 看 PDF 迷迷糊糊, 恍恍惚惚。 学堂在线 课程页面链接 中国大学MOOC 课程页面链接 B 站 视频链接 PPT和书籍下载网址: 【Gi

玩转Web之Json(四)---json与(Object/List/Map)的相互转化

在做web应用时,经常需要将json转化成Object/list/map或者将Object/List/map转化成json,通过简单封装可以在写代码是减轻很多负担。本文将给出json转化的一系列方法。 闲话不 多说,直接上代码: 先是Object /List /Map转化为Json /* 功能 :将一个对象转成json数组* 参数 :object对象* retu

Selenium使用Page Object实现页面自动测试

原文转自:https://blog.csdn.net/zhenyu5211314/article/details/13632083 Page Object模式是Selenium中的一种测试设计模式,主要是将每一个页面设计为一个Class,其中包含页面中需要测试的元素(按钮,输入框,标题等),这样在Selenium测试页面中可以通过调用页面类来获取页面元素,这样巧妙的避免了当页面元素id或者位置变

越复杂的CoT越有效吗?Complexity-Based Prompting for Multi-step Reasoning

Complexity-Based Prompting for Multi-step Reasoning 论文:https://openreview.net/pdf?id=yf1icZHC-l9 Github:https://github.com/FranxYao/chain-of-thought-hub 发表位置:ICLR 2023 Complexity-Based Prompting for

▶《强化学习的数学原理》(2024春)_西湖大学赵世钰 Ch4 值迭代 与 策略迭代 【动态规划 model-based】

PPT 截取必要信息。 课程网站做习题。总体 MOOC 过一遍 1、视频 + 学堂在线 习题 2、过 电子书 补充 【下载: 本章 PDF 电子书 GitHub】 [又看了一遍视频。原来第一次跳过了好多内容。。。] 3、总体 MOOC 过一遍 习题 学堂在线 课程页面链接 中国大学MOOC 课程页面链接 B 站 视频链接 PPT和书籍下载网址: 【GitHub 链接】 总述:

tessy 单元测试 TDE 界面 数据无法填充:the test object interface is incomplete

目录 1,失败现象 2,失败原因 3,解决办法 1,失败现象         函数名字前的图标高度缩小为正常的一半,TDE界面的数据无法填充。错误提示为题目中的英文。 2,失败原因         TIE界面,此函数的参数的 passing 方向有 unknown,未正确识别。 3,解决办法         将 interface 栏的所有参数的 passing 和

java中Object和json相互转换的方式

1.org中jackson转换json,springboot中内置jackson ObjectMapper o=new ObjectMapper(); List<>list=new ArrayList(); String jons=o.writeAsValueString(list); 2.alibaba中fastjson转换成json @GetMapping("/test"

[论文阅读笔记31] Object-Centric Multiple Object Tracking (ICCV2023)

最近Object centric learning比较火, 其借助了心理学的概念, 旨在将注意力集中在图像或视频中的独立对象(objects)上,而不是整个图像。这个方法与传统的基于像素或区域的方法有所不同,它试图通过识别和分离图像中的各个对象来进行学习和理解。 这个任务和跟踪有着异曲同工之处,跟踪也是需要在时序中定位感兴趣的目标。那么object centric learning能否用于无