CVPR2014 Objectness Estimation at 300fps

2023-12-02 22:32

本文主要是介绍CVPR2014 Objectness Estimation at 300fps,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文转自http://www.cvchina.info/2014/02/25/14cvprbing/, 感谢cmm.

  • BING: Binarized Normed Gradients for Objectness Estimation at 300fps. Ming-Ming Cheng, Ziming Zhang, Wen-Yan Lin, Philip Torr, IEEE CVPR, 2014. [Project page][pdf][bib]

亮点巨多:

  1. 在PASCAL VOC数据集上取得了State of the art的Detection Rate
  2. 比PAMI2012, PAMI 2013, IJCV 2013  的方法快了1000倍,测试速度达300个图像每秒!
  3. 计算一个window的objectness score仅需2个float乘法,一个float加法,十来个bitwise operation。
  4. 没有各种复杂的计算,算法代码100行以内。
  5. 在整个PASCAL VOC 2007数据集上,Training不需要几周,不需要几天,仅需20秒钟!
  6. 有望for free的加速几乎所有object detection方法。去年CVPR best paper,以及在VOC上跑出最好成绩的ICCV 2013 Oral paper,  在共同抱怨的generic object proposal的速度瓶颈完全解决了。应该最多再过一年,各种realtime,high performance的multi-object detection将迅速涌现。
  7. 我来牛津一年多了,第一次在组内reading group (http://www.robots.ox.ac.uk/~vgg/rg/)上听Prof. Andrew Zisserman (全世界唯一拿过3次Marr奖的教授,论文citaiton 6万多)在组内讨论中对一个paper给这么正面的评价,并在我作组内reading group报告当天安排自己的学生开始做后续工作。
  8. 由于这次只用了最最简单的feature (梯度绝对值),最简单的学习方法 (Linear SVM)。应该非常容易进行扩展和改进。
  9. 我2011年发布Saliency region detection代码的时候,当时觉得会有比较多的后续工作(后来证明光我自己的论文就有400多次引用),但也没有这次这个topic这么让人激动!相信未来一段时间将有非常多的领域会产生深刻的变化。为了推动这一变化,算法已经与一个小时前共享了出来:C++代码 http://mmcheng.net/bing/

人去识别一个照片,没见过谁用sliding window的方式一个个仔细的判断。因此Objectness 和 Saliency机制很相关,我感觉用objectness应该是detection的正确机制。

关于Salient object detection,如果一个图像只生成一个saliency map的话,用单张图像搞Saliency map,发展空间已经不是特别大了,我11年投PAMI那篇在MSRA1000上做到了93%左右的FMeasure,之后没看过别的比我CVPR11论文中segmentation结果(F = 90%)更高的正确率。用多张图像,特别是从internet上随机download的图像,从中提取有用的Salient object,并自动剔除单张图像分析产生的错误,应该还有很多事情可做。具体可参考:http://mmcheng.net/gsal/

关于Objectness,CVPR14这个充其量只算开了个头。因为只用了最最弱的feature(梯度:相邻像素颜色相减的绝对值)和学习方法(LinearSVM)来刻画我对这个问题的observation。进一步对初步结果做分析,将1000个proposal降低到几百个,甚至几十个,并同时保持较高的recall,将会有很多工作可做。从1千降到几十,将是一个漫长的过程,估计需要上百篇paper的不懈努力才有可能实现。

要是在未来几年,能将proposal数目降低到个位数,将会深刻影响图像编辑领域,我们也可能可以直接通过语音命令在没有分类器存在的情况下发出控制命令,例如“把这个object给我变大…”。关于语音控制的semantic parsing和图像编辑,有兴趣的话可以参考:http://mmcheng.net/imagespirit/ 。这个paper接收后也会公布代码。

以上来自cmm的评价

最后说下自己的感触,有的研究真的没必要堆那么多的算法, 有的简单的,不起眼的算法就能解决相当困难的问题,会得到意想不到的效果。总之,每种方法要对症下药,才能事半功倍。做科研就像填空题一样,语言文字简短精炼,比起那些冗余复杂的文字来的效果更好。

最后祝大家科研马到成功,也祝自己越来越好。过段时间我会将cmm这篇文章的vs2010版奉上,方便vs2010的童鞋(cmm的是vs2012).


NEW!!!!!!!!!!!!!

程序(vs2010 win8 32bit, 建议将win32改成x64就可以了)下载地址:http://download.csdn.net/detail/xiaojidan2011/7445645

转自:http://blog.csdn.net/xiaojidan2011/article/details/19939655

这篇关于CVPR2014 Objectness Estimation at 300fps的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/447075

相关文章

【python】OpenCV—Single Human Pose Estimation

文章目录 1、Human Pose Estimation2、模型介绍3、基于图片的单人人体关键点检测4、基于视频的单人人体关键点检测5、左右校正6、关键点平滑7、涉及到的库函数scipy.signal.savgol_filter 8、参考 1、Human Pose Estimation Human Pose Estimation,即人体姿态估计,是一种基于计算机视觉和深度学习的技

2010-ECCV - Two-phase kernel estimation for robust motion deblurring

项目地址:http://www.cse.cuhk.edu.hk/~leojia/projects/robust_deblur/index.html 贾佳亚团队 边缘预测与边缘选择,过滤细微结构对于模糊核估计的影响分两阶段估计模糊核,第一阶段:L2范数,第二阶段:L1范数图像先验,在估计模糊核过程中使用空间结构先验,非盲阶段时使用TV范数 文章首先了图像结构如何影响模糊核结构: Salien

AlphaPose姿态估计论文翻译和代码解读RMPE: Regional Multi-Person Pose Estimation

姿态估计模型AlphoPose模型的论文 或者论文V3版 ICCV2017接收,上海交大和腾讯优图的论文 代码 ,基于pytorch或者Tensorflow 如果想了解姿态估计的简单概述,可以点击我的另一篇综述文章 RMPE: Regional Multi-Person Pose Estimation Abstract 自然场景的多人姿态估计是一个极大的挑战。虽然最好的人类检测器已经有很好的

拥挤场景多人姿态估计论文梗概及代码CrowdPose: Efficient Crowded Scenes Pose Estimation and A New Benchmark

姿态估计是视频动作分析识别的基础工作,我有一篇小综述讲了姿态估计相关技术路线的发展,可以点这个链接看。 本文是MVIG大佬们发表在CVPR2019上的一篇论文,上号交通大学,基于AlphaPose思路,进一步提升了拥挤情况下准度 代码:github点这,基于Pytorch,是实时多人姿态估计系统 论文:论文点这 论文第二版点这 Abstract 多人姿态估计是大量计算机视觉任务的基础,近年来也

姿态估计Rethinking on Multi-Stage Networks for Human Pose Estimation论文梗概及代码解读

2018年COCO关键点检测冠军算法MSPN,姿态估计,Top-down的技术路线 应该是截止2019年10月26日时开源的最好的姿态估计算法之一了 旷世出品 代码链接点这,是基于Pytorch的 论文链接点这 摘要 姿态估计方法以基本形成one-stage 和 multi-stage两个路线 多阶段看上去更适合任务,但是现在多阶段的性能还是不如单阶段的 我们论文就来研究这个问题,我们讨论当下

【论文精读】分类扩散模型:重振密度比估计(Revitalizing Density Ratio Estimation)

文章目录 一、文章概览(一)问题的提出(二)文章工作 二、理论背景(一)密度比估计DRE(二)去噪扩散模型 三、方法(一)推导分类和去噪之间的关系(二)组合训练方法(三)一步精确的似然计算 四、实验(一)使用两种损失对于实现最佳分类器的重要性(二)去噪结果、图像质量和负对数似然 论文:Classification Diffusion Models: Revitalizing

Age and gender estimation based on Convolutional Neural Network and TensorFlow

训练数据处理 imdb数据提取 gender: 0 for female and 1 for male, NaN if unknown age: 年龄分为101类,分别为从0到100岁. 将训练数据转换为tfrecords格式,命令为, python convert_to_records_multiCPU.py --imdb --nworks 8 --imdb_db /home/rese

论文翻译 BING: Binarized Normed Gradients for Objectness Estimation at 300fps

BING: Binarized Normed Gradients for Objectness Estimation at 300fps Ming-Ming Cheng, Ziming Zhang, Wen-Yan Lin, Philip Torr, IEEE CVPR, 2014 基于二值化赋范梯度特征的一般对象估计 摘要: 通过训练通用的对象估计方法来产生一组候选对象窗口,能够加速传

【python】OpenCV—Background Estimation(15)

文章目录 中值滤波中值滤波得到图像背景移动侦测 学习来自 OpenCV基础(14)OpenCV在视频中的简单背景估计 中值滤波 中值滤波是一种非线性平滑技术,主要用于数字信号处理,特别是在图像处理中去除噪声。 一、定义与原理 定义:中值滤波是将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值。 原理:基于排序统计理论,通过把数字图像或数字序列中一点的值

配置 human_pose_estimation_demo 的开发环境

配置 human_pose_estimation 的开发环境 主要讲述如何在 VS2017 IDE 里面配置 OpenIVNO 的演示案例 human_pose_estimation_demo 开发环境。 1. 开发环境说明 系统版本:windows 10OpenVINO 版本:2020 1IDE :VS2017 2. 创建项目 打开 VS017 ,新建项目,在新建项目时选择空项目 然后