Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(RCNN)

本文主要是介绍Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(RCNN),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(RCNN)

文章目录

        • Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(RCNN)
          • 总揽
          • Object detection with RCNN
            • model design
            • test-time detection
            • training
          • 实验数据
          • 附录A:Object proposal transformations
          • 附录B:Positive vs. negative examples and softmax
          • 附录C:Bounding-box regression

总揽
  • image-20210610231510096
  • 由上图可以看到,RCNN分为三个部分
    • 1、提取候选区域(region proposals),它采取的方式是Selective Search,选取大约2k个
    • 2、对候选区域进行直接resize,使之符合CNN网络的输入要求,然后,进入特征提取
    • 3、在分类阶段使用SVM分类器进行分类
Object detection with RCNN
model design
  • Region proposals
    • Selective Search
  • Feature Extraction
    • resize成227x227的RGB image(三通道),无视候选区的尺寸、比例(附录A对此有讨论)
    • 此外,在resize之前,还对候选区域进行拼接(扩张)
      • 在这里插入图片描述
test-time detection
  • 在测试阶段,仍然是上述流程,另外,作者特地强调了下RCNN的高效(就当时而言),主要有以下两点
    • CNN参数全局共享
    • 特征向量的计算是低维的(计算量小)
  • 最后输出的特征向量矩阵是2000x4096,SVM则是4096xN,其中N表示类别数目
training
  • 先把CNN扔到大号数据集里面训练(监督预训练,指ILSVRC2012)
  • 然后再在VOC中做主要特征微调
  • 然后使用SVM对每个区域的每类进行判断(分类)(附录B对此有讨论)
实验数据
  • 在VOC2010上的结果

    • RCNN BB是用了BB regression(框回归)的版本,可以看到mAP提了3个点
  • 而在ILSVR2013上,大体趋势依然不变

  • 然后对fine-tuning效果的测试(1-3):(4-6),7是6+用了BB regression的效果,顺手验证了BB regression的效果

    • image-20210611001515518
  • 不同backbone(CNN部分)的效果

    • image-20210611001744653
附录A:Object proposal transformations
  • 提供了两种方法:
    • 1、短边+padding然后再resize,这样可以解决ratio不协调问题
    • 2、暴力resize,也就是文中采用的方式(图简单?)
附录B:Positive vs. negative examples and softmax
  • 首先给出定义
    • 对于GT:positive if IOU>0.5 else background
    • 对于SVM:
      • if IOU>0.5 =>positive
      • if IOU<0.3 =>negetive
      • else 忽略
  • 由于正负样本的不平衡,作者引入many “jittered” examples,使得positive扩大30倍
附录C:Bounding-box regression
  • Bounding-box regression

这篇关于Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(RCNN)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/777342

相关文章

【Python报错已解决】AttributeError: ‘list‘ object has no attribute ‘text‘

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 前言一、问题描述1.1 报错示例1.2 报错分析1.3 解决思路 二、解决方法2.1 方法一:检查属性名2.2 步骤二:访问列表元素的属性 三、其他解决方法四、总结 前言 在Python编程中,属性错误(At

时间序列|change point detection

change point detection 被称为变点检测,其基本定义是在一个序列或过程中,当某个统计特性(分布类型、分布参数)在某时间点受系统性因素而非偶然因素影响发生变化,我们就称该时间点为变点。变点识别即利用统计量或统计方法或机器学习方法将该变点位置估计出来。 Change Point Detection的类型 online 指连续观察某一随机过程,监测到变点时停止检验,不运用到

error while loading shared libraries: libnuma.so.1: cannot open shared object file:

腾讯云CentOS,安装Mysql时: 1.yum remove libnuma.so.1 2.yum install numactl.x86_64

java基础总结12-面向对象8(Object类)

1 Object类介绍 Object类在JAVA里面是一个比较特殊的类,JAVA只支持单继承,子类只能从一个父类来继承,如果父类又是从另外一个父类继承过来,那他也只能有一个父类,父类再有父类,那也只能有一个,JAVA为了组织这个类组织得比较方便,它提供了一个最根上的类,相当于所有的类都是从这个类继承,这个类就叫Object。所以Object类是所有JAVA类的根基类,是所有JAVA类的老祖宗

MACS bdgdiff: Differential peak detection based on paired four bedGraph files.

参考原文地址:[http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html](http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html) 文章目录 一、MACS bdgdiff 简介DESCRIPTION 二、用法

王立平--Object-c

object-c通常写作objective-c或者obj-c,是根据C语言所衍生出来的语言,继承了C语言的特性,是扩充C的面向对象编程语言。它主要使用于MacOSX和GNUstep这两个使用OpenStep标准的系统,而在NeXTSTEP和OpenStep中它更是基本语言。Objective-C可以在gcc运作的系统写和编译,因为gcc含Objective-C的编译器。在MA

【机器学习 sklearn】特征筛选feature_selection

特征筛选更加侧重于寻找那些对模型的性能提升较大的少量特征。 继续沿用Titannic数据集,这次试图通过特征刷选来寻找最佳的特征组合,并且达到提高预测准确性的目标。 #coding:utf-8from __future__ import divisionimport sysreload(sys)sys.setdefaultencoding('utf-8')import timest

Learning Memory-guided Normality for Anomaly Detection——学习记忆引导的常态异常检测

又是一篇在自编码器框架中研究使用记忆模块的论文,可以看做19年的iccv的论文的衍生,在我的博客中对19年iccv这篇论文也做了简单介绍。韩国人写的,应该是吧,这名字听起来就像。 摘要abstract 我们解决异常检测的问题,即检测视频序列中的异常事件。基于卷积神经网络的异常检测方法通常利用代理任务(如重建输入视频帧)来学习描述正常情况的模型,而在训练时看不到异常样本,并在测试时使用重建误

REMEMBERING HISTORY WITH CONVOLUTIONAL LSTM FOR ANOMALY DETECTION——利用卷积LSTM记忆历史进行异常检测

上海科技大学的文章,上海科技大学有个组一直在做这方面的工作,好文章挺多的还有数据集。 ABSTRACT 本文解决了视频中的异常检测问题,由于异常是无界的,所以异常检测是一项极具挑战性的任务。我们通过利用卷积神经网络(CNN或ConvNet)对每一帧进行外观编码,并利用卷积长期记忆(ConvLSTM)来记忆与运动信息相对应的所有过去的帧来完成这项任务。然后将ConvNet和ConvLSTM与

COD论文笔记 ECCV2024 Just a Hint: Point-Supervised Camouflaged Object Detection

这篇论文的主要动机、现有方法的不足、拟解决的问题、主要贡献和创新点: 1. 动机 伪装物体检测(Camouflaged Object Detection, COD)旨在检测隐藏在环境中的伪装物体,这是一个具有挑战性的任务。由于伪装物体与背景的细微差别和模糊的边界,手动标注像素级的物体非常耗时,例如每张图片可能需要 60 分钟来标注。因此,作者希望通过减少标注负担,提出了一种仅依赖“点标注”的弱