Revisiting RCNN: On Awakening the Classification Power of Faster RCNN

2023-12-23 00:33

本文主要是介绍Revisiting RCNN: On Awakening the Classification Power of Faster RCNN,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、hard FP

    1)极少量的高置信度FP是mAP明显下降的主要原因

    2)hard FP主要有三种:

        - 框只覆盖部分目标(IoU小):只覆盖了有辨别力的part

        - 相似类之间的区分错误:不同类之间share有辨别力的part;分类器不够强大

        - 背景错分为目标:背景pattern与目标相似;感受野过大,包含了相邻的目标物体

        * 均由suboptimal分类器导致

2、Faster R-CNN的弊端

    1)分类和定位的目标不同,因此共享的特征对两个任务来说并不是最优的

        * 分类需要translation invariant特征;定位需要translation covariant特征

    2)多任务学习有相互促进的作用,但multi-task loss的最优,对于子任务的loss来说并不是最优的

        * MTL适用于backbone较弱的情况,当backbone足够强大时,multi-task无法发掘backbone的潜力

    3)proposal的不同目标共享相同的感受野,对于小目标是冗余的,对大目标来说不够(但是不同大小的anchor在roi pooling之后对应的feature map范围不同,所以这一点不能理解

        * 尽管一些网络采用了multi-scale策略,但multi得远远不够

    4)sub-sampling操作可能会引入严重的unalignment,例如一个像素的偏移,下采样32倍后,会导致32个像素的偏移

4、Decoupled Classification Refinement (DCR)网络

    1)Faster R-CNN输出检测结果,作为region proposal,每个proposal的置信度为score_frcnn

    2)根据proposal,在原图上crop-resize相应区域到固定size(相当于把ROI Pooling放到了原图上,但ROI Pooling的感受野明显更大)

    3)用hard FP训练类似于R-CNN结构的强分类器,每个proposal的置信度为score_dcr

    4)test时,score = score_frcnn * score_dcr,只用score_dcr结果很差,因为rcnn无定位功能,是强分类器,倾向于crop中出现部分目标就预测为正

    * DCR和Faster R-CNN不共享参数

这篇关于Revisiting RCNN: On Awakening the Classification Power of Faster RCNN的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/526073

相关文章

Spark MLlib模型训练—聚类算法 PIC(Power Iteration Clustering)

Spark MLlib模型训练—聚类算法 PIC(Power Iteration Clustering) Power Iteration Clustering (PIC) 是一种基于图的聚类算法,用于在大规模数据集上进行高效的社区检测。PIC 算法的核心思想是通过迭代图的幂运算来发现数据中的潜在簇。该算法适用于处理大规模图数据,特别是在社交网络分析、推荐系统和生物信息学等领域具有广泛应用。Spa

Keysight U8031A DC power supply

Keysight U8031A DC power supply 文章目录 Keysight U8031A DC power supply前言电容充电⽰意图一、恒定电压操作二、恒定电流操作三、5v操作四、跟踪模式操作五、存储器操作六、对过电压保护编程七、对过电流保护编程八、锁键操作 前言 U8031A Power Supply 是一款具备前面板编程能力的三路输出电源。通过使

PrimeTime low power-SMVA分析(4)

1.6使用示例 以下使用示例展示了SMVA流程: - 所有电压条件下的SMVA分析 - 特定DVFS约束下的SMVA分析 在以下脚本示例中,红色突出显示的文本显示了在SMVA流程中使用的命令、命令选项和变量。这些功能只有在将timing_enable_cross_voltage_domain_analysis变量设置为true时才能使用。 1.6.1所有电压条件下的SMVA分析 要对多

Convolutional Neural Networks for Sentence Classification论文解读

基本信息 作者Yoon Kimdoi发表时间2014期刊EMNLP网址https://doi.org/10.48550/arXiv.1408.5882 研究背景 1. What’s known 既往研究已证实 CV领域著名的CNN。 2. What’s new 创新点 将CNN应用于NLP,打破了传统NLP任务主要依赖循环神经网络(RNN)及其变体的局面。 用预训练的词向量(如word2v

PrimeTime low power-SMVA分析(2)

1.4 DVFS 场景 对于使用动态电压和频率缩放(DVFS)的设计,可以使用 DVFS 场景来同时分析设计在所有 DVFS 条件下的性能。有关详细信息,请参见以下主题: - DVFS 场景概念 - 查询 DVFS 场景 - 将 DVFS 场景应用于命令和属性 - 与 DVFS 相关的对象属性 注意: DVFS 场景是在 SMVA 分析中使用的电压/频率场景。它们与分布式多场

【Power Compiler手册】9.时钟门控(4修改时钟门控结构)

修改时钟门控结构 在执行 RTL 时钟门控时,可以指定 `set_clock_gating_style -max_fanout` 命令来限制由单个时钟门控元素门控的寄存器数量。结果可能是具有相同使能信号的多个时钟门控元素,并且在逻辑上,具有相同的门控时钟信号。所有具有相同使能信号的时钟门控单元属于同一个时钟门控组。由单个时钟门控元素门控的所有寄存器属于同一个时钟门控子组。 由 `compi

幂等运算power

分治思想   public static double power(double base, int exponent) {if ((equalToZero(base)) && (exponent <= 0)) {throw new IllegalArgumentException();}int positiveExponent = (exponent > 0 ? exponent : -ex

Fast Power

Calculate the an % b where a, b and n are all 32bit non-negative integers. Example For 231 % 3 = 2 For 1001000 % 1000 = 0 Challenge O(logn) 思想:recursion算一半,然后base case,处理算完一半以后的情况; 公式就是 (a*b) %

POJ训练计划1459_Power Network(网络流最大流/Dinic)

解题报告 这题建模实在是好建,,,好贱,,, 给前向星给跪了,纯dinic的前向星竟然TLE,sad,,,回头看看优化,,, 矩阵跑过了,2A,sad,,, /*************************************************************************> File Name: PowerN.cpp> Author: _nplus>

2157. 优秀的拆分(power)

代码 #include<bits/stdc++.h>using namespace std;int a[10001];int main(){int n,t=1,k=0;bool flag=false;cin>>n;if(n%2==1) {cout<<-1;return 0;}while(n>0){if(n%2==1){k++;a[k]=t; }n=n/2;t=t*2;}if(k