[FPN][2017] Feature Pyramid Network

2023-12-23 00:32
文章标签 network 2017 pyramid feature fpn

本文主要是介绍[FPN][2017] Feature Pyramid Network,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、目的

        在消耗少量的computation和memory前提下,使用feature pyramids,在不同scale识别物体

2、结构

        1)bottom-up(backbone)

        - 包含不同的特征stage,尺度以2倍递变

        - 每个stage是一个金字塔level,选取每个stage的最后一层(特征最强)输出的feature map作为reference set。

          例如ResNet的每个stage的输出为 ,对应的stride={4, 8, 16, 32}

        2)top-down 

        - 逐步上采样低分辨率、语义更强的高level特征图,融合进高分辨率的特征图中;

        - 最近邻

        3)lateral connection

        - 将bottom-up的低level、高定位精度(分辨率)的特征融合进top-down(element-wise相加)

        - bottom-up的特征通过conv 1 x 1(无非线性层),尺寸与top-down的相应feature map相同;增加该网络复杂性,结果提升很小

        - 不同level的输出channel数相同(256)

        - merge后的feature map经过conv 3 x 3,以消除上采样的混叠效应

          例如ResNet的每个pyramid level的输出为,对应着

3、不同的pyramid策略

 

        a) 所有level的语义特征都很具有代表性,但inference时间久,无法end-to-end训练,因此只能用于test,导致train和test不一致

        c)不同level的语义特征有较大的gap,高分辨率的feature map包含较多的low-level特征,不利于物体识别

        d)克服a和c的缺点

4、用于检测任务

    1)pyramid不同level共享分类器和回归器(不共享的情况下,accuracy相似)

    2)每个level的anchor是single-scale的,不同level实现multi-scale

        * P_2~P_6的anchor大小分别为。当需要512^2大小的anchor时,需要对P_5进行stride=2的下采样(max pool),引入P_6

    3)anchor分配

        

        k_0是RoI为w x h = 224^2的level,这里设置为4

5、结论

        1)RPN的Average Recall(AR)↑,R-CNN的detection结果↑

        2)复用高分辨率的特征图,有利于小物体的检出

这篇关于[FPN][2017] Feature Pyramid Network的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/526069

相关文章

C++20中的Feature Test Mocros

C++20定义了一组预处理器宏,用于测试各种语言和库的feature。       Feature Test Mocros(特性测试宏)是C++20中引入的一种强大机制,用于应对兼容性问题。Feature Test Mocros作为预处理器指令(preprocessor directives)出现,它使你能够在编译过程中仔细检查特定语言或库功能(particular language

visual studio 2017使用libevent的准备步骤

本人使用的visual studio 2017为community版本,libevent为github上pull下来的最新版本,链接如下:https://github.com/libevent/libevent。 步骤一,编译libevent库 在开始菜单--->所有程序处打开VS 2017的开发人员命令提示符程序,如下图所示 使用cmd命令定位到libevent的目录,输入 nma

BookSim2 安装步骤教程 Network-on-Chips (NoCs) 片上网络模拟器 含视频

BookSim简介 BookSim2 一个用于Network-on-Chips (NoCs) 芯片上网络的周期精确模拟器。该模拟器的设计是为了实现网络组件的模拟灵活性和精确建模。  BookSim1 是一个通用的网络模拟器,并不专门针对片上环境。不支持在片上网络环境中提出的一些更先进的功能和拓扑结构。 背景 随着集成在单个芯片上的核心和模块数量的不断增加,片上网络正成为现代微处理器不可或缺

2017-1-1

console.info('信息'); http://wenku.baidu.com/view/f7d18d8702d276a200292eed.html

【牛客网 2017年校招模拟笔试(第一场)】超级素数幂

超级素数幂 描述 如果一个数字能表示为p^q(^表示幂运算)且p为一个素数,q为大于1的正整数就称这个数叫做超级素数幂。现在给出一个正整数n,如果n是一个超级素数幂需要找出对应的p,q。 输入 输入一个正整数n(2 ≤ n ≤ 10^18) 分析 暴力枚举幂q,将n开q次方之后得到p,检查p是否为素数,并且检查p的q次幂是否等于n。 *要注意精度问题,代码待之后补充。

【牛客网 2017年校招模拟笔试(第一场)】 序列和

求序列和 描述 我们要找连续的一段长度大于等于L小于等于100整数和等于N,容易观察到合法的长度范围很小,于是我们从L开始枚举,然后找到第一个输出即可。 我的代码 最初提交了一次代码,用vector保存了所有满足条件的序列,输出长度最小的,提交之后说内存超出限制,看了一眼题目,发现内存貌似是限制在2w多k?伤心,之前做题没遇到过内存还有这么严格的限制。 修改了一下,其实这个代码并没

论文《Tree Decomposed Graph Neural Network》笔记

【TDGNN】本文提出了一种树分解方法来解决不同层邻域之间的特征平滑问题,增加了网络层配置的灵活性。通过图扩散过程表征了多跳依赖性(multi-hop dependency),构建了TDGNN模型,该模型可以灵活地结合大感受场的信息,并利用多跳依赖性进行信息聚合。 本文发表在2021年CIKM会议上,作者学校:Vanderbilt University,引用量:59。 CIKM会议简介:全称C

Representation Learning on Network 网络表示学习笔记

Embedding Nodes Encoder-decoder ViewEncoding Methods 1 Factorization based2 Random Walk based3 Deep Learning based 网络表示学习(Representation Learning on Network),一般说的就是向量化(Embedding)技术,简单来说,就是

网易2017春招笔试 分饼干

易老师购买了一盒饼干,盒子中一共有k块饼干,但是数字k有些数位变得模糊了,看不清楚数字具体是多少了。易老师需要你帮忙把这k块饼干平分给n个小朋友,易老师保证这盒饼干能平分给n个小朋友。现在你需要计算出k有多少种可能的数值 输入描述: 输入包括两行: 第一行为盒子上的数值k,模糊的数位用X表示,长度小于18(可能有多个模糊的数位) 第二行为小朋友的人数n 输出描述: 输出k可能的数值种数

2017 年建议学习的编程语言、框架和工具

大趋势 渐进式 Web Apps 在 2016 年里,我们见证了 Progressive Web App 概念的蓬勃兴起。它意味着 Web 应用程序可以离线工作,并能提供原生移动应用的体验。它们可以添加到你的智能设备的主屏幕上,甚至可以给你发送推送通知,从而弥补与原生移动应用程序的差距。我们认为,在 2017 年,渐进式 Web Apps 将变得更加重要,也值得我们去探究。在这里查看相关