[FPN][2017] Feature Pyramid Network

2023-12-23 00:32

文章标签 network 2017 pyramid feature fpn

本文主要是介绍[FPN][2017] Feature Pyramid Network，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1、目的

在消耗少量的computation和memory前提下，使用feature pyramids，在不同scale识别物体

2、结构

1）bottom-up（backbone）

- 包含不同的特征stage，尺度以2倍递变

- 每个stage是一个金字塔level，选取每个stage的最后一层（特征最强）输出的feature map作为reference set。

例如ResNet的每个stage的输出为，对应的stride={4, 8, 16, 32}

2）top-down

- 逐步上采样低分辨率、语义更强的高level特征图，融合进高分辨率的特征图中；

- 最近邻

3）lateral connection

- 将bottom-up的低level、高定位精度（分辨率）的特征融合进top-down（element-wise相加）

- bottom-up的特征通过conv 1 x 1（无非线性层），尺寸与top-down的相应feature map相同；增加该网络复杂性，结果提升很小

- 不同level的输出channel数相同（256）

- merge后的feature map经过conv 3 x 3，以消除上采样的混叠效应

例如ResNet的每个pyramid level的输出为，对应着

3、不同的pyramid策略

a) 所有level的语义特征都很具有代表性，但inference时间久，无法end-to-end训练，因此只能用于test，导致train和test不一致

c）不同level的语义特征有较大的gap，高分辨率的feature map包含较多的low-level特征，不利于物体识别

d）克服a和c的缺点

4、用于检测任务

1）pyramid不同level共享分类器和回归器（不共享的情况下，accuracy相似）

2）每个level的anchor是single-scale的，不同level实现multi-scale

* $P_2$ ~ $P_6$ 的anchor大小分别为。当需要 $512^2$ 大小的anchor时，需要对 $P_5$ 进行stride=2的下采样（max pool），引入 $P_6$ 。

3）anchor分配

$k_0$ 是RoI为w x h = $224^2$ 的level，这里设置为4

5、结论

1）RPN的Average Recall（AR）↑，R-CNN的detection结果↑

2）复用高分辨率的特征图，有利于小物体的检出

这篇关于[FPN][2017] Feature Pyramid Network的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/526069。 23002807@qq.com

相关文章

C++20中的Feature Test Mocros

C++20中的Feature Test Mocros

C++20定义了一组预处理器宏，用于测试各种语言和库的feature。 Feature Test Mocros(特性测试宏)是C++20中引入的一种强大机制，用于应对兼容性问题。Feature Test Mocros作为预处理器指令(preprocessor directives)出现，它使你能够在编译过程中仔细检查特定语言或库功能(particular language

阅读更多...

visual studio 2017使用libevent的准备步骤

visual studio 2017使用libevent的准备步骤

本人使用的visual studio 2017为community版本，libevent为github上pull下来的最新版本，链接如下：https://github.com/libevent/libevent。步骤一，编译libevent库在开始菜单--->所有程序处打开VS 2017的开发人员命令提示符程序，如下图所示使用cmd命令定位到libevent的目录，输入 nma

阅读更多...

BookSim2 安装步骤教程 Network-on-Chips (NoCs) 片上网络模拟器含视频

BookSim2 安装步骤教程 Network-on-Chips (NoCs) 片上网络模拟器含视频

BookSim简介 BookSim2 一个用于Network-on-Chips (NoCs) 芯片上网络的周期精确模拟器。该模拟器的设计是为了实现网络组件的模拟灵活性和精确建模。 BookSim1 是一个通用的网络模拟器，并不专门针对片上环境。不支持在片上网络环境中提出的一些更先进的功能和拓扑结构。背景随着集成在单个芯片上的核心和模块数量的不断增加，片上网络正成为现代微处理器不可或缺

阅读更多...

2017-1-1

2017-1-1

console.info('信息'); http://wenku.baidu.com/view/f7d18d8702d276a200292eed.html

阅读更多...

【牛客网 2017年校招模拟笔试(第一场)】超级素数幂

【牛客网 2017年校招模拟笔试(第一场)】超级素数幂

超级素数幂描述如果一个数字能表示为p^q(^表示幂运算)且p为一个素数,q为大于1的正整数就称这个数叫做超级素数幂。现在给出一个正整数n,如果n是一个超级素数幂需要找出对应的p,q。输入输入一个正整数n(2 ≤ n ≤ 10^18) 分析暴力枚举幂q，将n开q次方之后得到p，检查p是否为素数，并且检查p的q次幂是否等于n。 *要注意精度问题，代码待之后补充。

阅读更多...

【牛客网 2017年校招模拟笔试(第一场)】序列和

【牛客网 2017年校招模拟笔试(第一场)】序列和

求序列和描述我们要找连续的一段长度大于等于L小于等于100整数和等于N,容易观察到合法的长度范围很小,于是我们从L开始枚举,然后找到第一个输出即可。我的代码最初提交了一次代码，用vector保存了所有满足条件的序列，输出长度最小的，提交之后说内存超出限制，看了一眼题目，发现内存貌似是限制在2w多k？伤心，之前做题没遇到过内存还有这么严格的限制。修改了一下，其实这个代码并没

阅读更多...

论文《Tree Decomposed Graph Neural Network》笔记

论文《Tree Decomposed Graph Neural Network》笔记

【TDGNN】本文提出了一种树分解方法来解决不同层邻域之间的特征平滑问题，增加了网络层配置的灵活性。通过图扩散过程表征了多跳依赖性（multi-hop dependency），构建了TDGNN模型，该模型可以灵活地结合大感受场的信息，并利用多跳依赖性进行信息聚合。本文发表在2021年CIKM会议上，作者学校：Vanderbilt University，引用量：59。 CIKM会议简介：全称C

阅读更多...

Representation Learning on Network 网络表示学习笔记

Representation Learning on Network 网络表示学习笔记

Embedding Nodes Encoder-decoder ViewEncoding Methods 1 Factorization based2 Random Walk based3 Deep Learning based 网络表示学习（Representation Learning on Network），一般说的就是向量化（Embedding）技术，简单来说，就是

阅读更多...

网易2017春招笔试分饼干

网易2017春招笔试分饼干

易老师购买了一盒饼干，盒子中一共有k块饼干，但是数字k有些数位变得模糊了，看不清楚数字具体是多少了。易老师需要你帮忙把这k块饼干平分给n个小朋友，易老师保证这盒饼干能平分给n个小朋友。现在你需要计算出k有多少种可能的数值输入描述: 输入包括两行：第一行为盒子上的数值k，模糊的数位用X表示，长度小于18(可能有多个模糊的数位) 第二行为小朋友的人数n 输出描述: 输出k可能的数值种数

阅读更多...

2017 年建议学习的编程语言、框架和工具

2017 年建议学习的编程语言、框架和工具

大趋势渐进式 Web Apps 在 2016 年里，我们见证了 Progressive Web App 概念的蓬勃兴起。它意味着 Web 应用程序可以离线工作，并能提供原生移动应用的体验。它们可以添加到你的智能设备的主屏幕上，甚至可以给你发送推送通知，从而弥补与原生移动应用程序的差距。我们认为，在 2017 年，渐进式 Web Apps 将变得更加重要，也值得我们去探究。在这里查看相关

阅读更多...