CV之DL之PanopticFPN:FPN/Panoptic FPN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

本文主要是介绍CV之DL之PanopticFPN:FPN/Panoptic FPN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

CV之DL之PanopticFPN:FPN/Panoptic FPN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

目录

相关论文

FPN:《Feature Pyramid Networks for Object Detection》翻译与解读

Abstract

Panoptic FPN:《Panoptic Feature Pyramid Networks》翻译与解读

Abstract

FPN算法的简介

1、算法改进

PanopticFPN算法的简介

1、实验结果

(1)、使用一个单一的ResNet-101-FPN网络,在COCO(顶部)和Cityscapes(底部)上生成Panoptic FPN结果

(2)、Cityscapes Semantic FPN

(3)、Multi-Task Training

(4)、Panoptic Segmentation

2、不同架构比较

DL之PanopticFPN:Panoptic FPN算法的架构详解(特征金字塔网络/联合训练/提高特征分辨率的骨干架构)之详细攻略

PanopticFPN算法的案例应用


相关文章
DL之PanopticFPN:Panoptic FPN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之PanopticFPN:Panoptic FPN算法的架构详解

相关论文

FPN:《Feature Pyramid Networks for Object Detection》翻译与解读

地址

论文地址:https://arxiv.org/abs/1612.03144

时间

2016年12月9日

作者

Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

总结

这篇文章主要探讨了如何利用卷积神经网络在计算机视觉任务中的多尺度特征表示能力

主要问题和痛点:

>> 传统图像金字塔法生成多尺度特征图需要分别在每个尺度上计算特征,计算效率低下

>> 尽管深度卷积神经网络可以很好地应对尺度变化,但单尺度特征依然无法很好解决多尺度目标检测任务。

>> 卷积神经网络的多层特征图天然具有金字塔结构,但不同层之间的语义差异大,直接利用难以达到很好效果。

文章提出的Feature Pyramid Network(FPN)解决方案包括:

>> 利用卷积神经网络底向计算得到的多层特征作为基础

>> 建立顶向传播结构,通过上采样和通道匹配结合底向特征,生成语义更强的高分辨率特征图作为fpn各级特征。

>> 在各个FPN级别上独立预测,实现与传统图像金字塔类似的多尺度预测能力。

>> 将FPN应用在RPN和Fast RCNN框架中进行目标检测和实例分割任务,实验结果表明与单尺度和其他对比方法有明显提升。

>> FPN不增加测试时间复杂度,能在多尺度任务上取得当前最优效果,适用于实际应用场景。

总之,FPN通过建立卷积神经网络内部的多尺度特征金字塔结构,很好地结合了强语义低分辨率特征和弱语义高分辨率特征,实现了效率和准确率兼优的多尺度目标检测能力。

Abstract

Feature pyramids are a basic component in recognition systems for detecting objects at different scales. But recent deep learning object detectors have avoided pyramid representations, in part because they are compute and memory intensive. In this paper, we exploit the inherent multi-scale, pyramidal hierarchy of deep convolutional networks to construct feature pyramids with marginal extra cost. A top-down architecture with lateral connections is developed for building high-level semantic feature maps at all scales. This architecture, called a Feature Pyramid Network (FPN), shows significant improvement as a generic feature extractor in several applications. Using FPN in a basic Faster R-CNN system, our method achieves state-of-the-art single-model results on the COCO detection benchmark without bells and whistles, surpassing all existing single-model entries including those from the COCO 2016 challenge winners. In addition, our method can run at 5 FPS on a GPU and thus is a practical and accurate solution to multi-scale object detection. Code will be made publicly available.

特征金字塔是识别系统中用于检测不同尺度对象的基本组件。但是,最近的深度学习目标检测器避免使用金字塔表示,部分原因是其计算和内存密集型。在本文中,我们利用深度卷积网络固有的多尺度金字塔层次结构,以极小的额外成本构建特征金字塔。我们采用了一种自上而下的架构,配合横向连接,用于在所有尺度上构建高级语义特征图。这种架构被称为特征金字塔网络(FPN),在多个应用中作为通用特征提取器显示出显著的改进。在基本的Faster R-CNN系统中使用FPN,我们的方法在COCO检测基准上实现了单模型的最新结果,无需任何花哨的技巧,超越了所有现有的单模型条目,包括COCO 2016挑战的获奖者。此外,我们的方法可以在GPU上以5FPS的速度运行,因此是多尺度目标检测的实际而准确的解决方案。代码将会公开提供。

Panoptic FPN:《Panoptic Feature Pyramid Networks》翻译与解读

地址

论文地址:https://arxiv.org/abs/1901.02446

时间

2019年1月8日

作者

Alexander Kirillov, Ross Girshick, Kaiming He, Piotr Dollár

总结

本文提出了一种全面分割方法Panoptic FPN。

传统的实例分割与语义分割方法分别使用不同的网络,没有共享计算资源。这篇论文的目的是将这两种任务在结构上统一,设计一个网络同时解决实例分割语义分割任务。

作者基于Mask R-CNN这个流行的实例分割框架,在其FPN(Feature Pyramid Networks)骨干上添加了一个语义分割分支。实验证明这个简单的Baseline不仅在实例分割任务上效果还行,而且可以作为语义分割任务的轻量级且高效的方法。

论文通过详细实验研究了这个扩展版本——Panoptic FPN,证明它在两个任务上的表现都很稳定和准确,可以作为这两个联合任务的一个强基线。

考虑到它的效果和概念简单性,作者希望这个方法可以为未来的全面分割研究提供一个强基准。

也就是说,本文的痛点在于实例分割与语义分割任务长期分离,没有资源共享。作者在Mask R-CNN实例分割框架的基础上,加入了一个语义分割分支,实现了两个任务的联合网络,解决了原始方法的分离问题。

Abstract

The recently introduced panoptic segmentation task has renewed our community's interest in unifying the tasks of instance segmentation (for thing classes) and semantic segmentation (for stuff classes). However, current state-of-the-art methods for this joint task use separate and dissimilar networks for instance and semantic segmentation, without performing any shared computation. In this work, we aim to unify these methods at the architectural level, designing a single network for both tasks. Our approach is to endow Mask R-CNN, a popular instance segmentation method, with a semantic segmentation branch using a shared Feature Pyramid Network (FPN) backbone. Surprisingly, this simple baseline not only remains effective for instance segmentation, but also yields a lightweight, top-performing method for semantic segmentation. In this work, we perform a detailed study of this minimally extended version of Mask R-CNN with FPN, which we refer to as Panoptic FPN, and show it is a robust and accurate baseline for both tasks. Given its effectiveness and conceptual simplicity, we hope our method can serve as a strong baseline and aid future research in panoptic segmentation.

ChatGPT

最近引入的全景分割任务重新引起了我们社区对统一实例分割(针对物体类别)和语义分割(针对背景类别)任务的兴趣。然而,目前针对这一联合任务的最先进方法使用单独且不同的网络进行实例和语义分割,没有执行任何共享计算。在这项工作中,我们旨在在架构层面统一这些方法,设计一个单一网络来完成这两个任务。我们的方法是在Mask R-CNN,一种流行的实例分割方法上,通过使用共享的特征金字塔网络(FPN)骨干来增加一个语义分割分支。令人惊讶的是,这种简单的基准不仅对于实例分割仍然有效,而且还产生了一种轻量级、表现卓越的语义分割方法。在这项工作中,我们对这个最小程度扩展的Mask R-CNN与FPN版本进行了详细研究,我们将其称为全景FPN,并展示它是两个任务的稳健而准确的基准。鉴于其有效性和概念上的简单性,我们希望我们的方法能够成为一个强大的基准,并在全景分割的未来研究中发挥作用。

FPN算法的简介

       Tsung-Yi Lin、Piotr Dollar, Ross Girshick, Kaiming He在Facebook提出了Feature Pyramid Networks(FPN)检测算法,该算法改进自Faster RCNN。FPN利用了特征金字塔网络,融合了低层特征的高分辨率和高层特征的高语义信息,以提升目标检测的效果。在FPN中,通过生成特征图的金字塔,使用Region Proposal Network (RPN)生成ROI,然后根据ROI的大小选择合适尺寸的特征图层提取特征块。这种结构充分利用了不同尺度下的特征信息,有助于更准确地检测目标。FPN的提出对目标检测领域产生了积极影响。

目标检测算法通常使用网络的顶层特征进行检测,因为顶层特征具有丰富的语义信息。FPN采用自下而上和自上而下的路径构建特征金字塔。自下而上路径利用卷积网络进行特征提取,形成分辨率逐层下降的金字塔结构。自上而下路径从语义丰富的层构建高分辨率的层,但由于上采样和下采样可能导致目标位置不准确,因此引入横向连接以提高位置检测的准确性。

FPN的主要优势在于对小目标和尺度分布较大的目标具有天然的检测优势。整体来说,FPN通过构建金字塔形状的特征图,从不同深度引出多个检测端口,提高了目标检测的性能。

FPN的结构包括自下而上的特征提取路径和自上而下的高分辨率层构建路径。横向连接用于在重建层和特征图之间传递信息,以增强位置检测的准确性。

总体来说,FPN在目标检测中的应用使得算法能够有效地检测不同尺度和大小的目标,克服了传统算法在这方面的不足。

1、算法改进

特征层上单独进行: 在FPN中,预测是在每个融合后的特征层上独立进行的,与传统的特征融合方式有所不同。这种方法使得每个特征层都可以专注于不同尺度和语义的目标,提高了目标检测的性能。

FPN结构的灵活性: FPN结构具有相当的灵活性,可以与各种特征提取网络结合,作为检测算法的基础网络。当前大多数state-of-the-art的模型都采用FPN结构。以RetinaNet为例,它在FPN的基础上使用了ResNet网络提取特征,并引入Focal Loss损失,以解决单步目标检测算法中前景类和背景类损失不均衡的问题。这些基于FPN结构的检测算法通过增加网络深度,获取更丰富的语义信息,并在浅层特征图中获取高分辨率的图像特征,展现出在实际应用中卓越性能。

PanopticFPN算法的简介

1、实验结果

(1)、使用一个单一的ResNet-101-FPN网络,在COCO(顶部)和Cityscapes(底部)上生成Panoptic FPN结果

(2)、Cityscapes Semantic FPN

(3)、Multi-Task Training

(4)、Panoptic Segmentation

Panoptic R50-FPN vs. R50-FPN×2
使用单个FPN网络同时解决这两个任务,与两个独立FPN网络分别产生实例分割和语义分割相当的精度,但计算量只有一半。

2、不同架构比较

DL之PanopticFPN:Panoptic FPN算法的架构详解(特征金字塔网络/联合训练/提高特征分辨率的骨干架构)之详细攻略

https://yunyaniu.blog.csdn.net/article/details/100060193

PanopticFPN算法的案例应用

更新……

这篇关于CV之DL之PanopticFPN:FPN/Panoptic FPN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/759500

相关文章

轻量级在线服装3D定制引擎Myway简介

我写的面向web元宇宙轻量级系列引擎中的另外一个,在线3D定制引擎Myway 3D。 用于在线商品定制,比如个性化服装的定制、日常用品(如杯子)、家装(被套)等物品的在线定制。 特性列表: 可更换衣服款式,按需定制更换模型可实时更改材质颜色可实时添加文本,并可实时修改大小、颜色和角度,支持自定义字体可实时添加艺术图标,并可实时修改大小、颜色和角度,支持翻转、各种对齐可更改衣服图案,按需求定制

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

VMware9.0详细安装

双击VMware-workstation-full-9.0.0-812388.exe文件: 直接点Next; 这里,我选择了Typical(标准安装)。 因为服务器上只要C盘,所以我选择安装在C盘下的vmware文件夹下面,然后点击Next; 这里我把√取消了,每次启动不检查更新。然后Next; 点击Next; 创建快捷方式等,点击Next; 继续Cont

20.Spring5注解介绍

1.配置组件 Configure Components 注解名称说明@Configuration把一个类作为一个loC容 器 ,它的某个方法头上如果注册7@Bean , 就会作为这个Spring容器中的Bean@ComponentScan在配置类上添加@ComponentScan注解。该注解默认会扫描该类所在的包下所有的配置类,相当于之前的 <context:component-scan>@Sc

十四、观察者模式与访问者模式详解

21.观察者模式 21.1.课程目标 1、 掌握观察者模式和访问者模式的应用场景。 2、 掌握观察者模式在具体业务场景中的应用。 3、 了解访问者模式的双分派。 4、 观察者模式和访问者模式的优、缺点。 21.2.内容定位 1、 有 Swing开发经验的人群更容易理解观察者模式。 2、 访问者模式被称为最复杂的设计模式。 21.3.观察者模式 观 察 者 模 式 ( Obser

【操作系统】信号Signal超详解|捕捉函数

🔥博客主页: 我要成为C++领域大神🎥系列专栏:【C++核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞👍收藏⭐评论✍️ 本博客致力于知识分享,与更多的人进行学习交流 ​ 如何触发信号 信号是Linux下的经典技术,一般操作系统利用信号杀死违规进程,典型进程干预手段,信号除了杀死进程外也可以挂起进程 kill -l 查看系统支持的信号

通信系统网络架构_2.广域网网络架构

1.概述          通俗来讲,广域网是将分布于相比局域网络更广区域的计算机设备联接起来的网络。广域网由通信子网于资源子网组成。通信子网可以利用公用分组交换网、卫星通信网和无线分组交换网构建,将分布在不同地区的局域网或计算机系统互连起来,实现资源子网的共享。 2.网络组成          广域网属于多级网络,通常由骨干网、分布网、接入网组成。在网络规模较小时,可仅由骨干网和接入网组成

(超详细)YOLOV7改进-Soft-NMS(支持多种IoU变种选择)

1.在until/general.py文件最后加上下面代码 2.在general.py里面找到这代码,修改这两个地方 3.之后直接运行即可

亮相WOT全球技术创新大会,揭秘火山引擎边缘容器技术在泛CDN场景的应用与实践

2024年6月21日-22日,51CTO“WOT全球技术创新大会2024”在北京举办。火山引擎边缘计算架构师李志明受邀参与,以“边缘容器技术在泛CDN场景的应用和实践”为主题,与多位行业资深专家,共同探讨泛CDN行业技术架构以及云原生与边缘计算的发展和展望。 火山引擎边缘计算架构师李志明表示:为更好地解决传统泛CDN类业务运行中的问题,火山引擎边缘容器团队参考行业做法,结合实践经验,打造火山

Jitter Injection详解

一、定义与作用 Jitter Injection,即抖动注入,是一种在通信系统中人为地添加抖动的技术。该技术通过在发送端对数据包进行延迟和抖动调整,以实现对整个通信系统的时延和抖动的控制。其主要作用包括: 改善传输质量:通过调整数据包的时延和抖动,可以有效地降低误码率,提高数据传输的可靠性。均衡网络负载:通过对不同的数据流进行不同程度的抖动注入,可以实现网络资源的合理分配,提高整体传输效率。增