本文主要是介绍YOLOv9|加入2023Gold YOLO中的GD机制!遥遥领先!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
专栏介绍:YOLOv9改进系列 | 包含深度学习最新创新,助力高效涨点!!!
一、Gold YOLO摘要
在过去的几年里,YOLO系列模型已经成为实时目标检测领域的领先方法。许多研究通过修改体系结构、增加数据和设计新的损失,将基线提高到了更高的水平。然而,我们发现以前的模型仍然存在信息融合问题,尽管特征金字塔网络(FPN)和路径聚合网络(PANet)已经缓解了这一问题。因此,本研究提供了一种先进的聚集和分布机制(GD)机制,该机制通过卷积和自注意操作来实现。这个新设计的模型名为Gold YOLO,它增强了多尺度特征融合能力,并在所有模型尺度上实现了延迟和准确性之间的理想平衡。
二、Gold YOLO模块详解
2.1 模块简介
Gold yolo的主要思想: 使用GD(gather-and-distribute)机制代替现有的通过不停间接迭代融合不同level的信息的机制。
GD由3种模块组成:FAM(Feature Alignment Module,特征对齐模块)、IFM(Information Fusion Module,信息融合模块)、Inject(Information Injection Module,信息注入模块)。其中FAM与IFM用于特征收集,Inject用于分发。
low-GD主要用于融合模型浅层的特征信息,取代原Neck中的FPN结构,输入为B2,B3,B4,B5的特征张量。输入的特征张量首先通过Low-FAM进行空间尺度对齐并拼接在一起,之后送入IFM模块。分别经过Conv、RepVGGBlock、Conv进行特征提取融合,最后Split,送入Inject模块。
high-GD主要用于融合模型深层的特征信息,取代原Neck中的FPN结构,输入为P3,P4,P5的特征张量。输入的特征张量首先通过High-FAM进行空间尺度对齐并拼接在一起,之后送入IFM模块。分别经过多头注意力机制和前向网络进行特征提取融合,最后Split,送入Inject模块。
Inject模块输入有两个,一个是x_local,一个是x_global,也就是GD中处理完的特征张量。通过图中的Conv与空间的缩放操作与x_local进行特征融合,融合方式主要为点积和相加。
三、 GD模块使用教程
3.1 GD模块的代码
3.2 在YOLO v9中的添加教程
3.3 运行配置文件
这部分文章暂不开源!
⭐现在入手仅$ 59.9,早入早发论文!⭐
联系QQ: 2668825911 ,欢迎交流!
本项目持续更新,不付费订阅也可关注等每周更新,每周开源1-2篇。
这篇关于YOLOv9|加入2023Gold YOLO中的GD机制!遥遥领先!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!