【YOLOv5改进系列(8)】高效涨点----添加yolov7中Aux head 辅助训练头

2024-03-30 01:28

本文主要是介绍【YOLOv5改进系列(8)】高效涨点----添加yolov7中Aux head 辅助训练头,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述


文章目录

  • 🚀🚀🚀前言
  • 一、1️⃣ Auxiliary head辅助头简单介绍
  • 二、2️⃣从损失函数和标签分配分析
  • 三、3️⃣正负样本标签分配
  • 四、4️⃣如何添加Aux head辅助训练头
  • 五、5️⃣实验部分(后续添加,还是跑模型,辅助头真是太慢了!!!)


在这里插入图片描述

👀🎉📜系列文章目录

【YOLOv5改进系列(1)】高效涨点----使用EIoU、Alpha-IoU、SIoU、Focal-EIOU替换CIou
【YOLOv5改进系列(2)】高效涨点----Wise-IoU详细解读及使用Wise-IoU(WIOU)替换CIOU
【YOLOv5改进系列(3)】高效涨点----Optimal Transport Assignment:OTA最优传输方法
【YOLOv5改进系列(4)】高效涨点----添加可变形卷积DCNv2
【YOLOv5改进系列(5)】高效涨点----添加密集小目标检测NWD方法
【YOLOv5改进系列(6)】高效涨点----使用DAMO-YOLO中的Efficient RepGFPN模块替换yolov5中的Neck部分
【YOLOv5改进系列(7)】高效涨点----使用yolov8中的C2F模块替换yolov5中的C3模块

🚀🚀🚀前言

auxiliary head辅助训练头是出至yolov7论文,这两天都在研究如何能够将v8和v7的一些模块添加到yolov5中,添加 Aux head 的主要原因是让网络中间层学到更多信息,有更丰富的梯度信息帮助训练。这里要注意,好的梯度信息能够让相同参数量的网络学的更好。这里的yolov5除了添加了辅助训练头,而且还进行了改进,将之前的OTA最优传输也添加进来,用于优化标签分配策略,添加之后我感觉训练损失慢了5倍不止,但是收敛效果和识别精度要提高了不少。

📜yolov7论文:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
📌论文代码:https://github.com/WongKinYiu/yolov7


一、1️⃣ Auxiliary head辅助头简单介绍

左边是正常训练,在经过上采样和下采样以及特征融合之后,将输出特征进行分类和识别,而Auxiliary head则是在特征输出之前在中间添加一部分辅助头。
在这里插入图片描述


二、2️⃣从损失函数和标签分配分析

深度监督
意思是在模型训练的过程中,除了最终的检测头,在中间的层也增加了辅助检测头,这个辅助检测头也会加入到损失函数的计算中,并且辅助反向传播,去更新前面的参数。

标签分类
标签分配指的是把输入图片中的标注框和最终预测的预测值对应起来,便于进一步求损失值。

标检测的损失往往由三个部分组成:分类损失Lcls,置信度损失Lobj与边界框的iou损失Lbox。Lcls与Lbox仅由正样本产生,而Lobj则由所有样本产生。

不同于DETR这种端到端的目标检测算法,YOLO会产生大量的预测框,每一个预测框称之为一个样本。那么对于产生的这些预测框,哪些应该作为正样本去与gt(ground truth)计算Lbox与Lcls,哪些又应该作为负样本仅仅贡献Lobj呢?这就取决于所定义的标签分配方法。

在过去的深度网络训练中,标签分配通常直接引用GT(真实标签),并根据给定的规则生成硬标签。比如YOLOv5中,根据中心点所在的位置加入附近两个格子,即同时分配给三个位置来预测。这种方法就叫做硬标签,因为他是直接根据gt来直接产生每个格子的标签,传入损失函数中求损失值

而YOLOv7中使用的是软标签分配方法。在该方法中,Head产生的预测值和GT一起传给分配器,才会得到每个网格的目标值,利用这里的软标签再和预测值一起传入损失函数中求损失值

常规思路是:由于用到了辅助头训练,因此分开求Lead Head和辅助头的软标签和损失值。比如图©中的辅助头训练。
在这里插入图片描述
但是YOLOv7提出了2种新方法。

  • 第一种是辅助头求Loss时,直接利用Lead Head产生的软标签进行计算。(图d)
  • 第二种是在第一种的基础上产生了course标签fine标签两种标签(也就是细粒度和粗糙标签)。(图c 比较难)

其中fine label 会用于训练 Lead head ,而Aux head 因为抽象能力弱则使用 coarse 的标签进行训练。


三、3️⃣正负样本标签分配

OTA最优传输标签分配中认为先根据正样本可能出现的区域进行筛选然后再计算 IoU Loss 或者其他进行进一步的标签分配。YOLO v7 中继承了这一做法,也就有了 coarse 的操作。
在这里插入图片描述
🔥在上图中,展示了如何制作从粗到精的约束导联头引导标签分配器。通过限制两个额外候选正网格(图中黄色网格)的解码器来进行动态约束。理论上,黄色网格需要预测[1,2]的范围来拟合真实值边界盒,我们使解码器只能预测[-0.5,1.5]的范围。这个约束使得模型可以自动学习不同层次的粉色网格和黄色网格。


四、4️⃣如何添加Aux head辅助训练头

🚀首先看一下配置文件的区别,左边是添加了3层辅助训练头的yaml文件,右边是正常的yolov5网络结构。在原有的[17, 20, 23]上面又添加了[24, 25, 26]进行训练。

在这里插入图片描述
🔥🔥🔥🔥🔥🔥除了yaml中的head部分需要修改,另外需要修改的就是损失函数,yolov7中的是ComputeLossAuxOTA损失,因为需要添加很多代码,而且部分代码的修改比较复杂,防止在训练过程中报错,这里建议直接将下面的代码文件,与yolov5-v7.0中的对应代码进行替换。
在这里插入图片描述

五、5️⃣实验部分(后续添加,还是跑模型,辅助头真是太慢了!!!)


在这里插入图片描述

这篇关于【YOLOv5改进系列(8)】高效涨点----添加yolov7中Aux head 辅助训练头的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/860163

相关文章

C++实现回文串判断的两种高效方法

《C++实现回文串判断的两种高效方法》文章介绍了两种判断回文串的方法:解法一通过创建新字符串来处理,解法二在原字符串上直接筛选判断,两种方法都使用了双指针法,文中通过代码示例讲解的非常详细,需要的朋友... 目录一、问题描述示例二、解法一:将字母数字连接到新的 string思路代码实现代码解释复杂度分析三、

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

Tomcat高效部署与性能优化方式

《Tomcat高效部署与性能优化方式》本文介绍了如何高效部署Tomcat并进行性能优化,以确保Web应用的稳定运行和高效响应,高效部署包括环境准备、安装Tomcat、配置Tomcat、部署应用和启动T... 目录Tomcat高效部署与性能优化一、引言二、Tomcat高效部署三、Tomcat性能优化总结Tom

Python利用自带模块实现屏幕像素高效操作

《Python利用自带模块实现屏幕像素高效操作》这篇文章主要为大家详细介绍了Python如何利用自带模块实现屏幕像素高效操作,文中的示例代码讲解详,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、获取屏幕放缩比例2、获取屏幕指定坐标处像素颜色3、一个简单的使用案例4、总结1、获取屏幕放缩比例from

使用Python实现高效的端口扫描器

《使用Python实现高效的端口扫描器》在网络安全领域,端口扫描是一项基本而重要的技能,通过端口扫描,可以发现目标主机上开放的服务和端口,这对于安全评估、渗透测试等有着不可忽视的作用,本文将介绍如何使... 目录1. 端口扫描的基本原理2. 使用python实现端口扫描2.1 安装必要的库2.2 编写端口扫

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

在C#中获取端口号与系统信息的高效实践

《在C#中获取端口号与系统信息的高效实践》在现代软件开发中,尤其是系统管理、运维、监控和性能优化等场景中,了解计算机硬件和网络的状态至关重要,C#作为一种广泛应用的编程语言,提供了丰富的API来帮助开... 目录引言1. 获取端口号信息1.1 获取活动的 TCP 和 UDP 连接说明:应用场景:2. 获取硬

Python实现高效地读写大型文件

《Python实现高效地读写大型文件》Python如何读写的是大型文件,有没有什么方法来提高效率呢,这篇文章就来和大家聊聊如何在Python中高效地读写大型文件,需要的可以了解下... 目录一、逐行读取大型文件二、分块读取大型文件三、使用 mmap 模块进行内存映射文件操作(适用于大文件)四、使用 pand

高效管理你的Linux系统: Debian操作系统常用命令指南

《高效管理你的Linux系统:Debian操作系统常用命令指南》在Debian操作系统中,了解和掌握常用命令对于提高工作效率和系统管理至关重要,本文将详细介绍Debian的常用命令,帮助读者更好地使... Debian是一个流行的linux发行版,它以其稳定性、强大的软件包管理和丰富的社区资源而闻名。在使用

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin