本文主要是介绍目标检测卷王YOLO卷出新高度:YOLOv9问世,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
论文摘要:如今的深度学习方法重点关注如何设计最合适的目标函数,使得模型的预测结果能够最接近真实情况。 同时,必须设计一个适当的架构,可以帮助获取足够的信息进行预测。 现有方法忽略了一个事实,即当输入数据经过逐层特征提取和空间变换时,大量信息将会丢失。 本文将深入研究数据通过深度网络传输时数据丢失的重要问题,即信息瓶颈和可逆函数。 我们提出了可编程梯度信息(PGI)的概念来应对深度网络实现多个目标所需的各种变化。 PGI可以为目标任务计算目标函数提供完整的输入信息,从而获得可靠的梯度信息来更新网络权值。 此外,还设计了一种新的轻量级网络架构——基于梯度路径规划的通用高效层聚合网络(GELAN)。 GELAN的架构证实了PGI在轻量级模型上取得了优异的结果。 我们在基于 MS COCO 数据集的目标检测上验证了所提出的 GELAN 和 PGI。 结果表明,与基于深度卷积开发的最先进方法相比,GELAN 仅使用传统的卷积算子即可实现更好的参数利用率。 PGI 可用于从轻型到大型的各种模型。 它可以用来获取完整的信息,使得从头开始训练的模型能够比使用大数据集预训练的state-of-the-art模型获得更好的结果
论文地址:https://arxiv.org/abs/2402.13616
代码地址:https://github.com/WongKinYiu/yolov9?tab=readme-ov-file
这篇关于目标检测卷王YOLO卷出新高度:YOLOv9问世的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!