YOLOv9/YOLOv8算法改进【NO.117】使用Wasserstein Distance Loss改进小目标的检测效果

本文主要是介绍YOLOv9/YOLOv8算法改进【NO.117】使用Wasserstein Distance Loss改进小目标的检测效果，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

前言
YOLO算法改进系列出到这，很多朋友问改进如何选择是最佳的，下面我就根据个人多年的写作发文章以及指导发文章的经验来看，按照优先顺序进行排序讲解YOLO算法改进方法的顺序选择。具体有需求的同学可以私信我沟通：

首推，是将两种最新推出算法的模块进行融合形成最为一种新型自己提出的模块然后引入到YOLO算法中，可以起个新的名字，这种改进是最好发高水平期刊论文。后续改进将主要教大家这种方法，有需要的朋友可私信我了解。

第一，创新主干特征提取网络，将整个Backbone改进为其他的网络，比如这篇文章中的整个方法，直接将Backbone替换掉，理由是这种改进如果有效果，那么改进点就很值得写，不算是堆积木那种，也可以说是一种新的算法，所以做实验的话建议朋友们优先尝试这种改法。

第二，创新特征融合网络，这个同理第一，比如将原yolo算法PANet结构改进为Bifpn等。

第三，改进主干特征提取网络，就是类似加个注意力机制等。根据个人实验情况来说，这种改进有时候很难有较大的检测效果的提升，乱加反而降低了特征提取能力导致mAP下降，需要有技巧的添加。

第四，改进特征融合网络，理由、方法等同上。

第五，改进检测头，更换检测头这种也算个大的改进点。

第六，改进损失函数，nms、框等，要是有提升检测效果的话，算是一个小的改进点，也可以凑字数。

第七，对图像输入做改进，改进数据增强方法等。

第八，剪枝以及蒸馏等，这种用于特定的任务，比如轻量化检测等，但是这种会带来精度的下降。

...........未完待续

一、创新改进思路或解决的问题

💡💡💡NWD定义了新的损失函数，这种损失函数适用于改进小目标检测的应用场景，对于小目标的检测效果会更佳。

二、基本原理

原文：[2110.13389] A Normalized Gaussian Wasserstein Distance for Tiny Object Detection (arxiv.org)

摘要：检测微小的对象是一个非常具有挑战性的问题，因为一个小小的对象仅包含几个象素的尺寸。我们表明，国家的技术探测器没有产生令人满意的结果在微小的物体，由于缺乏观信息。我们的主要观察的是，交在联盟(借条)基于指标，例如借条本身及其扩展是非常敏感的位置的偏差的微小的物体，并急剧恶化的性能检测时，使用基于锚探测器。为缓解这一点，我们提出了一个新的评估指标的使用佳华距离微小的物体的检测。具体地说，我们的第一个模型的边界框为2D高斯分布，然后提出一个新的指标被称为归一化佳华距离(NWD)计算之间的相似性，他们通过他们的相应的高斯的分布。拟议的NWD指标可以很容易地嵌入的分配，非最大的抑制，并丧失功能的任何锚基础的检测器，以替代通常使用的借条的指标。我们评估我们的指标的新数据集，用于微小的物体检测(AI-托德)，其中平均对象的规模要小得多于现有的对象探测数据集。广泛的实验显示，当配备NWD指标，我们的方法产率业绩，为6.7AP点高于标准的精细调整基准，并6.0AP点高于国家的技术竞争对手。

三、添加方法

部分代码如下所示，具体可关注后加我下方小卡片联系我获取。yolov8n为baseline。


def Wasserstein(box1, box2, xywh=True):box2 = box2.Tif xywh:b1_cx, b1_cy = (box1[0] + box1[2]) / 2, (box1[1] + box1[3]) / 2b1_w, b1_h = box1[2] - box1[0], box1[3] - box1[1]b2_cx, b2_cy = (box2[0] + box2[0]) / 2, (box2[1] + box2[3]) / 2b1_w, b1_h = box2[2] - box2[0], box2[3] - box2[1]else:b1_cx, b1_cy, b1_w, b1_h = box1[0], box1[1], box1[2], box1[3]b2_cx, b2_cy, b2_w, b2_h = box2[0], box2[1], box2[2], box2[3]cx_L2Norm = torch.pow((b1_cx - b2_cx), 2)cy_L2Norm = torch.pow((b1_cy - b2_cy), 2)p1 = cx_L2Norm + cy_L2Normw_FroNorm = torch.pow((b1_w - b2_w)/2, 2)h_FroNorm = torch.pow((b1_h - b2_h)/2, 2)p2 = w_FroNorm + h_FroNormreturn p1 + p2

四、总结

预告一下：下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我，有问题可以留言或者私聊我哦

PS：该方法不仅仅是适用改进YOLOv8，也可以改进其他的YOLO网络以及目标检测网络，比如YOLOv7、v6、v4、v3，Faster rcnn ，ssd等。