损失函数:DIOU loss手写实现

2023-10-28 21:59

本文主要是介绍损失函数:DIOU loss手写实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

下面是纯diou代码

            '''计算两个box的中心点距离d'''# d = math.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)d = math.sqrt((pred[:, -1] - target[:, -1]) ** 2 + (pred[:, -2] - target[:, -2]) ** 2)# 左边xpred_l = pred[:, -1] - pred[:, -1] / 2target_l = target[:, -1] - target[:, -1] / 2# 上边ypred_t = pred[:, -2] - pred[:, -2] / 2target_t = target[:, -2] - target[:, -2] / 2# 右边xpred_r = pred[:, -1] + pred[:, -1] / 2target_r = target[:, -1] + target[:, -1] / 2# 下边ypred_b = pred[:, -2] + pred[:, -2] / 2target_b = target[:, -2] + target[:, -2] / 2'''计算两个box的bound的对角线距离'''bound_l = torch.min(pred_l, target_l)  # leftbound_r = torch.max(pred_r, target_r)  # rightbound_t = torch.min(pred_t, target_t)  # topbound_b = torch.max(pred_b, target_b)  # bottomc = math.sqrt((bound_r - bound_l) ** 2 + (bound_b - bound_t) ** 2)dloss = iou - (d ** 2) / (c ** 2)loss = 1 - dloss.clamp(min=-1.0, max=1.0)

第一步 计算两个box的中心点距离d

首先要知道pred和target的输出结果是什么
pred[:,:2]第一个:表示多个图片,第二个:2表示前两个数值,代表矩形框中心点(Y,X)
pred[:,2:]第一个:表示多个图片,第二个2:表示两个数值,代表矩形框长宽(H,W)
target[:,:2]同理,
d =
 

根据上面的分析来计算左右上下坐标lrtb

 然后计算内部2个矩形的最小外接矩形的对角线长度c

 d是两个预测矩形中心点的距离

 下面接受各种极端情况
A 两个框中心对齐时候,d/c=0,iou可能0-1

 A 两个框相距很远时,d/c=1,iou=0

 所以d/c属于0-1
dloss=iou-d/c属于-1到1
因此设置loss=1-dloss属于0-2

 

展示iou\giou\diou代码,这是YOLOX自带的损失函数,其中dloss是我自己写的
YOLOX是下载自
GitHub - Megvii-BaseDetection/YOLOX: YOLOX is a high-performance anchor-free YOLO, exceeding yolov3~v5 with MegEngine, ONNX, TensorRT, ncnn, and OpenVINO supported. Documentation: https://yolox.readthedocs.io/YOLOX is a high-performance anchor-free YOLO, exceeding yolov3~v5 with MegEngine, ONNX, TensorRT, ncnn, and OpenVINO supported. Documentation: https://yolox.readthedocs.io/ - GitHub - Megvii-BaseDetection/YOLOX: YOLOX is a high-performance anchor-free YOLO, exceeding yolov3~v5 with MegEngine, ONNX, TensorRT, ncnn, and OpenVINO supported. Documentation: https://yolox.readthedocs.io/https://github.com/Megvii-BaseDetection/YOLOX

class IOUloss(nn.Module):def __init__(self, reduction="none", loss_type="iou"):super(IOUloss, self).__init__()self.reduction = reductionself.loss_type = loss_typedef forward(self, pred, target):assert pred.shape[0] == target.shape[0]pred = pred.view(-1, 4)target = target.view(-1, 4)tl = torch.max((pred[:, :2] - pred[:, 2:] / 2), (target[:, :2] - target[:, 2:] / 2))# pred target都是[H,W,Y,X]# (Y,X)-(H,W) 左上角br = torch.min((pred[:, :2] + pred[:, 2:] / 2), (target[:, :2] + target[:, 2:] / 2))# (X,Y)+(H,W) 右下角area_p = torch.prod(pred[:, 2:], 1)  # HxWarea_g = torch.prod(target[:, 2:], 1)en = (tl < br).type(tl.type()).prod(dim=1)area_i = torch.prod(br - tl, 1) * enarea_u = area_p + area_g - area_iiou = (area_i) / (area_u + 1e-16)if self.loss_type == "iou":loss = 1 - iou ** 2elif self.loss_type == "giou":c_tl = torch.min((pred[:, :2] - pred[:, 2:] / 2), (target[:, :2] - target[:, 2:] / 2))c_br = torch.max((pred[:, :2] + pred[:, 2:] / 2), (target[:, :2] + target[:, 2:] / 2))area_c = torch.prod(c_br - c_tl, 1)giou = iou - (area_c - area_u) / area_c.clamp(1e-16)loss = 1 - giou.clamp(min=-1.0, max=1.0)# pred[:, :2]  pred[:, 2:]# (Y,X)        (H,W)# target[:, :2]  target[:, 2:]# (Y,X)        (H,W)elif self.loss_type == "diou":'''计算两个box的中心点距离d'''# d = math.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)d = math.sqrt((pred[:, -1] - target[:, -1]) ** 2 + (pred[:, -2] - target[:, -2]) ** 2)# 左边xpred_l = pred[:, -1] - pred[:, -1] / 2target_l = target[:, -1] - target[:, -1] / 2# 上边ypred_t = pred[:, -2] - pred[:, -2] / 2target_t = target[:, -2] - target[:, -2] / 2# 右边xpred_r = pred[:, -1] + pred[:, -1] / 2target_r = target[:, -1] + target[:, -1] / 2# 下边ypred_b = pred[:, -2] + pred[:, -2] / 2target_b = target[:, -2] + target[:, -2] / 2'''计算两个box的bound的对角线距离'''bound_l = torch.min(pred_l, target_l)  # leftbound_r = torch.max(pred_r, target_r)  # rightbound_t = torch.min(pred_t, target_t)  # topbound_b = torch.max(pred_b, target_b)  # bottomc = math.sqrt((bound_r - bound_l) ** 2 + (bound_b - bound_t) ** 2)dloss = iou - (d ** 2) / (c ** 2)loss = 1 - dloss.clamp(min=-1.0, max=1.0)# Step1# def DIoU(a, b):# d = a.center_distance(b)# c = a.bound_diagonal_distance(b)# return IoU(a, b) - (d ** 2) / (c ** 2)# Step2-1# def center_distance(self, other):#    '''#    计算两个box的中心点距离#    '''#    return euclidean_distance(self.center, other.center)# Step2-2# def euclidean_distance(p1, p2):#    '''#    计算两个点的欧式距离#    '''#     x1, y1 = p1#    x2, y2 = p2#    return math.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)# Step3# def bound_diagonal_distance(self, other):#    '''#    计算两个box的bound的对角线距离#    '''#    bound = self.boundof(other)#    return euclidean_distance((bound.x, bound.y), (bound.r, bound.b))# Step3-2# def boundof(self, other):#    '''#    计算box和other的边缘外包框,使得2个box都在框内的最小矩形#    '''#    xmin = min(self.x, other.x)#    ymin = min(self.y, other.y)#    xmax = max(self.r, other.r)#    ymax = max(self.b, other.b)#    return BBox(xmin, ymin, xmax, ymax)# Step3-3# def euclidean_distance(p1, p2):#    '''#    计算两个点的欧式距离#    '''#     x1, y1 = p1#    x2, y2 = p2#    return math.sqrt((x2 - x1) ** 2 + (y2 - y1) ** 2)if self.reduction == "mean":loss = loss.mean()elif self.reduction == "sum":loss = loss.sum()return loss

GitHub - Megvii-BaseDetection/YOLOX: YOLOX is a high-performance anchor-free YOLO, exceeding yolov3~v5 with MegEngine, ONNX, TensorRT, ncnn, and OpenVINO supported. Documentation: https://yolox.readthedocs.io/

这篇关于损失函数:DIOU loss手写实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/296226

相关文章

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

hdu1171(母函数或多重背包)

题意:把物品分成两份,使得价值最接近 可以用背包,或者是母函数来解,母函数(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v) 其中指数为价值,每一项的数目为(该物品数+1)个 代码如下: #include<iostream>#include<algorithm>

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

Kubernetes PodSecurityPolicy:PSP能实现的5种主要安全策略

Kubernetes PodSecurityPolicy:PSP能实现的5种主要安全策略 1. 特权模式限制2. 宿主机资源隔离3. 用户和组管理4. 权限提升控制5. SELinux配置 💖The Begin💖点点关注,收藏不迷路💖 Kubernetes的PodSecurityPolicy(PSP)是一个关键的安全特性,它在Pod创建之前实施安全策略,确保P

工厂ERP管理系统实现源码(JAVA)

工厂进销存管理系统是一个集采购管理、仓库管理、生产管理和销售管理于一体的综合解决方案。该系统旨在帮助企业优化流程、提高效率、降低成本,并实时掌握各环节的运营状况。 在采购管理方面,系统能够处理采购订单、供应商管理和采购入库等流程,确保采购过程的透明和高效。仓库管理方面,实现库存的精准管理,包括入库、出库、盘点等操作,确保库存数据的准确性和实时性。 生产管理模块则涵盖了生产计划制定、物料需求计划、

C++——stack、queue的实现及deque的介绍

目录 1.stack与queue的实现 1.1stack的实现  1.2 queue的实现 2.重温vector、list、stack、queue的介绍 2.1 STL标准库中stack和queue的底层结构  3.deque的简单介绍 3.1为什么选择deque作为stack和queue的底层默认容器  3.2 STL中对stack与queue的模拟实现 ①stack模拟实现