尺度和位置敏感的红外小目标检测

2024-08-31 15:52

本文主要是介绍尺度和位置敏感的红外小目标检测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Infrared Small Target Detection with Scale and Location Sensitivity

        在本文中,着重于以更有效的损失和更简单的模型结构来提升检测性能。

问题一

        红外小目标检测(IRSTD)一直由基于深度学习的方法主导。然而,这些方法主要集中在复杂模型结构的设计上,以提取有区别的特征,而对IRSTD的损失函数的研究不足。例如,广泛使用的交并(IoU)和Dice损失对目标的尺度和位置缺乏敏感性,限制了检测器的检测性能。为了获得更好的检测性能,研究人员开发了几种损失函数。例如,对抗训练的损失、目标边缘检测的边缘损失以及目标和背景图之间的似然性损失。然而,这些损耗是针对特定的网络架构而定制的,限制了它们更广泛的应用。与这些专用损失不同,箱级(box-level)IRSTD采用了GIoU和CIoU损失。然而,这些IoU变体损失仍然缺乏尺度和位置的敏感性。

创新点

        与这些损失相比,本文制定了一个更适合IRSTD的一般损失函数。它可以区分不同尺度和位置的目标,使不同的探测器获得更好的探测性能。提出了一种新的尺度和位置敏感(SLS)损失来解决现有损失的局限性有助于检测器区分不同尺度和位置的目标:

        1)对于尺度敏感,根据目标的预测尺度和地面真实尺度来计算IOU损失的权重。预测尺度和真实尺度之间的差距越大,检测器将越关注。基于目标尺度计算IoU损失的权重,以帮助检测器区分不同尺度的目标;

        2)对于位置敏感,设计了一个位置惩罚的基础上预测和地面真实的中心点的目标,以帮助检测器更精确地定位目标。与传统的L1和L2距离相比,所设计的定位损失在不同的定位误差下产生相同的值,使得检测器能够更精确地定位目标。

问题二

        为了获得更有效的特征,大量的工作都集中在模型结构的设计上。Li 等人定制了一个密集嵌套的交互式模块,以实现多层特征融合。Zhang等人利用Taylor有限差分和方向注意策略提取目标的边缘信息。然而,这种复杂的模型结构不仅带来了更多的计算成本,但由于缺乏有效的损失函数仍然受到中等的检测性能

创新点

        设计了一个简单的面向普通U-Net的多尺度头(MSHNet),它为每个输入产生多尺度预测通过将SLS损失应用于预测的每个尺度以更少的时间消耗实现了SOTA性能。

网络结构

1. 尺度和位置敏感(SLS)损失

        尺度和位置敏感(SLS)损失,表示为LSLS,旨在处理现有损失的尺度和位置的不敏感性。它包括尺度敏感损失和位置敏感损失。从形式上讲,

其中LS和LL分别表示尺度敏感损失和位置敏感损失。下面,从尺度敏感性损失开始详细介绍SLS损失,这是基于常用的IoU损失。

1)尺度敏感损失

        假设Ap和Agt是目标的预测像素和地面实况像素的集合,它们之间的IoU损失可以公式化为:

        虽然已经被广泛用于IRSTD中,但IoU损失对目标的尺度和位置不敏感。通过为IoU损失提供权重来实现尺度敏感损失:

其中Var(·,·)是获取所提供标量的方差的函数。

2位置敏感损失

        位置敏感损失的计算是基于预测和地面实况中心点的目标。给定预测像素组Ap和地面实况像素组Agt,通过对所有像素的坐标求平均来获得Ap和Agt的对应中心点,其分别表示为cp =(xp,yp)和cgt =(xgt,ygt)。然后,将这两个中心点的坐标转换到极坐标系中。以cp为例,极坐标系中对应的距离dp和角度θp为:

        位置敏感损失可通过以下方式获得:

其中dgt和θgt分别是极坐标系中cgt的距离和角度。定位损失有效地区分了大多数不同的定位误差,使检测器对不同类型的定位误差敏感,并更准确地定位目标。

2. MSHNet检测器

        在本节中,将介绍MSHNet检测器,它是通过在普通U-Net中引入一个简单但有效的多尺度头来实现的。MSHNet的概况如图4所示。以常用的U-Net作为骨干网。在解码器中具有不同尺度的特征图被馈送到不同的预测头以获得不同尺度的预测。最后,将来自不同特征图的所有预测进行级联(如果需要,在级联之前采用上采样)以获得最终预测。在训练阶段,SLS损失被应用于每个预测。在下文中,首先详细描述多尺度头。然后介绍了SLS损耗在MSHNet中的应用。

(1)Multi-Scale Head

        设Xi为U-Net解码器中第i个尺度的特征映射,其中Hi ×Wi为空间大小,Ci为通道数。根据现有作品中的常见设置,U-Net中有4个尺度,这意味着i ∈ {1,2,3,4}。

        第i个预测pi ∈ RHi×Wi×1由相应的预测头获得,该预测头由卷积层和sigmoid激活函数实现:

注意,不同的预测头具有它们自己的专用参数。最终预测p 是基于所有4个预测获得的:

(2)Training MSHNet with SLS Loss

        由于SLS损失对尺度敏感,并且MSHNet的预测中有几个尺度,因此将SLS损失应用于所有预测。SLS损失对不同的尺度产生不同的损失值,即使它们共享相同的空间布局。假设,通过将SLS损失应用于不同的尺度,具有不同尺度的目标可以吸引检测器的不同注意力,从而导致整体上更好的检测性能。

        设pgt是地面真值标签。MSHNet的最终损失是:

这篇关于尺度和位置敏感的红外小目标检测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1124334

相关文章

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

POJ1269 判断2条直线的位置关系

题目大意:给两个点能够确定一条直线,题目给出两条直线(由4个点确定),要求判断出这两条直线的关系:平行,同线,相交。如果相交还要求出交点坐标。 解题思路: 先判断两条直线p1p2, q1q2是否共线, 如果不是,再判断 直线 是否平行, 如果还不是, 则两直线相交。  判断共线:  p1p2q1 共线 且 p1p2q2 共线 ,共线用叉乘为 0  来判断,  判断 平行:  p1p

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

PR曲线——一个更敏感的性能评估工具

在不均衡数据集的情况下,精确率-召回率(Precision-Recall, PR)曲线是一种非常有用的工具,因为它提供了比传统的ROC曲线更准确的性能评估。以下是PR曲线在不均衡数据情况下的一些作用: 关注少数类:在不均衡数据集中,少数类的样本数量远少于多数类。PR曲线通过关注少数类(通常是正类)的性能来弥补这一点,因为它直接评估模型在识别正类方面的能力。 精确率与召回率的平衡:精确率(Pr

Linux Centos 迁移Mysql 数据位置

转自:http://www.tuicool.com/articles/zmqIn2 由于业务量增加导致安装在系统盘(20G)磁盘空间被占满了, 现在进行数据库的迁移. Mysql 是通过 yum 安装的. Centos6.5Mysql5.1 yum 安装的 mysql 服务 查看 mysql 的安装路径 执行查询 SQL show variables like

PDFQFZ高效定制:印章位置、大小随心所欲

前言 在科技编织的快节奏时代,我们不仅追求速度,更追求质量,让每一分努力都转化为生活的甜蜜果实——正是在这样的背景下,一款名为PDFQFZ-PDF的实用软件应运而生,它以其独特的功能和高效的处理能力,在PDF文档处理领域脱颖而出。 它的开发,源自于对现代办公效率提升的迫切需求。在数字化办公日益普及的今天,PDF作为一种跨平台、不易被篡改的文档格式,被广泛应用于合同签署、报告提交、证书打印等各个

[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2757 标注数量(xml文件个数):2757 标注数量(txt文件个数):2757 标注类别数:4 标注类别名称:["Platelets","RBC","WBC","sickle cell"] 每个类别标注的框数: