伪装目标检测论文备忘录

2023-12-05 17:59

本文主要是介绍伪装目标检测论文备忘录,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Fan_Camouflaged_Object_Detection_CVPR_2020_paper.pdf

1.整体结构:

框架主要包括两个模块:搜索模块 (SearchModule, SM) 和识别模块 (Identification Module, IM)。前者负责搜索被伪装的物体,而后者则用于精确检测物体。

2. 搜索模块(Search Module,SM)

本文 在搜索阶段(通常是在较小的、局部空间中)使用 RF 模块来整合更具鉴别性的特征表示。具 体而言,对于输入图像 I∈R W×H×3,可利用 ResNet50模型提取出一组特征 {Xk} 4 k=0。为了保留更 多信息,本文将第二层特征层的步长参数设置为 1, 使其和输入图像具有相同的分辨率。因此,每一层 分辨率为 {[ H k , W k ], k = 4, 4, 8, 16, 32} 。 最新研究 显示,更浅的卷积层中的低级 特征保留了用于构建物体边缘的空间信息,而深层 的深层卷积层的特征保留了用于定位目标的语义信 息。由于神经网络本身的固有的特性,本文将提取 的特征进行分层:低层 {X0, X1},中层 X2 和高层 {X3, X4},并通过拼接、上采样和下采样等操作进行 组合。与 [79] 不同,本文的 SINet 采用稠密连接策 略 [27] 来保存来自不同特征层的更多信息,然后使 用改进的 RF [42] 组件来扩大感受野。例如,先使用 拼接操作来融合低级特征 {X0, X1},然后将分辨率 下采样为原始一半。再将融合后的新特征 rf x1x2 4 进 一步输入到 RF 组件生成 rf s 4 特征。

RF模块的前世解读:

RF的灵感来源于

群智感受野(pRF)属性的规律。 (A)pRF大小可以看作人类视网膜图中偏心率的函数,其中两个趋势是明显的:(1)pRF大小随着每个图中的偏心率而增加,以及(2)图之间的pRF大小有差异。 (B)基于(A)中的参数的pRF的空间阵列:每个圆的半径是在适当的偏心率下的表观RF尺寸。

翻译一下就是:人视野的一个特点,离视线中心越远,人的感受野越大,越靠近视线中间,人感受野越小;人对不同物体的感受野大小不同

通过将多个分支与不同的卷积核和膨胀卷积组合来构建RFB模块。 多个卷积核类似于不同大小的pRF,而膨胀卷积为每个分支分配单独的偏心率以模拟pRF的大小和偏心率之间的比率。 通过将所有分支合并进行1*1卷积变换,产生RF的最终空间阵列,其机理类似于上边所示的人类视觉系统

3.识别模块 ((Identification Module, IM)

本文采 用密集连接方式对部分解码组件 (Partial Decoder Component,PDC) 进行了扩展。具体来讲,PDC 整合了来自 SM 的四个特征层。可通过以下公式来 计算粗糙的伪装图 Cs: Cs = P Ds(rf s 1 , rf s 2 , rf s 3 , rf s 4 ), (1) 其中 {rf s k = rfk, k = 1, 2, 3, 4}。现有文献已 表明,注意力机制可以有效地消除无关特征的干扰。 因此引入搜索注意力 (Search Attention,SA) 模块 来增强中间特征层 X2 并获得增强的伪装图 Ch: Ch = fmax(g(X2, σ, λ), Cs), (2) 其中 g(·) 是 SA 函数,即为典型的归一化后的高斯 滤波器,其标准差为:σ = 32,核尺寸为:λ = 4, fmax(·) 是一个最大化函数,用来突出伪装图 Cs 初 始的伪装区域。 为了全面获取高层特征,本文进一步使用 PDC 来聚合另外三层的特征,并通过 RF 进行增强,以 获得最终的伪装图 Ci: Ci = P Di(rfi 1 , rfi 2 , rfi 3 ), (3)

PDC到SA再到PDC模块的结构与下图思路相似:https://arxiv.org/pdf/1904.08739.pdf

参考博客:

https://blog.csdn.net/spellindover/article/details/107443980

 

 

(如有侵权,联系必删)

这篇关于伪装目标检测论文备忘录的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/458553

相关文章

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

如何用Java结合经纬度位置计算目标点的日出日落时间详解

《如何用Java结合经纬度位置计算目标点的日出日落时间详解》这篇文章主详细讲解了如何基于目标点的经纬度计算日出日落时间,提供了在线API和Java库两种计算方法,并通过实际案例展示了其应用,需要的朋友... 目录前言一、应用示例1、天安门升旗时间2、湖南省日出日落信息二、Java日出日落计算1、在线API2

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已