【论文阅读笔记】Uncertainty-aware Joint Salient Object and Camouflaged Object Detectio

本文主要是介绍【论文阅读笔记】Uncertainty-aware Joint Salient Object and Camouflaged Object Detectio,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【论文阅读笔记】Uncertainty-aware Joint Salient Object and Camouflaged Object Detection

提示:新手小白,单纯做笔记,如有错误还请指出。

原文链接

GitHub链接:https://github.com/JingZhang617/Joint_COD_SOD

文章目录

  • Author
  • 一、Abstract
  • 二、Introduce
    • 1.数据扩充
    • 2.
  • 三、Related Work
    • 1.Salient Object Detection Models
    • 2.Camouflaged Object Detection Models
    • 3.Multi-task Learning
    • 4.Adversarial Learning
  • 四、Method
    • 1.Data augmentation
    • 2.Contradicting modeling
      • (1)Feature Encoder
      • (2)Similarity Measure
    • 3.Uncertainty-aware adversarial learning
      • (1)Prediction decoder
      • (2)Feature Encoder
      • (3)Feature Encoder
  • 五、Experimental
  • 六、Code
  • Conclusion


Author

论文信息
提示:以下是网上找到的作者的一些信息,可供参考。

Aixuan Li:西北工业大学,研究成果
Jing Zhang:澳大利亚国立大学&&澳大利亚联邦科学与工业研究组织 ,研究成果
Yunqiu Lv:西北工业大学,研究成果
Bowen Liu:西北工业大学,研究成果
Tong Zhang:瑞士洛桑联邦理工学院,研究成果
Tong Zhang:瑞士洛桑联邦理工学院,研究成果
Yuchao Dai(戴玉超):西北工业大学,研究成果,个人介绍,添加链接描述

一、Abstract

根据视觉显著性物体检测与伪装性物体检测任务的相互对立与学习展开,提出了基于不确定性感知的显著性物体检测和伪装物体检测的联合学习网络,建模网络预测的置信度,并通过深入挖掘两任务间的相关性,利用显著性物体和伪装物体的矛盾对立属性,使相互对立的显著性物体检测与伪装物体检测任务相互帮助。

显著目标检测(SOD)目的是发现吸引人注意的明显的目标,伪装目标检测(COD)目的是发现藏在背景中的伪装的目标。
本文提出了一种通过矛盾信息增强显著目标检测和伪装目标检测的检测能力。
首先把COD 的简单正样本,作为SOD的hard 正样本,增强了SOD的鲁棒性。
其次,引入“相似性度量”来明确矛盾属性。
另外,COD和SOD的数据标注不确定性,提出敌对学习网络来实现高阶相似性度量和网络置信度估计。

二、Introduce

1.数据扩充

在这里插入图片描述
在显著目标和伪装目标过渡中,也存在中间的目标,同时属于两者,比如北极熊。
现在的显著目标检测主要关注网络结构和损失函数。但是除了这两者之外,有效的训练数据集会带来性能的提升。
有效的数据集:扩充数据集
把中间的(类似北极熊)低对比度的目标加入到显著目标数据集,设计一个学习网络来实现 easy samples from COD (e.g. the polar bear) as hard samples for SOD,提高对比度。

2.

三、Related Work

1.Salient Object Detection Models

2.Camouflaged Object Detection Models

3.Multi-task Learning

4.Adversarial Learning

四、Method

1.Data augmentation

首先介绍了一种数据扩充:COD中的简单样本作为SOD中困难样本。从COD中选择样本,用训练好的SOD技术安MAE,选择值最小的样本。选择COD中MAE(平均绝对误差)最小的400张图片随即代替SOD中的样本。

2.Contradicting modeling

其次,提出“相似性度量”模块然后显式地建模两个任务(SOD和COD)的“矛盾”属性。
在这里插入图片描述

Dc:COD dataset;
Ds:SOD dataset
i:图像索引
X,Y:图像和GT对
Nc,Ns:伪装训练集和显著训练集的大小
在这里插入图片描述
Dp:PASCAL VOC 2007数据集作为连接建模数据集,从中提取显著特征和伪装特征

在这里插入图片描述

(1)Feature Encoder

特征编码器用来提取特征。Dc和Ds作为输入
显著性编码器Eαs和伪装编码器Eαc。α表示参数。使用ResNet50作为编码器的backbone,四组卷积层,通道为[256, 512, 1024, 2048]。其输出特征用F={f1,f2,f3,f4}表示。
在这里插入图片描述
group:相同空间大小特征

(2)Similarity Measure

Dp作为输入,提取出特征图,然后把特征逐通道连接,反馈到相同的全连接层去获取潜在显著特征和潜在伪装特征,潜在空间维度设为K=700
在这里插入图片描述

相似性度量来将COD和SOD任务与Dp连接起来。
假设两个任务激活的区域不同,导致潜在特征彼此分离。然后选择cos相似度来度量潜在空间中的显著特征和伪装特征之间的差异,把潜在空间损失定义为:

在这里插入图片描述
在这里插入图片描述
给显著编码器和伪装编码器相同的图像,计算显著图和伪装图,并用红色突出前景,可以看出两者激活区域不同,显著编码器更关注从上下文突出的区域,而伪装编码器关注和背景颜色或结构相似的隐藏对象。这和我们假设一致。

3.Uncertainty-aware adversarial learning

最后是基于不确定性感知的对抗训练网络,在测试过程中产生可解释的预测,在训练过程中实现更高阶的相似性度量。
在这里插入图片描述
SOD中的不确定性来在于显著性的模糊性,比如a中的球是突出的,但在b中是背景。COD的不确定性是标注不精确,c中的橙色区域和背景太相似了,不好标注。
为此,我们引入了一种不确定性感知的对抗性训练策略,在我们的联合学习框架中对特定任务的不确定性进行建模,该框架包括一个“预测解码器”模块来产生与任务相关的预测,一个“置信度估计”模块来估计每个预测的不确定性,以及一个用于鲁棒模型训练的对抗性学习策略。

(1)Prediction decoder

预测解码器
设计一个共享解码结构,他们认为不同的特征解码模型能
为COD和SOD图产生特定任务的特征。然后"预测解码"模型的目的是特定任务特征与他们相对应的低水平特征结合产生预测结果。在这里插入图片描述

设计了一个自上而下的连接网络
Re:residual channel atten-
tion module,(剩余通道注意模块)提取更好的特征。
Da:dual attention module(双重注意模块)将较高层的语义信息和较低层的结构信息融合,来获取初预测。
conv是33的卷积,输出通道为23
[]逐通道拼接,拼接前上采样至相同空间
Ccla:3
3的卷积,为每一个任务将特征映射到通道预测。
在这里插入图片描述
R3和R4是ResNet50的第三阶段和第四阶段。
在这里插入图片描述
最终的预测解码器结构。

在这里插入图片描述

(2)Feature Encoder

(3)Feature Encoder

五、Experimental

六、Code

此论文的代码是公开的,将发布到
https://github.com/JingZhang617/Joint_COD_SOD
实验细节也在上边,代码将在不久之后发布,目前还没有!

Conclusion

这篇关于【论文阅读笔记】Uncertainty-aware Joint Salient Object and Camouflaged Object Detectio的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/549513

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓