2024年显著性检测论文及代码汇总（1）

本文主要是介绍2024年显著性检测论文及代码汇总（1），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

ACM MM

Distortion-aware Transformer in 360° Salient Object Detection

code
Abstacrt：现有的方法无法处理二维等矩投影引起的畸变。本文提出了一个基于Transformer的模型，即DATFormer。首先，引入两个畸变自适应模块。其一是畸变映射模块，预处理全局畸变特征；其二是畸变自适应注意力块，减少多尺度特征的局部畸变。然后，为利用360°数据的独特特征，本文提出一个可学习的关系矩阵，作为位置嵌入的一部分，进一步提高性能。
在这里插入图片描述

ICASSP

Zero-Shot Co-salient Object Detection Framework

code
Abstacrt：本文构建了第一个Zero-Shot的协同显著性检测框架，无需训练即可利用这些模型。在该框架中引入两个新模块：组提示生成模块GPG、协同显著性图生成模块CMP。
在这里插入图片描述

IEEE TIP

Rethinking Object Saliency Ranking: A Novel Whole-flow Processing Paradigm

code
Abstacrt：本文提出了一个显著性排序范式。首先，由于GT图的构建缺乏理论依据，其显著性物体排序不合理。其次，由于现有的显著性排序模型遵循多任务范式，而不同的任务之间有冲突且难以权衡，因此显著性排序模型受到挑战。最后，现有的基于回归的显著性排序模型依赖于基于实例掩码的显著性排序，导致模型过于复杂。模型需要大量的数据才准确，且难以有效实现。针对这三方面问题，本文探讨其产生原因，提出显著性排序任务的全流程处理范式。
在这里插入图片描述

NeurIPS

What Do Deep Saliency Models Learn about Visual Attention?

code
Abstacrt：本文提出一个分析框架，阐述显著性模型被学习的隐式特征，隐式特征对显著性模型的贡献的解释和量化。本文将隐式特征分解为与语义属性明确对齐的可解释基，将显著性预测重述为一种加权组合。本团队从不同角度进行广泛分析，包括语义的正权重和负权重、训练数据和框架设计的影响、微调的渐进影响和SOTA模型的常见失败案例。此外，本团队通过研究不同场景下的视觉注意力特征，以展示该框架的有效性，例如自闭症谱系障碍ADS的非典型注意力、情绪刺激下的注意力和随时间变化的注意力。
在这里插入图片描述

WACV

3SD: Self-Supervised Saliency Detection With No Labels

code
Abstacrt：最近的研究表明，从分类任务中提取的特征提供了重要的显著性线索，例如目标的结构和语义信息。本文提出了一个自监督模型，即3SD，利用这一思想，通过在显著性检测的同时，为自监督分类任务添加一个分支，以获得类激活图CAM。CAM与边缘图用于生成伪GT。具体来说，本文提出一种用于分类任务的基于多图像pacth对比学习。相比于在整张图像上进行分类的朴素学习，带有对比损失的multi-patch分类提升了CAM的质量。
在这里插入图片描述