域适应论文简读

2024-02-02 07:30
文章标签 论文 适应 简读

本文主要是介绍域适应论文简读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 2020
    • 1. An End-to-End Network for Remote Sensing Imagery Semantic Segmentation via Joint Pixel- and Representation-Level Domain Adaptation
    • 2. Class-Aware Domain Adaptation for Semantic Segmentation of Remote Sensing Images
    • 3. DOMAIN ADAPTATION ON SEMANTIC SEGMENTATION FOR AERIAL IMAGES
    • 4. StandardGAN
    • 5.FDA: Fourier Domain Adaptation for Semantic Segmentation

前言

基于深度学习的语义分割模型通过卷积操作提取图像局部区域的特征,周围像素的变化会对中心像素造成一定的影响。因此,多时相的遥感图像中植被、水体等显著的色彩差异以及建筑物本身的色彩不一致等均会导致语义分割精度下降,这会给遥感图像语义分割模型的泛化能力带来消极影响。具体来说,若存在有建筑物语义分割标签的遥感数据集A,称之为源域,与 A 区域相同、时相不同、无语义分割标签的遥感数据集B,称之为目标域。。用源域图像训练的语义分割权重直接预测目标域图像,由于两个域的色彩分布差异,其分割精度会下降。若目标域的数据重新制作标签进行训练,则需要耗费大量的人力与时间,效率低、成本高。

针对上述问题,域适应方法可以提高源域A语义分割模型的泛化能力,使其能够直接迁移到目标域B使用。

2020

1. An End-to-End Network for Remote Sensing Imagery Semantic Segmentation via Joint Pixel- and Representation-Level Domain Adaptation

摘要
在监督遥感图像分割中,需要逐像素的注释来获得足够的训练数据,这是一个非常耗时的过程。近年来,开发了一系列图像语义分割的领域适应方法。一般来说,这些方法在源域上进行训练,然后在目标域上进行验证,以避免重复标记新数据。然而,大多数领域自适应算法只试图在像素级或表示级中将源域和目标域对齐,而忽略了它们的合作。在本文中,我们提出了一种通过联合像素和表示级网络对齐来实现的无监督域自适应方法。JPR网络的主要新颖之处在于,它以端到端的方式实现了联合域自适应,从而避免了遥感图像中的多源问题。JPR网由两个分支组成,每个分支都是生成-对抗网络(GAN)。在一个分支中,像素级域适应通过循环GAN实现,可以将源域转移到目标域。在另一个分支中,通过对传输的源域图像和目标域图像之间的对抗性学习,实现了表示级的域的自适应。在公共数据集上的实验结果表明了JPR网络的有效性。
在这里插入图片描述

论文的贡献
JPR网络包含像素级和表示级的域自适应分支,每个分支都是一个GAN。在像素级分支中,域适应由cycle-GAN进行,它可以将图像样式从源域图像传输到需要迁移的源域图像。在另一个分支中,使用表示级自适应网络(RAN)来实现所传输的源域图像与目标域图像之间的域不变表示。我们的贡献总结如下:

  • 提出了一种遥感图像语义分割的域适应方法,可以在标记数据集上进行训练,并将其模型应用于另一个未标记数据集。
  • 我们构造了一个带有两个GAN的JPR网络,它可以同时以端到端的方式来训练像素级和表示级的分支。

2. Class-Aware Domain Adaptation for Semantic Segmentation of Remote Sensing Images

摘要
无监督域自适应(Unsupervised domain adaptation,UDA)对于遥感图像的语义分割是具有挑战性的,因为同一类的对象可能有不同的光谱,而不同一类的对象可能有相同的光谱。为了解决这个问题,我们提出了一种类感知生成对抗网络( class-aware generative adversarial network, CAGAN),用于多源遥感图像的UDA语义分割,它明确地建模了带标签的源域图像和没有标签的目标域图像之间的分类内和分类间的差异。具体地说,首先,为了增强全局领域对准(global domain alignment, GDA),我们提出了一种可转移的注意力对准( transferable attention alignment, TAA)程序,以在对抗性学习框架中添加更多的细粒度特征。然后,我们提出了一种新的语义分割中的类感知域对齐(class-aware domain alignment, CDA)方法。CDA主要包括两部分:第一部分是自适应类别选择,即缓解类不平衡,选择源和目标域中的可靠的每类别中心;第二部分是自适应类别对准,即建模仅源、仅目标、联合源和目标图像的类内紧凑性和类间可分离性。最后,CDA作为GDA的惩罚,以交替和迭代的方式训练GaGAN。在空间对空间、频谱到频谱方面的实验表明,CaGAN优于目前的方法,可以作为语义分割在跨空间和跨频谱遥感图像中综合应用的起点和基线。
在这里插入图片描述

论文的贡献
本文提出了CaGAN采用两种强大的技术:任务特定的分布对齐和CDA。GDA作为特定于任务的分割,可以通过添加更多的细粒度特征来加强GDA。此外,在不同领域学习每个类的相似原型,减少了类感知领域的差异,以实现类内的紧凑性和类间的可分离性。我们的具体贡献如下。

  • 提出了一种新的分类选择方案来缓解类不平衡,并选择可靠的分类中心进行UDA语义分割。
  • 提出了一种新的度量来减少类级域差异,以衡量类内紧凑性和源、源和目标数据的类间可分离性。
  • 开发了一种TAA方法,通过在对抗性学习框架中添加更多的细粒度特征(例如包含在更低层的细节)来加强GDA。
  • 提出了一种新的实用范式,CaGAN通过端到端渐近训练方案,用GDA和CDA来优化GAN。
  • 我们提出的方法在四个遥感数据集上得到了验证,包括两个高分辨率数据集后坝和维兴根,一个合成全色数据集和一个高光谱数据集帕维亚U集。四个数据集的结果证明了空间与空间、谱对谱、空间对空间和谱与谱的域适应的性能。实验结果表明,该方法的性能优于目前的现有方法。此外,通过消融研究也验证了CDA和GDA的有效性。

3. DOMAIN ADAPTATION ON SEMANTIC SEGMENTATION FOR AERIAL IMAGES

摘要
语义分割近年来取得了重大进展。虽然深度神经网络能很好地进行语义分割,但它们的成功依赖于像素级的监督,这既昂贵又费时。此外,由于不同域中的数据分布之间存在域差距,使用来自一个域的数据进行训练可能不能很好地推广到来自新域的数据。这种域间隙在遥感图像中特别明显,其中视觉外观取决于环境成像的类型、季节、天气和环境成像的时间。随后,当使用预先训练的分割模型来分析具有不同特征的新数据时,这种分布差距会导致严重的精度损失。在本文中,我们提出了一种新的无监督域自适应框架来解决空中语义图像分割中的域位移。为此,我们通过学习源域和目标域之间的软标签分布差异来解决域的位移问题。此外,我们还在目标域上应用熵最小化来产生高自信的预测,而不是使用通过假标记的高自信的预测。我们使用ISPRS的挑战图像分割数据集证明了我们的域自适应框架的有效性,并在各种度量方面显示了比最先进的方法的改进。
在这里插入图片描述
论文的贡献

  • 我们提出了一种简单而有效的端到端方法。与常见的具有对抗性且难以训练的方法相比,该方法并不是对抗性的。
  • 我们采用熵最小化来提高航空图像语义分割的目标域的低置信度预测。
  • 我们提出使用kl散度损失来调整源域和目标域的类分布来支持源域和目标域之间的外观差异。
  • 我们证明,当在标准的ISPRS分割挑战数据集上进行评估时,我们的方法能够减轻源域和目标域之间的域转移,并超过最先进的方法。

4. StandardGAN

摘要
最近,语义分割的域适应已被积极研究,以提高深度学习模型的泛化能力。绝大多数的领域自适应方法都是处理单源的情况,即在单一源域上训练的模型被适应于目标域。然而,这些方法具有有限的实际应用,因为通常有多个数据分布不同的源域。在本工作中,我们处理了多源域自适应问题。我们的方法,即标准算法,将每个源域和目标域进行标准化,使所有数据都具有相似的数据分布。然后,我们使用标准化源域来训练分类器并分割标准化目标域。我们在两个遥感数据集上进行了广泛的实验,第一个数据由来自一个国家的多个城市组成,另一个包含来自不同国家的多个城市。我们的实验结果表明,由标准化器生成的标准化数据允许分类器产生显著更好的分割。

论文的贡献
在这项工作中,我们提出了新的StandardGAN,它克服了上述所有的挑战。主要的贡献有三。首先,我们介绍了数据标准化在GAN中的使用。其次,我们提出了一个能够生成数据样本,而不提供来自相同或类似分布的数据。最后,我们提出将这种多源域适应方案应用于在多个地理位置收集的´数据的语义分割。

在这里插入图片描述

5.FDA: Fourier Domain Adaptation for Semantic Segmentation

摘要
我们描述了一种简单的无监督域自适应方法,即通过交换一个目标分布的低频谱来减少源分布和目标分布之间的差异。我们在语义分割中说明了这种方法,其中密集注释的图像在一个领域(例如,合成数据)很丰富,但在另一个领域中难以获得(例如,真实图像)。目前最先进的方法是复杂的,一些需要对抗性的优化,以使一个神经网络的主干不变的离散的区域选择变量。我们的方法不需要任何训练来执行域对齐,只是一个简单的傅里叶变换及其逆。尽管它很简单,但当它集成到一个相对标准的语义分割模型中时,它在当前的基准测试中实现了最先进的性能。我们的结果表明,即使是简单的程序也可以减少更复杂的方法难以学习的数据的讨厌变异性。

在这里插入图片描述

这篇关于域适应论文简读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/669914

相关文章

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

BERT 论文逐段精读【论文精读】

BERT: 近 3 年 NLP 最火 CV: 大数据集上的训练好的 NN 模型,提升 CV 任务的性能 —— ImageNet 的 CNN 模型 NLP: BERT 简化了 NLP 任务的训练,提升了 NLP 任务的性能 BERT 如何站在巨人的肩膀上的?使用了哪些 NLP 已有的技术和思想?哪些是 BERT 的创新? 1标题 + 作者 BERT: Pre-trainin

[论文笔记]LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

引言 今天带来第一篇量化论文LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale笔记。 为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。 大语言模型已被广泛采用,但推理时需要大量的GPU内存。我们开发了一种Int8矩阵乘法的过程,用于Transformer中的前馈和注意力投影层,这可以将推理所需

2024 年高教社杯全国大学生数学建模竞赛 C 题 农作物的种植策略 参考论文 无水印

持续更新中,2024年数学建模比赛思路代码论文都会发布到专栏内,只需订阅一次!  完整论文+代码+数据结果链接在文末!  订阅后可查看参考论文文件 第一问 1.1 问题重述 这个问题围绕的是华北山区的某乡村,在有限的耕地条件下,如何制定最优的农作物种植策略。乡村有 34 块露天耕地和 20 个大棚,种植条件包括粮食作物、蔬菜、水稻和食用菌。除了要考虑地块的面积、种植季节等,还要确保

论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes

论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes 优势 1、构建了一个用于监督原始视频去噪的基准数据集。为了多次捕捉瞬间,我们手动为对象s创建运动。在高ISO模式下捕获每一时刻的噪声帧,并通过对多个噪声帧进行平均得到相应的干净帧。 2、有效的原始视频去噪网络(RViDeNet),通过探

240907-Gradio插入Mermaid流程图并自适应浏览器高度

A. 最终效果 B. 示例代码 import gradio as grmermaid_code = """<iframe srcdoc='<!DOCTYPE html><html><head><meta charset="utf-8" /><meta name="viewport" content="width=device-width" /><title>My static Spa