HoMM: Higher-order Moment Matching for Unsupervised Domain Adaptation读书笔记

本文主要是介绍HoMM: Higher-order Moment Matching for Unsupervised Domain Adaptation读书笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文是AAAI收录的一篇文章,与以往方法不同,其提出要对高阶特征进行域匹配,下面就简要介绍一下其思路。

摘要

最大限度地减小不同域间特征分布的差异是无监督域自适应最有前途的方向之一。从分布匹配的角度来看,现有的基于离散度的方法大多是针对二阶或更低阶的统计量设计的,而这些方法对非高斯分布的统计特性的表达是有限的。在这项工作中,我们探讨了使用高阶统计量(主要指三阶和四阶统计量)进行域匹配的好处。提出了一种高阶矩匹配(HoMM)方法,并将其扩展到复制核希尔伯特空间(RKHS)。特别地,本文提出的HoMM可以进行任意阶矩张量匹配,并证明了一阶HoMM等价于MMD,二阶HoMM等价于CORAL。此外,三阶和四阶矩张量匹配有助于实现全面的域对齐,因为高阶统计量可以近似更复杂的非高斯分布。此外,我们还利用伪标记目标样本来学习目标域中的域不变表示,进一步提高了迁移性能。大量的实验表明,我们提出的HoMM算法与现有的矩匹配算法相比有很大的优越性。

介绍

从矩匹配的角度来看,现有的基于离散点的UDA方法大多是基于最大平均差(MMD)或相关对齐(CORAL),用于不同分布的一阶(均值)和二阶(协方差)统计。然而,在实际应用中(如图像识别),深度特征往往是一个复杂的非高斯分布,不能完全用一阶或二阶统计量来表征,因此,利用这一方法只能保证分布的粗拟合。为了解决这一局限性,本文提出通过匹配高阶矩张量(主要是三阶和四阶矩张量)来进行域对齐,因为高阶矩张量包含更多的描述固有信息,能够更好地表示特征分布。图1展示了高阶矩张量的计算方法,其中绘制了一个由三个不同的高斯分布组成的点云和不同阶矩张量的水平集。正如所观察到的,高阶矩张量更准确地描述了分布。
在这里插入图片描述
图一 利用高阶矩张量进行域对齐的度量。正如所观察到的现象一样,使用高阶矩匹配能更准确地捕捉云团的形状。

本文的贡献包括以下两点:(1)提出了一种基于高阶矩匹配(HoMM)的域偏差最小化方法,期望该方法能够实现细粒度的域对齐。HoMM将MMD和CORAL集成为一个统一的框架,将一阶和二阶矩匹配推广为高阶矩张量匹配。在没有附加条件的情况下,三阶矩和四阶矩匹配比所有现有的基于离散的方法都要好得多。(2)针对目标域上缺乏标记的问题,提出了通过对可靠目标样本分配伪标记来学习目标域上的判别聚类方法,从而提高了迁移性能。

方法

在这项工作中,我们考虑的是一个无监督域自适应问题。源域是有监督数据,目标域是无监督数据,目标把源域上训练的分类器迁移到目标域上。 在这里插入图片描述是深度神经网络的输出,并采用采用并流CNN结构进行无监督深度域自适应,如图二所示,源域与目标域的样本均共享相同的参数,并在最后一个全连接(FC)层进行域对齐。一个基本的域适应模型至少应该包括源域损失和域差异损失,其损失的基本表述为:
在这里插入图片描述
在这里插入图片描述 是源域的分类损失, 在这里插入图片描述是交叉熵损失函数,在这里插入图片描述 是域差异损失,如前所述,大多数存在的基于离散度的方法都是为了最小化二阶或更低的统计量。在这项工作中,提出了一种高阶矩匹配方法,它可以匹配不同域的高阶统计量。

高阶矩匹配

为了执行细粒度的域对齐,我们将高阶矩匹配表示为
在这里插入图片描述
在训练过程中,在这里插入图片描述
(b是每个batch的大小),在这里插入图片描述是适应层的激活输出。在这里插入图片描述在这里插入图片描述表征第i个样例的输出。L表示隐藏层的神经元个数。且
在这里插入图片描述在这里插入图片描述表示外积,而
在这里插入图片描述
当p>3时,在这里插入图片描述当p=1时,在这里插入图片描述转化为在这里插入图片描述一阶矩匹配等价于线性矩阵矩阵不等式。
当p=2时,二阶HoMM表示为
在这里插入图片描述在这里插入图片描述
是一个Gram矩阵,因此,二阶HoMM相当于Gram矩阵的匹配。当激活输出减去平均值归一化后,集中的Gram矩阵就变成协方差矩阵。从这个角度看,二阶HoMM也相当于CORAL,它匹配域匹配的协方差矩阵。
除了一阶矩匹配(如MMD)和二阶模态匹配(如CORAL和Gram矩阵匹配),我们提出的HoMM还可以在p≥3时进行高阶模态张量匹配。由于高阶统计量可以更好地刻画非高斯分布,因此应用高阶矩匹配可以实现细粒度的域对齐。但是高阶模态张量匹配的复杂度太高,这使得高阶运动匹配在许多实际应用中不可行。为了解决这个问题,本文提出了两种实用的技术来进行高阶张量匹配。

组匹配

随着神经元数目的增加,空间复杂度呈指数增长,一种可行的方法是将适应层中隐藏的神经元分成 在这里插入图片描述组,每一组为一个神经元群,其中神经元个数为在这里插入图片描述 。然后分别计算并匹配各组的高阶张量。此时损失函数为:
在这里插入图片描述

随机抽样匹配

当p=3/4时,组匹配可以凑效,但是p>5时,就会失去效果。因此,我们还提出了一种能够进行随机抽样匹配的策略。我们没有计算和匹配两个高维张量,而是随机选择高阶张量中的N个值,并且只计算和对齐源域和目标域中这N个值。此时的表达式是:

在这里插入图片描述 在这里插入图片描述为随机产生的位置指数矩阵,因此,在这里插入图片描述 表征表示p级张量中的一个随机采样值 在这里插入图片描述,这样相当于在高维向量中,随机抽取N个值,并使这N个值一一对应

希尔伯特空间里更高维特征匹配

此时在这里插入图片描述 在这里插入图片描述表示RKHS中的特征表示,根据所提出的随机抽样策略,域适应损失函数可以写成:
在这里插入图片描述

有区别聚类

当目标域特征与源域特征很好的匹配时,无监督域自适应问题就转化为半监督分类问题,已有大量工作尝试学习目标域中的判别聚类,其中大多数利用了熵正则化,以确保决策边界不跨越高密度数据区域
在这里插入图片描述
作者发现,当目标域具有较高的精度时,熵正则化的效果很好,但当测试精度不佳时,熵正则化的效果却很差,甚至降低了计算精度。其原因是由于熵的正则化使得某些误分类样本的概率过于自信,从而导致分类器被误导。本文提出了在共享特征空间中聚类的方法,而不是通过最小化条件熵的方法在输出层进行聚类。首先,选择目标域样例置信度比给定阈值高的样例,并给这些可靠的样本分配伪标签。然后,我们惩罚每个伪标记样本到其类中心的距离。判别聚类损失可表示为
在这里插入图片描述

由于我们是在小批量的基础上进行更新的,所以小样本无法准确地对中心进行定位。因此,我们在每次迭代中通过移动平均方法更新类中心。其表达式是:
在这里插入图片描述
在这里插入图片描述 是学习率,在这里插入图片描述 是第j类在第t次迭代的类中心,如果第i个样例属于第j类,在这里插入图片描述 ,否则为0。

损失函数

在此基础上,提出了一种融合(1)源域损耗最小化、(2)域对齐与高阶矩匹配和(3)目标域判别聚类的完备性方法,使无监督域自适应成为可能。完整的目标函数如下:
在这里插入图片描述

这篇关于HoMM: Higher-order Moment Matching for Unsupervised Domain Adaptation读书笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/338321

相关文章

《C++标准库》读书笔记/第一天(C++新特性(1))

C++11新特性(1) 以auto完成类型自动推导 auto i=42; //以auto声明的变量,其类型会根据其初值被自动推倒出来,因此一定需要一个初始化操作; static auto a=0.19;//可以用额外限定符修饰 vector<string> v;  auto pos=v.begin();//如果类型很长或类型表达式复杂 auto很有用; auto l=[] (int

读书笔记(一):双脑记

谁又知道年轻人那反复无常的大脑有着怎样的运行机制?尽管他们的大脑已被荷尔蒙折腾地七荤八素;却偶尔还会有灵感跻身夹缝之间; 层级化:每时每刻,人类都在进行抽象化,也就是说,从客观事实中发展出更具普遍意义的理论和知识。利用这种方法,我们得以不断地开发出新的更为简洁的描述层级,方便我们那容量有限的大脑加以处理。分层的概念几乎可以应用于任何复杂系统,甚至包括我们的社交世界,也即是人们的个人生

leetcode#10. Regular Expression Matching

题目 Implement regular expression matching with support for ‘.’ and ‘*’. '.' Matches any single character.'*' Matches zero or more of the preceding element.The matching should cover the entire input

2024.09.07【读书笔记】| SMRTLink工具对PB组装疑难解答

在使用SMRT Link的pb_assembly_hifi命令进行组装分析时,可以参考以下步骤和信息: 使用pbcromwell show-workflow-details pb_assembly_hifi命令查看该工作流的详细信息。这将帮助你了解所需的输入参数和可选输入参数。 根据工作流的要求,你需要准备相应的输入文件。例如,对于单样本基因组组装,需要CCS(连续测序)的fastq文件路径作

MapReduce算法 – 反转排序(Order Inversion)

译者注:在刚开始翻译的时候,我将Order Inversion按照字面意思翻译成“反序”或者“倒序”,但是翻译完整篇文章之后,我感觉到,将Order Inversion翻译成反序模式是不恰当的,根据本文的内容,很显然,Inversion并非是将顺序倒排的意思,而是如同Spring的IOC一样,表明的是一种控制权的反转。Spring将对象的实例化责任从业务代码反转给了框架,而在本文的模式中,在map

密码学读书笔记小结

密码学是保证消息的私密性和完整性以及消息认证的基础。加密算法的选择和密钥的管理是安全机制的效率、性能和可用性的关键。 公钥加密算法: 分发密钥比较容易,但是对大数据量的加密性能较差密钥加密算法: 更适合大批的加密任务混合型加密协议: 例如TLS,先用公钥加密建立一个安全通道,然后使用通道交换密钥,并将此密钥用于后续数据交换。 对分布式系统攻击的分类: 窃听: 未经授权获得消息副本伪装: 在未

兔子-(PHP 5.3 and above) Please set 'request_order' ini value to include C,G and P (recommended: 'CGP'

由于在PHP最新的版本中增加了一个配置项目“request_order”,默认值为“GP”,这个存在一定的安全风险。这里我们建议用户将配置更改为“CGP” 可以在php的安装目录下找到php.ini配置目录,找到下面选项: request_order = "GP"  更改为 request_order = "CGP"   重启服务器后即可。 此

《设计模式:可复用面向对象软件的基础》读书笔记(3)

这篇博客记录了书中《第3章:创建型模式》里的要点。 介绍 创建型设计模式抽象了实例化过程。 在这些模式中有两个不断出现的主旋律: 他们都将关于该系统使用哪些具体的类的信息封装起来。他们隐藏了这些类的实例是如何被创建和放在一起的。 整个系统关于这些对象所知道的是由抽象类所定义的接口。因此,创建型模式在什么被创建、谁创建它、它是怎样被创建的,以及何时被创建等方面给予你很大的灵活性。 下面将这

《程序员修炼之道》读书笔记(8):注重实效的项目

第8章:注重实效的项目 随着项目开动,我们需要从个体的哲学与编码问题,转向为项目级别的问题。 本章将讨论影响项目成败的几个关键区域。 41《注重实效的团队》 本书在先前讨论了帮助程序员个体更好的方法,这些方法对团队也有效。 下面将针对团队,来重述前面部分章节。 不要留破窗户。团队不应该容忍那些小小的、无人修正的不完美。煮青蛙。团队更容易被煮熟,因为每个人都觉得别人会在监视环境的变化。交流

GCDAsyncUdpSocket 使用时出现错误 Domain=NSPOSIXErrorDomain Code=13 Permission denied

完整的错误描述为: Domain=NSPOSIXErrorDomain Code=13 "Permission denied" UserInfo={NSLocalizedDescription=Permission denied, NSLocalizedFailureReason=Error in send() function.} 原始代码是这样的: clientBroadcast