FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯...

本文主要是介绍FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


导读

Triplet的两大问题,计算复杂度和噪声敏感,看看这篇文章如何用一种对Triple的近似的方法来解决这两大问题。


摘要

三元组损失是ReID中非常常用的损失, 三元组损失的主要问题在于其计算上非常贵,在大数据集上的训练会受到计算资源的限制。而且数据集中的噪声和离群点会对模型造成比较危险的影响。这篇文章要解决的就是这两个问题,提出了一种新的三元组损失,叫做fast-approximated triplet(FAT)损失,下面来看下这个损失具体是什么样的。

1. 介绍

上面说过,三元组损失的一个问题是计算量的问题,三元组的组合数量和样本数量是3次方的关系,这个数字是非常庞大的。而且,大量的三元组实际上是不重要的,也就是简单样本,对模型的优化其实是没什么用的。如果是随机采样的话,确实可以加速训练,但是容易不收敛,所以现在都会使用各种困难样本挖掘的方法。不过,这些困难样本挖掘的方法会产生采样的偏差,对于离群点会很脆弱。

本文的贡献:

  • 提出了FAT loss,提升了标准的triplet loss的效率。

  • 首次证明了处理了标注噪声可以进一步提升ReID的性能。通过分配soft label可以学到更鲁棒的特征。

  • 在三个数据集上证明了该方法的有效性。

2. 方法

2.1 Fast Approximated Triplet (FAT) Loss

FAT loss的推导如下:

我们首先有下面的三角不等式:

这个式子里,ca和cn是聚类中心。d是距离函数。

对于离群点,上界包含两项,p2s(点到集合)的距离,这个依赖于anchor点,再加上簇的内聚性的惩罚项,定义为最大簇的“半径”。我们最小化这个上界,就得到了FAT loss:

这个损失和完整的triplet loss的性能相当,当时效率高了很多。很明显可以看到,FAT loss的计算量对于数据集的大小是线性复杂度。

归一化的FAT Loss

做为一个margin loss,对于输入尺度是很敏感的。所以,往往会对输入特征进行归一化。这样就得到归一化的FAT loss:

这里,R‘类似于归一化的样本集的半径。实际上,我们发现,加上一个交叉熵loss会对训练更加稳定,这样就得到了混合loss:

簇中心的选择

FAT的簇中心的选择也是很有讲究的,有四个选择:1)簇特征的平均值,2)归一化的簇特征的平均值,3)簇特征的平均值的归一化,4)归一化的簇特征的平均值的归一化。具体如下:

可视化图:

实验表明,第4中方式,归一化的簇特征的平均值的归一化表现的最好。

2.1 噪声标签的蒸馏

ReID中的标签噪声主要3种类型:1)图像被分配到了错误的id类别中,2)图像不属于任何一种id类别,3)同一张图像同时存在多个标签。三元组损失对这些标签噪声是很敏感的。由于FAT loss用的是聚类中心,所以对于噪声点影响不会那么明显。我们以此提出了一种标签蒸馏的teacher-student模型。方法如下:

1、首先,用交叉熵,用分类的方式训练5个epochs,这里包括有噪声的数据。采用这种方式训练的网络对于简单的样本具有较高的置信度。

2、重新训练5个epochs,这次只使用那些置信度高的样本。

3、不断的重复上面的过程。

教师模型训练完了之后,使用教师模型的预测作为soft label来代替之前的hard label,然后使用FAT loss来训练学生模型。只有那些置信度高的样本才会参与计算聚类中心,如果使用了混合损失,soft label也会用作交叉熵的target。

3. 实验结果

FAT loss在几个数据集上的效果:

教师-学生网络的各自的效果:

论文链接:https://arxiv.org/pdf/1912.07863

代码链接:https://github.com/VITA-Group/FAT

或者在公众号后台回复:“FAT”,可下载打包好的论文和代码。

—END—

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧

这篇关于FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080732

相关文章

Java使用Curator进行ZooKeeper操作的详细教程

《Java使用Curator进行ZooKeeper操作的详细教程》ApacheCurator是一个基于ZooKeeper的Java客户端库,它极大地简化了使用ZooKeeper的开发工作,在分布式系统... 目录1、简述2、核心功能2.1 CuratorFramework2.2 Recipes3、示例实践3

SpringBoot日志配置SLF4J和Logback的方法实现

《SpringBoot日志配置SLF4J和Logback的方法实现》日志记录是不可或缺的一部分,本文主要介绍了SpringBoot日志配置SLF4J和Logback的方法实现,文中通过示例代码介绍的非... 目录一、前言二、案例一:初识日志三、案例二:使用Lombok输出日志四、案例三:配置Logback一

springboot security快速使用示例详解

《springbootsecurity快速使用示例详解》:本文主要介绍springbootsecurity快速使用示例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝... 目录创www.chinasem.cn建spring boot项目生成脚手架配置依赖接口示例代码项目结构启用s

Python实现无痛修改第三方库源码的方法详解

《Python实现无痛修改第三方库源码的方法详解》很多时候,我们下载的第三方库是不会有需求不满足的情况,但也有极少的情况,第三方库没有兼顾到需求,本文将介绍几个修改源码的操作,大家可以根据需求进行选择... 目录需求不符合模拟示例 1. 修改源文件2. 继承修改3. 猴子补丁4. 追踪局部变量需求不符合很

mysql出现ERROR 2003 (HY000): Can‘t connect to MySQL server on ‘localhost‘ (10061)的解决方法

《mysql出现ERROR2003(HY000):Can‘tconnecttoMySQLserveron‘localhost‘(10061)的解决方法》本文主要介绍了mysql出现... 目录前言:第一步:第二步:第三步:总结:前言:当你想通过命令窗口想打开mysql时候发现提http://www.cpp

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

MySQL INSERT语句实现当记录不存在时插入的几种方法

《MySQLINSERT语句实现当记录不存在时插入的几种方法》MySQL的INSERT语句是用于向数据库表中插入新记录的关键命令,下面:本文主要介绍MySQLINSERT语句实现当记录不存在时... 目录使用 INSERT IGNORE使用 ON DUPLICATE KEY UPDATE使用 REPLACE

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Python使用date模块进行日期处理的终极指南

《Python使用date模块进行日期处理的终极指南》在处理与时间相关的数据时,Python的date模块是开发者最趁手的工具之一,本文将用通俗的语言,结合真实案例,带您掌握date模块的六大核心功能... 目录引言一、date模块的核心功能1.1 日期表示1.2 日期计算1.3 日期比较二、六大常用方法详

Python使用DrissionPage中ChromiumPage进行自动化网页操作

《Python使用DrissionPage中ChromiumPage进行自动化网页操作》DrissionPage作为一款轻量级且功能强大的浏览器自动化库,为开发者提供了丰富的功能支持,本文将使用Dri... 目录前言一、ChromiumPage基础操作1.初始化Drission 和 ChromiumPage