FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯...

本文主要是介绍FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


导读

Triplet的两大问题,计算复杂度和噪声敏感,看看这篇文章如何用一种对Triple的近似的方法来解决这两大问题。


摘要

三元组损失是ReID中非常常用的损失, 三元组损失的主要问题在于其计算上非常贵,在大数据集上的训练会受到计算资源的限制。而且数据集中的噪声和离群点会对模型造成比较危险的影响。这篇文章要解决的就是这两个问题,提出了一种新的三元组损失,叫做fast-approximated triplet(FAT)损失,下面来看下这个损失具体是什么样的。

1. 介绍

上面说过,三元组损失的一个问题是计算量的问题,三元组的组合数量和样本数量是3次方的关系,这个数字是非常庞大的。而且,大量的三元组实际上是不重要的,也就是简单样本,对模型的优化其实是没什么用的。如果是随机采样的话,确实可以加速训练,但是容易不收敛,所以现在都会使用各种困难样本挖掘的方法。不过,这些困难样本挖掘的方法会产生采样的偏差,对于离群点会很脆弱。

本文的贡献:

  • 提出了FAT loss,提升了标准的triplet loss的效率。

  • 首次证明了处理了标注噪声可以进一步提升ReID的性能。通过分配soft label可以学到更鲁棒的特征。

  • 在三个数据集上证明了该方法的有效性。

2. 方法

2.1 Fast Approximated Triplet (FAT) Loss

FAT loss的推导如下:

我们首先有下面的三角不等式:

这个式子里,ca和cn是聚类中心。d是距离函数。

对于离群点,上界包含两项,p2s(点到集合)的距离,这个依赖于anchor点,再加上簇的内聚性的惩罚项,定义为最大簇的“半径”。我们最小化这个上界,就得到了FAT loss:

这个损失和完整的triplet loss的性能相当,当时效率高了很多。很明显可以看到,FAT loss的计算量对于数据集的大小是线性复杂度。

归一化的FAT Loss

做为一个margin loss,对于输入尺度是很敏感的。所以,往往会对输入特征进行归一化。这样就得到归一化的FAT loss:

这里,R‘类似于归一化的样本集的半径。实际上,我们发现,加上一个交叉熵loss会对训练更加稳定,这样就得到了混合loss:

簇中心的选择

FAT的簇中心的选择也是很有讲究的,有四个选择:1)簇特征的平均值,2)归一化的簇特征的平均值,3)簇特征的平均值的归一化,4)归一化的簇特征的平均值的归一化。具体如下:

可视化图:

实验表明,第4中方式,归一化的簇特征的平均值的归一化表现的最好。

2.1 噪声标签的蒸馏

ReID中的标签噪声主要3种类型:1)图像被分配到了错误的id类别中,2)图像不属于任何一种id类别,3)同一张图像同时存在多个标签。三元组损失对这些标签噪声是很敏感的。由于FAT loss用的是聚类中心,所以对于噪声点影响不会那么明显。我们以此提出了一种标签蒸馏的teacher-student模型。方法如下:

1、首先,用交叉熵,用分类的方式训练5个epochs,这里包括有噪声的数据。采用这种方式训练的网络对于简单的样本具有较高的置信度。

2、重新训练5个epochs,这次只使用那些置信度高的样本。

3、不断的重复上面的过程。

教师模型训练完了之后,使用教师模型的预测作为soft label来代替之前的hard label,然后使用FAT loss来训练学生模型。只有那些置信度高的样本才会参与计算聚类中心,如果使用了混合损失,soft label也会用作交叉熵的target。

3. 实验结果

FAT loss在几个数据集上的效果:

教师-学生网络的各自的效果:

论文链接:https://arxiv.org/pdf/1912.07863

代码链接:https://github.com/VITA-Group/FAT

或者在公众号后台回复:“FAT”,可下载打包好的论文和代码。

—END—

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧

这篇关于FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080732

相关文章

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

Pandas使用AdaBoost进行分类的实现

《Pandas使用AdaBoost进行分类的实现》Pandas和AdaBoost分类算法,可以高效地进行数据预处理和分类任务,本文主要介绍了Pandas使用AdaBoost进行分类的实现,具有一定的参... 目录什么是 AdaBoost?使用 AdaBoost 的步骤安装必要的库步骤一:数据准备步骤二:模型

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

使用Pandas进行均值填充的实现

《使用Pandas进行均值填充的实现》缺失数据(NaN值)是一个常见的问题,我们可以通过多种方法来处理缺失数据,其中一种常用的方法是均值填充,本文主要介绍了使用Pandas进行均值填充的实现,感兴趣的... 目录什么是均值填充?为什么选择均值填充?均值填充的步骤实际代码示例总结在数据分析和处理过程中,缺失数

Windows 上如果忘记了 MySQL 密码 重置密码的两种方法

《Windows上如果忘记了MySQL密码重置密码的两种方法》:本文主要介绍Windows上如果忘记了MySQL密码重置密码的两种方法,本文通过两种方法结合实例代码给大家介绍的非常详细,感... 目录方法 1:以跳过权限验证模式启动 mysql 并重置密码方法 2:使用 my.ini 文件的临时配置在 Wi

MySQL重复数据处理的七种高效方法

《MySQL重复数据处理的七种高效方法》你是不是也曾遇到过这样的烦恼:明明系统测试时一切正常,上线后却频频出现重复数据,大批量导数据时,总有那么几条不听话的记录导致整个事务莫名回滚,今天,我就跟大家分... 目录1. 重复数据插入问题分析1.1 问题本质1.2 常见场景图2. 基础解决方案:使用异常捕获3.

最详细安装 PostgreSQL方法及常见问题解决

《最详细安装PostgreSQL方法及常见问题解决》:本文主要介绍最详细安装PostgreSQL方法及常见问题解决,介绍了在Windows系统上安装PostgreSQL及Linux系统上安装Po... 目录一、在 Windows 系统上安装 PostgreSQL1. 下载 PostgreSQL 安装包2.

SQL中redo log 刷⼊磁盘的常见方法

《SQL中redolog刷⼊磁盘的常见方法》本文主要介绍了SQL中redolog刷⼊磁盘的常见方法,将redolog刷入磁盘的方法确保了数据的持久性和一致性,下面就来具体介绍一下,感兴趣的可以了解... 目录Redo Log 刷入磁盘的方法Redo Log 刷入磁盘的过程代码示例(伪代码)在数据库系统中,r

Python利用ElementTree实现快速解析XML文件

《Python利用ElementTree实现快速解析XML文件》ElementTree是Python标准库的一部分,而且是Python标准库中用于解析和操作XML数据的模块,下面小编就来和大家详细讲讲... 目录一、XML文件解析到底有多重要二、ElementTree快速入门1. 加载XML的两种方式2.

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)