FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯...

本文主要是介绍FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


导读

Triplet的两大问题,计算复杂度和噪声敏感,看看这篇文章如何用一种对Triple的近似的方法来解决这两大问题。


摘要

三元组损失是ReID中非常常用的损失, 三元组损失的主要问题在于其计算上非常贵,在大数据集上的训练会受到计算资源的限制。而且数据集中的噪声和离群点会对模型造成比较危险的影响。这篇文章要解决的就是这两个问题,提出了一种新的三元组损失,叫做fast-approximated triplet(FAT)损失,下面来看下这个损失具体是什么样的。

1. 介绍

上面说过,三元组损失的一个问题是计算量的问题,三元组的组合数量和样本数量是3次方的关系,这个数字是非常庞大的。而且,大量的三元组实际上是不重要的,也就是简单样本,对模型的优化其实是没什么用的。如果是随机采样的话,确实可以加速训练,但是容易不收敛,所以现在都会使用各种困难样本挖掘的方法。不过,这些困难样本挖掘的方法会产生采样的偏差,对于离群点会很脆弱。

本文的贡献:

  • 提出了FAT loss,提升了标准的triplet loss的效率。

  • 首次证明了处理了标注噪声可以进一步提升ReID的性能。通过分配soft label可以学到更鲁棒的特征。

  • 在三个数据集上证明了该方法的有效性。

2. 方法

2.1 Fast Approximated Triplet (FAT) Loss

FAT loss的推导如下:

我们首先有下面的三角不等式:

这个式子里,ca和cn是聚类中心。d是距离函数。

对于离群点,上界包含两项,p2s(点到集合)的距离,这个依赖于anchor点,再加上簇的内聚性的惩罚项,定义为最大簇的“半径”。我们最小化这个上界,就得到了FAT loss:

这个损失和完整的triplet loss的性能相当,当时效率高了很多。很明显可以看到,FAT loss的计算量对于数据集的大小是线性复杂度。

归一化的FAT Loss

做为一个margin loss,对于输入尺度是很敏感的。所以,往往会对输入特征进行归一化。这样就得到归一化的FAT loss:

这里,R‘类似于归一化的样本集的半径。实际上,我们发现,加上一个交叉熵loss会对训练更加稳定,这样就得到了混合loss:

簇中心的选择

FAT的簇中心的选择也是很有讲究的,有四个选择:1)簇特征的平均值,2)归一化的簇特征的平均值,3)簇特征的平均值的归一化,4)归一化的簇特征的平均值的归一化。具体如下:

可视化图:

实验表明,第4中方式,归一化的簇特征的平均值的归一化表现的最好。

2.1 噪声标签的蒸馏

ReID中的标签噪声主要3种类型:1)图像被分配到了错误的id类别中,2)图像不属于任何一种id类别,3)同一张图像同时存在多个标签。三元组损失对这些标签噪声是很敏感的。由于FAT loss用的是聚类中心,所以对于噪声点影响不会那么明显。我们以此提出了一种标签蒸馏的teacher-student模型。方法如下:

1、首先,用交叉熵,用分类的方式训练5个epochs,这里包括有噪声的数据。采用这种方式训练的网络对于简单的样本具有较高的置信度。

2、重新训练5个epochs,这次只使用那些置信度高的样本。

3、不断的重复上面的过程。

教师模型训练完了之后,使用教师模型的预测作为soft label来代替之前的hard label,然后使用FAT loss来训练学生模型。只有那些置信度高的样本才会参与计算聚类中心,如果使用了混合损失,soft label也会用作交叉熵的target。

3. 实验结果

FAT loss在几个数据集上的效果:

教师-学生网络的各自的效果:

论文链接:https://arxiv.org/pdf/1912.07863

代码链接:https://github.com/VITA-Group/FAT

或者在公众号后台回复:“FAT”,可下载打包好的论文和代码。

—END—

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧

这篇关于FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080732

相关文章

检查 Nginx 是否启动的几种方法

《检查Nginx是否启动的几种方法》本文主要介绍了检查Nginx是否启动的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学... 目录1. 使用 systemctl 命令(推荐)2. 使用 service 命令3. 检查进程是否存在4

Java方法重载与重写之同名方法的双面魔法(最新整理)

《Java方法重载与重写之同名方法的双面魔法(最新整理)》文章介绍了Java中的方法重载Overloading和方法重写Overriding的区别联系,方法重载是指在同一个类中,允许存在多个方法名相同... 目录Java方法重载与重写:同名方法的双面魔法方法重载(Overloading):同门师兄弟的不同绝

MySQL字符串转数值的方法全解析

《MySQL字符串转数值的方法全解析》在MySQL开发中,字符串与数值的转换是高频操作,本文从隐式转换原理、显式转换方法、典型场景案例、风险防控四个维度系统梳理,助您精准掌握这一核心技能,需要的朋友可... 目录一、隐式转换:自动但需警惕的&ld编程quo;双刃剑”二、显式转换:三大核心方法详解三、典型场景

Java中ArrayList与顺序表示例详解

《Java中ArrayList与顺序表示例详解》顺序表是在计算机内存中以数组的形式保存的线性表,是指用一组地址连续的存储单元依次存储数据元素的线性结构,:本文主要介绍Java中ArrayList与... 目录前言一、Java集合框架核心接口与分类ArrayList二、顺序表数据结构中的顺序表三、常用代码手动

Python实现快速扫描目标主机的开放端口和服务

《Python实现快速扫描目标主机的开放端口和服务》这篇文章主要为大家详细介绍了如何使用Python编写一个功能强大的端口扫描器脚本,实现快速扫描目标主机的开放端口和服务,感兴趣的小伙伴可以了解下... 目录功能介绍场景应用1. 网络安全审计2. 系统管理维护3. 网络故障排查4. 合规性检查报错处理1.

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

《MySQL快速复制一张表的四种核心方法(包括表结构和数据)》本文详细介绍了四种复制MySQL表(结构+数据)的方法,并对每种方法进行了对比分析,适用于不同场景和数据量的复制需求,特别是针对超大表(1... 目录一、mysql 复制表(结构+数据)的 4 种核心方法(面试结构化回答)方法 1:CREATE

详解C++ 存储二进制数据容器的几种方法

《详解C++存储二进制数据容器的几种方法》本文主要介绍了详解C++存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::ve... 目录1.std::vector<uint8_t>(最常用)特点:适用场景:示例:2.std::arra

springboot中配置logback-spring.xml的方法

《springboot中配置logback-spring.xml的方法》文章介绍了如何在SpringBoot项目中配置logback-spring.xml文件来进行日志管理,包括如何定义日志输出方式、... 目录一、在src/main/resources目录下,也就是在classpath路径下创建logba

SQL Server中行转列方法详细讲解

《SQLServer中行转列方法详细讲解》SQL行转列、列转行可以帮助我们更方便地处理数据,生成需要的报表和结果集,:本文主要介绍SQLServer中行转列方法的相关资料,需要的朋友可以参考下... 目录前言一、为什么需要行转列二、行转列的基本概念三、使用PIVOT运算符进行行转列1.创建示例数据表并插入数

C++打印 vector的几种方法小结

《C++打印vector的几种方法小结》本文介绍了C++中遍历vector的几种方法,包括使用迭代器、auto关键字、typedef、计数器以及C++11引入的范围基础循环,具有一定的参考价值,感兴... 目录1. 使用迭代器2. 使用 auto (C++11) / typedef / type alias