【TripletTracking(ECCV2018)】论文阅读 Triplet Loss in Siamese Network for Object Tracking

本文主要是介绍【TripletTracking(ECCV2018)】论文阅读 Triplet Loss in Siamese Network for Object Tracking,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Triplet Loss in Siamese Network for Object Tracking 项目主页

写在前面

这篇文章发表在ECCV2018上,速度快,精度还行,但是个人感觉还是因为方法比较新才被接收的。这篇文章的思路其实很简单,很大的篇幅都是在解释triplet loss为什么管用,在这里就不详细描述这块内容,主要掌握一下思路,具体的公式以及可视化的比较可以去看论文。

Motivation

  • 一个动机是使用Siamese的动机,那些需要在线更新的tracker十分费时,所以才要用这种realtime的结构;
  • 另一个动机是本文是出发点:SiamFC虽然使用了比较好的特征,但是它没有充分利用样本直接的联系。

Contribution

  • 将三元组损失引入到SiamFC中,使得tracker更加具有分辨力;
  • 做了充分的公式推导,严谨得通过理论证明了为什么引入三元组损失管用

Algorithm

在这里插入图片描述
网络结构如上图,其实和SiamFC就是一样的,文章还特意把SiamFC使用的logistical损失也画了出来,从上图中也可以看到,logistical的损失一共有M+N中,这里的M是指正样本对,N是指负样本对的个数。也就是Triplet的损失一共有M×N种,而logistical的损失只有M+N中,这样的话肯定是Triplet利用到的信息更多。这个文章的网络结构和参数都和SiamFC一样,只是最后在损失函数上有了改变,所以速度和SiamFC几乎是一样的。

下面对比两个损失函数:
1、Logistical

L l ( Y , V ) = ∑ x i ∈ X w i l o g ( 1 + e − y i ⋅ v i ) L_l(Y,V) = \sum_{x_i \in X}w_ilog(1+e^{-y_i\cdot v_i}) Ll(Y,V)=xiXwilog(1+eyivi)
2、Triplet
L t ( V p , V n ) = − 1 M N ∑ i M ∑ j N l o g ( e v p i e v p i + e v n j ) L_t(V_p,V_n) = -\frac{1}{MN}\sum_{i}^M\sum_j^Nlog(\frac{e^{vp_i}}{e^{vp_i}+e^{vn_j}}) Lt(Vp,Vn)=MN1iMjNlog(evpi+evnjevpi)

其中Y表示ground truth, V表示样本 , V p V_p Vp表示正样本对, V n V_n Vn表示负样本对。

从两个损失函数中,我们也可以看出不同,第一个只是单纯的使用正样本对和负样本对,而第二个损失函数,正样本和负样本之间是有关系的,这样就充分利用了样本之间的一些联系。
这么做的意义就是希望当 v p &lt; v n v_p &lt;v_n vp<vn的时候,损失函数给出的梯度大,也就是强调了需要优化的地方。 文章中有一节是对比两个损失的梯度变化的,对这个做了详细的解释,感兴趣的可以去看文章。

Experiment

这是对比梯度的实验。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

总结

优点
  • 将三元组损失引入到SiamFC网络,使用的输入还是原始输入,特征提取过程都与SiamFC一样,只是在损失函数上面做了优化,但是在文章中试的三个tracker上效果都有提升;
  • 有很完善的证明过程,也做了可视化的对比,有比较扎实的理论基础。
缺点
  • 缺点的话就是SiamFC的一些缺点了吧,没有bbox回归,只在固定的search region里面搜索,目标reappear就不行了;
  • 相似性检测的方法可能对目标的表观变化比较敏感,缺少模板更新;
  • etc

这篇关于【TripletTracking(ECCV2018)】论文阅读 Triplet Loss in Siamese Network for Object Tracking的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/527224

相关文章

深入探讨Java 中的 Object 类详解(一切类的根基)

《深入探讨Java中的Object类详解(一切类的根基)》本文详细介绍了Java中的Object类,作为所有类的根类,其重要性不言而喻,文章涵盖了Object类的主要方法,如toString()... 目录1. Object 类的基本概念1.1 Object 类的定义2. Object 类的主要方法3. O

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟&nbsp;开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚&nbsp;第一站:海量资源,应有尽有 走进“智听

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

软件架构模式:5 分钟阅读

原文: https://orkhanscience.medium.com/software-architecture-patterns-5-mins-read-e9e3c8eb47d2 软件架构模式:5 分钟阅读 当有人潜入软件工程世界时,有一天他需要学习软件架构模式的基础知识。当我刚接触编码时,我不知道从哪里获得简要介绍现有架构模式的资源,这样它就不会太详细和混乱,而是非常抽象和易

BERT 论文逐段精读【论文精读】

BERT: 近 3 年 NLP 最火 CV: 大数据集上的训练好的 NN 模型,提升 CV 任务的性能 —— ImageNet 的 CNN 模型 NLP: BERT 简化了 NLP 任务的训练,提升了 NLP 任务的性能 BERT 如何站在巨人的肩膀上的?使用了哪些 NLP 已有的技术和思想?哪些是 BERT 的创新? 1标题 + 作者 BERT: Pre-trainin