【SiamFC】《Fully-Convolutional Siamese Networks for Object Tracking》

2024-02-23 02:28

本文主要是介绍【SiamFC】《Fully-Convolutional Siamese Networks for Object Tracking》,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

ECCV 2016 Workshops


文章目录

  • 1 Background and Motivation
  • 2 Related Work
  • 3 Advantages / Contributions
  • 4 Method
  • 5 Experiments
    • 5.1 Datasets and Metrics
    • 5.2 The OTB-13 benchmark
    • 5.3 The VOT benchmarks
    • 5.4 Dataset size
  • 6 Conclusion(own)/ Future work


1 Background and Motivation

在这里插入图片描述

单目标跟踪

track any arbitrary object, it is impossible to have already gathered data and trained a specific detector

在线学习方法的缺点(either apply “shallow” methods (e.g. correlation filters) using the network’s internal representation as features or perform SGD (stochastic gradient descent) to fine-tune multiple layers of the network)

a clear deficiency of using data derived exclusively from the current video is that only comparatively simple models can be learnt.

实时性可能也是个问题

作者基于全卷积孪生网络,来实现单目标跟踪,且只要是目标检测的数据集,都可以拿来训练(the fairness of training and testing deep models for tracking using videos from the same domain is a point of controversy)

在这里插入图片描述

2 Related Work

  • train Recurrent Neural Networks (RNNs) for the problem of object tracking
  • track objects with a particle filter that uses a learnt distance metric to compare the current appearance to that of the first frame.
  • feasibility of fine-tuning from pre-trained parameters at test time

3 Advantages / Contributions

  • we equip a basic tracking algorithm with a novel fully-convolutional Siamese network trained end-to-end on the ILSVRC15 dataset for object detection in video

  • frame-rates beyond real-time

  • achieves state-of-the-art performance in multiple benchmarks

4 Method

在这里插入图片描述

f ( z , x ) = g ( φ ( z ) , φ ( x ) ) f(z, x) = g(\varphi(z), \varphi(x)) f(z,x)=g(φ(z),φ(x))

exemplar image z z z

candidate image x x x

在这里插入图片描述

g g g is a simple distance or similarity metric

φ \varphi φ 是孪生网络,结构如下

在这里插入图片描述
x 和 z 获取的细节(来自 pysot 代码)

在这里插入图片描述

更具体的公式如下

在这里插入图片描述

b L b \mathbb{L} bL denotes a signal which takes value b ∈ R b ∈ \mathbb{R} bR in every location

每个空间位置的 b 应该是相等的吧

损失函数

在这里插入图片描述
y 是标签,1 或者 -1

v 是 score map 上的得分(0-1)之间

在这里插入图片描述
u 是空间位置,D 是 score map
在这里插入图片描述
预测的bounding box 中心点位于 ground true bounding box 中心半径小于 R 区域的都属于正样本

c 是 GT bbox 的中心点

stride k of the network

训练的时候用的 SGD 优化

在这里插入图片描述

5 Experiments

50 epochs 50,000 sampled pairs

SiamFC (Siamese Fully Convolutional) and SiamFC-3s, which searches over 3 scales instead of 5.

scale 的细节不太清楚

5.1 Datasets and Metrics

训练集
ImageNet Video for tracking,4500 videos

测试集

  • ALOV
  • OTB-13
  • VOT-14 / VOT-15 / VOT-16

a tracker is successful in a given frame if the intersection over-union (IoU) between its estimate and the ground-truth is above a certain threshold

OTB上常用的3个:TRE、SRE、OPE

  • OPE:单次评估精度,TRE运行一次的结果。
  • TRE: 将序列划分为20个片段,每次是从不同的时间初始化,然后去跟踪目标。
  • SRE: 从12个方向对第一帧的目标位置设置10%的偏移量,然后跟踪目标,判断目标跟踪精度。

通用指标

  • OP(%): overlap precision 重叠率
    重叠率 = 重叠区域面积/(预测矩形的面积+真实矩形的面积-重叠区域的面积)
  • CLE(pixels): center location error 中心位置误差
    中心位置误差 = 真实中心和预测中心的欧式距离
  • DP:distance precision 精确度
  • AUC: area under curve 成功率z图的曲线下面积

VOT当中一些指标

  • Robustness:数值越大,稳定性越差。

5.2 The OTB-13 benchmark

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

5.3 The VOT benchmarks

VOT-14
在这里插入图片描述
VOT-15
在这里插入图片描述
在这里插入图片描述

5.4 Dataset size

在这里插入图片描述

看看实际的效果
在这里插入图片描述
缺点:框的 spatial ratio 是固定的

6 Conclusion(own)/ Future work

参考文章:

  • 视觉目标跟踪SiamFC
  • 单目标跟踪论文综述:SiamFC、Siam系列、GradNet等一览
  • 【目标跟踪线上交流会】第十五期 Pysot实验总结
  • SiamRPN代码解读–proposal selection部分
  • 单目标追踪-SiamFC

仅看文章,许多实现细节我都不够清晰,还是得撸撸代码

Deep Siamese conv-nets have previously been applied to tasks such as face verification, keypoint descriptor learning and one-shot character recognition

这篇关于【SiamFC】《Fully-Convolutional Siamese Networks for Object Tracking》的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/737230

相关文章

深入探讨Java 中的 Object 类详解(一切类的根基)

《深入探讨Java中的Object类详解(一切类的根基)》本文详细介绍了Java中的Object类,作为所有类的根类,其重要性不言而喻,文章涵盖了Object类的主要方法,如toString()... 目录1. Object 类的基本概念1.1 Object 类的定义2. Object 类的主要方法3. O

【Python报错已解决】AttributeError: ‘list‘ object has no attribute ‘text‘

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 前言一、问题描述1.1 报错示例1.2 报错分析1.3 解决思路 二、解决方法2.1 方法一:检查属性名2.2 步骤二:访问列表元素的属性 三、其他解决方法四、总结 前言 在Python编程中,属性错误(At

error while loading shared libraries: libnuma.so.1: cannot open shared object file:

腾讯云CentOS,安装Mysql时: 1.yum remove libnuma.so.1 2.yum install numactl.x86_64

java基础总结12-面向对象8(Object类)

1 Object类介绍 Object类在JAVA里面是一个比较特殊的类,JAVA只支持单继承,子类只能从一个父类来继承,如果父类又是从另外一个父类继承过来,那他也只能有一个父类,父类再有父类,那也只能有一个,JAVA为了组织这个类组织得比较方便,它提供了一个最根上的类,相当于所有的类都是从这个类继承,这个类就叫Object。所以Object类是所有JAVA类的根基类,是所有JAVA类的老祖宗

A Comprehensive Survey on Graph Neural Networks笔记

一、摘要-Abstract 1、传统的深度学习模型主要处理欧几里得数据(如图像、文本),而图神经网络的出现和发展是为了有效处理和学习非欧几里得域(即图结构数据)的信息。 2、将GNN划分为四类:recurrent GNNs(RecGNN), convolutional GNNs,(GCN), graph autoencoders(GAE), and spatial–temporal GNNs(S

Neighborhood Homophily-based Graph Convolutional Network

#paper/ccfB 推荐指数: #paper/⭐ #pp/图结构学习 流程 重定义同配性指标: N H i k = ∣ N ( i , k , c m a x ) ∣ ∣ N ( i , k ) ∣ with c m a x = arg ⁡ max ⁡ c ∈ [ 1 , C ] ∣ N ( i , k , c ) ∣ NH_i^k=\frac{|\mathcal{N}(i,k,c_{

王立平--Object-c

object-c通常写作objective-c或者obj-c,是根据C语言所衍生出来的语言,继承了C语言的特性,是扩充C的面向对象编程语言。它主要使用于MacOSX和GNUstep这两个使用OpenStep标准的系统,而在NeXTSTEP和OpenStep中它更是基本语言。Objective-C可以在gcc运作的系统写和编译,因为gcc含Objective-C的编译器。在MA

Complex Networks Package for MatLab

http://www.levmuchnik.net/Content/Networks/ComplexNetworksPackage.html 翻译: 复杂网络的MATLAB工具包提供了一个高效、可扩展的框架,用于在MATLAB上的网络研究。 可以帮助描述经验网络的成千上万的节点,生成人工网络,运行鲁棒性实验,测试网络在不同的攻击下的可靠性,模拟任意复杂的传染病的传

Convolutional Neural Networks for Sentence Classification论文解读

基本信息 作者Yoon Kimdoi发表时间2014期刊EMNLP网址https://doi.org/10.48550/arXiv.1408.5882 研究背景 1. What’s known 既往研究已证实 CV领域著名的CNN。 2. What’s new 创新点 将CNN应用于NLP,打破了传统NLP任务主要依赖循环神经网络(RNN)及其变体的局面。 用预训练的词向量(如word2v

【机器学习】生成对抗网络(Generative Adversarial Networks, GANs)详解

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 生成对抗网络(Generative Adversarial Networks, GANs)详解GANs的基本原理GANs的训练过程GANs的发展历程GANs在实际任务中的应用小结 生成对