Dense Structural Learning for Infrared Object Tracking - DSLT; 附UAV123_10fps和VIVID

本文主要是介绍Dense Structural Learning for Infrared Object Tracking - DSLT; 附UAV123_10fps和VIVID,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Dense Structural Learning for Infrared Object Tracking - DSLT: winner of VOT-TIR2017   

 

    在刚刚过去的VOT-TIR2017红外目标跟踪挑战赛中,我们的DSLT跟踪算法获得了冠军。为此,VOT组委会副主席Michael Felsberg教授邀请我去参加10月28日ICCV上举办的VOT-Workshop并作12分钟的报告另加3分钟的问答,但是因为没有来得及办下签证导致此次威尼斯旅行计划泡汤,有点可惜。

    由于组委会认为去年的TIR比赛结果并没有达到令人满意的高度,因此今年的TIR比赛依然沿用了去年的红外图像数据集,在比赛一开始官方就贴出了这样的通知:

    VOT-TIR2017竟然把SRDCFir作为baseline,确实有点吓人。看看VOT-TIR2015和VOT-TIR2016的比赛结果就知道了,SRDCFir老大的地位一直没人能撼动得了。。。所以这届的TIR比赛注定是寂寞的:相较于前两年20多个参赛算法,以及VOT2017(可见光(彩色)图像目标跟踪挑战赛)50多个参赛算法,今年的TIR比赛仅有10个参赛算法,而且其中有4个跟踪算法:EBT、SRDCFir、BST、LTFLO是参加过VOT-TIR2016的,因此今年TIR比赛新加入的算法只有6个。有点意思的是,上述4个算法在TIR2016和TIR2017的评分(EAO)不尽相同,这有多种可能的原因:(1)由于数据精度丢失或者一些因素的存在,导致不同的电脑运行相同的程序可能会给出不同的结果,但是这种变化应该是非常细微的;(2)今年的评测方法与往年有了些调整,vot-toolkit程序有了一些修改;(3)一些算法是有随机性的,结果无法完全复制,但是好的算法在不同时刻运行的结果应该相差不大;(4)各个参赛者可能会对以往的代码进行某些细微调整,比如调了参数、换个feature或者解决了一些程序上的bug等。

    我们拿到了今年的winner,但是并不是太值得高兴的事,因为参赛算法少,而且我们的综合评分并没有显著高于SRDCFir。比赛后我改掉了代码中的一个小小的bug,把EAO提高到了0.4018,即使如此,也没有太大意思。

    只是我参加VOT-TIR比赛并不是瞄着第一去的,我的目的原本是跟踪效果前三即可,然速度要做到最快。可惜今年的VOT比赛取消了往年常用的速度度量EFO,理由是官方认为EFO受到硬件性能的影响。我使用vot-toolkit的过程中,发现EFO确实与平台性能有关,但是EFO仍然具有借鉴意义:我在2.3GHz的笔记本上得出某个跟踪器的EFO为35,在一个4.2GHz的台式机上得到对应的EFO为50+,虽然有明显差别,但是仍然在1倍以内。我们在提交完比赛结果的第二天就把DSLT算法写成论文投给了PRLetter,现在已经在线出版了:Dense Structural Learning for InfraredObject Tracking at 200+ Frames Per Second. 我们在4.2GHz的win10台式机上进行试验,vot-toolkit给出的EFO是110,对比VOT-TIR2016的结果,我们的速度显然已经远远超出大部分跟踪算法了。然后我们在vot-tir2016所有序列上跑一遍,给出的平均跟踪速度是215FPS(单线程,没有omp,没有gpu)。最近,我们对代码进行了一些优化,EFO已经达到了160了。我们在论文中指出,DSLT平均每帧的计算量大概是DCF(使用线性核的KCF)的1.5倍,前提是二者使用相同大小的training/detection image以及相同的特征表示。

   参赛用的DSLT算法的Matlab mex文件(Ubuntu x64 & Windows 7/10 x64)已经上传到了我的csdn资源了:http://download.csdn.net/download/yu_xianguo/10142414。第三方依赖库只有FFTW(一个Fortran语言写的开源傅里叶变换库)。代码是工程用的,暂无开源打算。(ps:今天才发现csdn资源已经没有0分的选项了,最少下载分是2分,其实我要这分数没啥用,但是想下载资源的童鞋还是要搞点资源分才行。。。)

 

 

    下面介绍一下DSLT的基本原理:

 

这篇关于Dense Structural Learning for Infrared Object Tracking - DSLT; 附UAV123_10fps和VIVID的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/316217

相关文章

【Python报错已解决】AttributeError: ‘list‘ object has no attribute ‘text‘

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 前言一、问题描述1.1 报错示例1.2 报错分析1.3 解决思路 二、解决方法2.1 方法一:检查属性名2.2 步骤二:访问列表元素的属性 三、其他解决方法四、总结 前言 在Python编程中,属性错误(At

简单的Q-learning|小明的一维世界(3)

简单的Q-learning|小明的一维世界(1) 简单的Q-learning|小明的一维世界(2) 一维的加速度世界 这个世界,小明只能控制自己的加速度,并且只能对加速度进行如下三种操作:增加1、减少1、或者不变。所以行动空间为: { u 1 = − 1 , u 2 = 0 , u 3 = 1 } \{u_1=-1, u_2=0, u_3=1\} {u1​=−1,u2​=0,u3​=1}

简单的Q-learning|小明的一维世界(2)

上篇介绍了小明的一维世界模型 、Q-learning的状态空间、行动空间、奖励函数、Q-table、Q table更新公式、以及从Q值导出策略的公式等。最后给出最简单的一维位置世界的Q-learning例子,从给出其状态空间、行动空间、以及稠密与稀疏两种奖励函数的设置方式。下面将继续深入,GO! 一维的速度世界 这个世界,小明只能控制自己的速度,并且只能对速度进行如下三种操作:增加1、减

error while loading shared libraries: libnuma.so.1: cannot open shared object file:

腾讯云CentOS,安装Mysql时: 1.yum remove libnuma.so.1 2.yum install numactl.x86_64

java基础总结12-面向对象8(Object类)

1 Object类介绍 Object类在JAVA里面是一个比较特殊的类,JAVA只支持单继承,子类只能从一个父类来继承,如果父类又是从另外一个父类继承过来,那他也只能有一个父类,父类再有父类,那也只能有一个,JAVA为了组织这个类组织得比较方便,它提供了一个最根上的类,相当于所有的类都是从这个类继承,这个类就叫Object。所以Object类是所有JAVA类的根基类,是所有JAVA类的老祖宗

王立平--Object-c

object-c通常写作objective-c或者obj-c,是根据C语言所衍生出来的语言,继承了C语言的特性,是扩充C的面向对象编程语言。它主要使用于MacOSX和GNUstep这两个使用OpenStep标准的系统,而在NeXTSTEP和OpenStep中它更是基本语言。Objective-C可以在gcc运作的系统写和编译,因为gcc含Objective-C的编译器。在MA

[论文笔记]Making Large Language Models A Better Foundation For Dense Retrieval

引言 今天带来北京智源研究院(BAAI)团队带来的一篇关于如何微调LLM变成密集检索器的论文笔记——Making Large Language Models A Better Foundation For Dense Retrieval。 为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。 密集检索需要学习具有区分性的文本嵌入,以表示查询和文档之间的语义关系。考虑到大语言模

SQLSERVER排名函数RANK,DENSE_RANK,NTILE,ROW_NUMBER

SQL SERVER排名函数RANK,DENSE_RANK,NTILE,ROW_NUMBER 前言 本文意于用实例数据帮助理解SQL SERVER排名函数RANK,DENSE_RANK,NTILE,ROW_NUMBER。 准备工作 创建测试表:   ? 1 2 3 4 5 create table test( id int identity(1,1)

Learning Memory-guided Normality for Anomaly Detection——学习记忆引导的常态异常检测

又是一篇在自编码器框架中研究使用记忆模块的论文,可以看做19年的iccv的论文的衍生,在我的博客中对19年iccv这篇论文也做了简单介绍。韩国人写的,应该是吧,这名字听起来就像。 摘要abstract 我们解决异常检测的问题,即检测视频序列中的异常事件。基于卷积神经网络的异常检测方法通常利用代理任务(如重建输入视频帧)来学习描述正常情况的模型,而在训练时看不到异常样本,并在测试时使用重建误

Learning Temporal Regularity in Video Sequences——视频序列的时间规则性学习

Learning Temporal Regularity in Video Sequences CVPR2016 无监督视频异常事件检测早期工作 摘要 由于对“有意义”的定义不明确以及场景混乱,因此在较长的视频序列中感知有意义的活动是一个具有挑战性的问题。我们通过在非常有限的监督下使用多种来源学习常规运动模式的生成模型(称为规律性)来解决此问题。体来说,我们提出了两种基于自动编码器的方法,以