本文主要是介绍视觉跟踪---MEEM算法--eccv14,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
参考文献:eccv14_(MEEM)_Robust Tracking via Multiple Experts using Entropy Minimization
文献及源码网址:点击打开链接
说明:本文按照文献中的内容,对文章进行梳理和评论;凡是有ps的地方,表示是博主自己的想法
【摘要】:作者提出一种称为multi-expert restoration scheme的方法,来解决跟踪中出现的模型漂移问题(model drift problem)
【简介】:
1 作者使用的是基于检测的框架(within a tracking-by-detection framework),也就是借助分类器来实现跟踪
2 作者介绍了model shift的一些原因:Model drift occurs because factors like tracking failure, occlusions and misalignment of training samples can lead to bad model updates
3 作者又指出,目前一些文献的解决方法,是给update增加一些判断机制,但是这些判断通常是基于目标运动和外形变化平滑的假设,所以在一些具有挑战性的场景下会失效,由此导致track 跟踪到背景,发生错误;(ps:所以需要非常具有鲁棒性的update判断机制,能够达到人类的判断能力)
4 作者在此基础上提出一种解决办法:能够在错误的update发生后,修正它,correct it;作者称之为multi-expert tracking framework
5 multi-expert tracking framework的原理:保存之前帧的一些tracker(总数不超过4个),组成一个专家组,对当前帧,专家组中的每一个tracker给出自己的预测结果,然后根据熵损失函数选择使用哪个tracker的预测结果,如果使用的不是当前帧的tracker,则将当前帧的tracker restore
6 损失函数:在监督学习领域,损失函数是计算预测值与标签之间的差值,但是在online tracking领域,是没有label的;所以作者使用的是参考文献10中提出的熵正则化优化函数(entropy-regularized optimization function),来作为损失函数,也就是据此来选择一个expert
7 作者的图1能很好的解释作者的思想:作者保存了250 300 350帧的tracker作为专家组的成员,然后根据损失函数计算374帧时4种tracker对374帧时红绿两个框的置信度分数,显然250帧时截取的目标,能够很好的区分red和green box,作者根据判决的明晰程度决定使用250帧的expert的预测结果
7 the base tracker:作者使用的是online SVM算法,参考的文献26,但是不明白作者说的employing compact prototype sets是什么意思;作者使用的是线性核,参考文献19使用的特征映射技术
8 作者总结了自己文章的贡献:在base tracker的基础上,使用了MEEM方法(MultiExpert Entropy Minimization (
这篇关于视觉跟踪---MEEM算法--eccv14的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!