本文主要是介绍Joint Tracking and Segmentation of Multiple Targets,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
来源:CVPR2015
创新点:(本文方法在降低IDs数量的同时,提升了10%的召回率)
在tracking-by-detection的方法中,一个明显的缺点是在图片序列中所获得的大部分信息通过阈值化的微弱的检测响应和非极大值抑制的使用被简单的忽略了。本文提出了一个多目标跟踪器,可以使用低层次的图像信息,把每个(超)像素关联到一个特定的目标或将该(超)像素分类为背景。因此,除了典型的边界框表示外,还获得了视频分割的结果。方法在拥挤环境下,有长期部件遮挡的情况下,效果优于极好的tracking-by-detection的方法。
贡献:
①提出一种新的CRF(conditional random field)模型,该模型利用了更多的图片信息,包括high-level的检测器响应和low-level的超像素信息。
②对未知数量的目标完全的自动分割和跟踪。
③在控制遮挡时,在每一个time step,有一种完整的状态表述。可以很好的控制遮挡。
我们知道,tracking-by -detection的方法已经成为解决MOT的重要方法。但是这类方法有一个缺点,就是在视频序列中大部分获得的信息被简单的通过NMS给ignored,而检测器可能由于遮挡等原因导致检测失败。所以本文提出,it is beneficial to consider all image evidence to handle tracking in crowded scenarios.旨在assign a unique target ID not only to each individual detection,but to every (super-)pixel in the entire video.这种low-level的信息可以帮助recover trajectories of largely occluded targets。
图像语义分割的任务就是从预先定义的集合中,给每个像素分配一个特殊的class label。这对于场景理解很重要,不过也可以用于MOT中。本文提出了一个统一的CRF模型来对多个目标进行联合跟踪与分割。与传统的只基于检测器的方法相比,我们的方法能够在拥挤的序列中improve the number of recovered trajectories,与此同时,获得分割的结果。
这篇关于Joint Tracking and Segmentation of Multiple Targets的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!