Learning to Track: Online Multi-Object Tracking by Decision Making

2024-02-20 17:18

本文主要是介绍Learning to Track: Online Multi-Object Tracking by Decision Making,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

来源:ICCV2015

创新点:把在线MOT的问题看作是Markov决策的过程(MDP),一个目标的生存期用一个MDP来建模。学习一个用于数据关联的相似性函数等价于学习一个MDP的策略。这个MDP策略的学习方式是强化学习,能够充分利用在线学习和离线学习在数据关联方面的优势。此外,所提框架可以利用现存的在线单目标跟踪的方法,将目标的birth/deathappearance/disappearance看成是MDP的状态转换过程。

任何数据关联算法的基础是检测与目标之间的a similarity function。为控制关联的歧义性,把不同线索(外观、运动和位置)联合起来计算相似性是非常有用的。之前的算法依赖于启发式地为相似性函数选择参数模型,并且通过交叉验证调整这些参数,这不利于特征数量的扩展,也不能保证模型的泛化能力。

最近倡导为MOT注入学习能力。在离线学习中,学习是在真正的跟踪开始之前进行,离线运用gt学习一个检测与轨迹间用于数据关联的similarity function。离线学习是静态的,在数据关联中,不能考虑动态的变化和目标的history。而这些信息在解决歧义的时候是非常重要的,尤其是当目标再次出现,需要重新分配missed或者occluded目标的时候。相反,在线学习在整个跟踪的过程中进行学习。通常的方法是根据跟踪结果构建正负训练样本,then,为数据关联训练a similarity function。在线学习能够利用特征和目标的历史信息。然而并没有gt标注。所以,在线方法当在跟踪结果中有错误的时候,可能从错误的训练样本中学习,并且这些错误可以累积,导致跟踪drift

在本文中,作者把在线MOT的问题看成了MDP做决定的问题,一个目标的生存期由一个MDP建模,多个目标的跟踪就用多个MDPs建模。学习一个用于数据关联的相似性函数等价于学习一个MDP的策略。策略学习以强化学习的方式进行,在进行数据关联时,能够从在线学习和离线学习中获益。第一,学习是离线进行的,所以可以用到gt。第二,当跟踪在训练序列中的目标时,学习会发生。所以,MDP可以基于目标的当前状态和历史信息做决定。特别地,当给定一个目标的gt轨迹和一个初始化的相似函数时,MDP将会尝试着跟踪目标,并且从gt中收集反馈信息。根据这一反馈,MDP更新the similarity function来改进跟踪结果。这个similarity function只有当MDP在数据关联中犯错误的时候才会进行更新,这使得可以收集难例训练样本学习这一相似性函数。当MDP能够成功的跟踪到目标时,训练结束。

除了学习策略的优势,所提框架能够处理目标的birth/deathappearance/disappearance,方法是将他们看作MDP中的状态转换。本文方法可以从在线SOT方法中获利,为控制目标的检测失败,在线学习并且更新一个目标的外观模型。

这篇关于Learning to Track: Online Multi-Object Tracking by Decision Making的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/728945

相关文章

Deep Learning复习笔记0

Key Concept: Embedding: learned dense, continuous, low-dimensional representations of object 【将难以表示的对象(如图片,文本等)用连续的低维度的方式表示】 RNN: Recurrent Neural Network -> for processing sequential data (time se

多头注意力机制(Multi-Head Attention)

文章目录 多头注意力机制的作用多头注意力机制的工作原理为什么使用多头注意力机制?代码示例 多头注意力机制(Multi-Head Attention)是Transformer架构中的一个核心组件。它在机器翻译、自然语言处理(NLP)等领域取得了显著的成功。多头注意力机制的引入是为了增强模型的能力,使其能够从不同的角度关注输入序列的不同部分,从而捕捉更多层次的信息。 多头注意力机

Python: create object

# encoding: utf-8# 版权所有 2024 涂聚文有限公司# 许可信息查看:# 描述:# Author : geovindu,Geovin Du 涂聚文.# IDE : PyCharm 2023.1 python 3.11# Datetime : 2024/6/15 18:59# User : geovindu# Product :

【进阶篇-Day5:JAVA常用API的使用(Math、BigDecimal、Object、包装类等)】

目录 1、API的概念2、Object类2.1 Object类的介绍2.2 Object的toString()方法2.3 Object的equals()方法2.4 Objects概述 3、Math类4、System类5、BigDecimal类6、包装类6.1 包装类的概念6.2 几种包装类(1)手动转换包装类:(2)自动转换包装类:(3)Integet常用方法:(4)练习: 1

玩转Web之Json(四)---json与(Object/List/Map)的相互转化

在做web应用时,经常需要将json转化成Object/list/map或者将Object/List/map转化成json,通过简单封装可以在写代码是减轻很多负担。本文将给出json转化的一系列方法。 闲话不 多说,直接上代码: 先是Object /List /Map转化为Json /* 功能 :将一个对象转成json数组* 参数 :object对象* retu

【C++11 之新增容器 array、foward_list、tuple、unordered_(multi)map/set】应知应会

C++11 标准中新增了多个容器,这些容器为 C++ 程序员提供了更多的选择,以满足不同的编程需求。以下是对这些新容器的介绍和使用案例: std::array 介绍: std::array 是一个固定大小的数组容器,它在栈上分配内存,并提供了类似于标准库容器的接口。它提供了更好的类型安全性和范围检查,同时保持了与原生数组相似的性能。std::array 的大小必须在编译时确定,并且不能更改。

Elasticsearch java API (10)Multi Get API

Multi Get API编辑 多让API允许基于他们得到的文档列表 index, type和 id: MultiGetResponse multiGetItemResponses = client.prepareMultiGet().add("twitter", "tweet", "1") // <1> .add("twitter", "tweet

GIM: Learning Generalizable Image Matcher From Internet Videos

【引用格式】:Shen X, Yin W, Müller M, et al. GIM: Learning Generalizable Image Matcher From Internet Videos[C]//The Twelfth International Conference on Learning Representations. 2023. 【网址】:https://arxiv.or

Selenium使用Page Object实现页面自动测试

原文转自:https://blog.csdn.net/zhenyu5211314/article/details/13632083 Page Object模式是Selenium中的一种测试设计模式,主要是将每一个页面设计为一个Class,其中包含页面中需要测试的元素(按钮,输入框,标题等),这样在Selenium测试页面中可以通过调用页面类来获取页面元素,这样巧妙的避免了当页面元素id或者位置变

越复杂的CoT越有效吗?Complexity-Based Prompting for Multi-step Reasoning

Complexity-Based Prompting for Multi-step Reasoning 论文:https://openreview.net/pdf?id=yf1icZHC-l9 Github:https://github.com/FranxYao/chain-of-thought-hub 发表位置:ICLR 2023 Complexity-Based Prompting for