AI论文速读 | 2024[WWW]不只是路线:联合 GPS 和路线建模的轨迹表示学习

2024-04-04 16:28

本文主要是介绍AI论文速读 | 2024[WWW]不只是路线:联合 GPS 和路线建模的轨迹表示学习,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文标题:More Than Routing: Joint GPS and Route Modeling for Refine Trajectory Representation Learning

作者:Zhipeng Ma(麻志鹏), Zheyan Tu, Xinhai Chen, Yan Zhang, Deguo Xia, Guyue Zhou, Yilun Chen, Yu Zheng(郑宇), Jiangtao Gong(龚江涛)

机构:西南交通大学,清华大学智能产业研究院(AIR),百度,京东

论文链接:https://arxiv.org/abs/2402.16915

Cool Paper:https://papers.cool/arxiv/2402.16915

Youtube 3分钟Pre:https://www.youtube.com/watch?v=IA3quCF0LWM

TL, DR:这篇论文提出了一种名为JGRM的新型轨迹表示学习框架,通过结合GPS轨迹和路线建模,并利用自监督技术来提高轨迹数据的表示能力,从而在多个下游任务中取得了优于现有方法的性能。

关键词:轨迹表示学习,自监督,多模态融合


🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

Q: 这篇论文试图解决什么问题?

A: 这篇论文提出了一个新的轨迹表示学习框架(JGRM),旨在解决以下问题:

  1. GPS轨迹的噪声和冗余问题:传统的GPS轨迹处理方法通常关注于简化轨迹以过滤噪声,但这忽略了GPS数据中包含的运动细节,限制了轨迹表示学习的表现能力。
  2. 轨迹表示的泛化问题:早期的轨迹表示学习方法通常针对特定下游任务设计,并且使用特定任务的损失进行训练,这导致表示的泛化能力较差,难以适应其他任务。
  3. 轨迹表示的多模态融合问题:GPS轨迹和路线轨迹分别从不同的角度描述了移动行为,但现有的方法通常只关注单一类型的轨迹,没有充分利用两种轨迹的互补性。

为了解决这些问题,论文提出了一个基于自监督技术的联合GPS和路线建模的表示学习框架。该框架通过考虑GPS轨迹和路线轨迹作为单一移动观察的两种模式,并通过模态间信息交互来融合信息,以提高轨迹表示的质量和泛化能力。

路线建模 VS 聚合建模

如(a)所示,路线轨迹中的一个路段,只能通过之前后的路段进行建模,并且缺乏直接的自我观察(self-observation)。相比之下,GPS轨迹中的路段提供了更丰富的采样信息,允许对路段实体的细粒度表示。此外,路线轨迹中的路段上下文可以进一步细化道路表示。因此,路径轨迹与GPS轨迹的联合建模可以实现宏观和微观视角的有效结合

Q: 有哪些相关研究?

A: 论文中提到的相关研究可以分为以下几个类别:

  1. GPS轨迹表示学习
    • traj2vec:使用窗口方法对GPS轨迹进行时空约束,将每个窗口编码为序列中的一个标记。
    • t2vecNeuTrajT3S:通过使用离散化的栅格窗口处理原始轨迹,以获得相应的标记。
    • TrajCL:使用Douglas-Peucker算法简化轨迹,以在轨迹拓扑上构建窗口。
  2. 路线轨迹表示学习
    • PIMTrembrToast:认为道路网络限制了路线轨迹,并能自然地保持道路网络之间的空间关系。
    • ST2VecJCLRNTSTART:引入图编码器进行空间建模,通过道路网络结构进一步限制轨迹表示空间。
    • ToastPIMTrember:关注捕获路线轨迹中的时间关系,设计了不同的时间信息编码方法。
  3. 自监督学习任务设计
    • Word2vecNode2vec:使用自监督学习通过随机游走生成的序列来学习节点嵌入。
    • GAE(Graph Auto-Encoder):通过重构图的邻接矩阵来学习节点嵌入。
    • Traj2vec:使用seq2seq模型来学习轨迹表示。
    • START:结合旅行语义和时间连续性,设计了自监督任务来训练轨迹表示模型。
  4. 多模态信息融合
    • VLP(Vision-Language Pre-training):在视觉和语言预训练研究中,引入了共享变换器进行跨模态信息交互。

这些相关研究为论文提出的JGRM框架提供了理论基础和技术背景,特别是在轨迹表示学习、自监督学习任务设计以及多模态信息融合方面。JGRM框架通过结合这些研究成果,提出了一种新的轨迹表示学习方法,以提高轨迹数据的表示能力和泛化性。

Q: 论文如何解决这个问题?

JGRM

A: 论文通过提出一个名为JGRM(Joint GPS and Route Modeling)的新型表示学习框架来解决上述问题。JGRM框架的关键组成部分和解决策略如下:

  1. 双模态编码器
    • GPS编码器:使用分层的双向GRU(BiGRU)来处理GPS轨迹,通过嵌入相应的子轨迹并通过道路段分组引导来解决GPS轨迹中的冗余和噪声问题。
    • 路线编码器:利用基于道路网络的空间编码器(如GAT)和轻量级时间编码器(TE)来捕获路线轨迹中的时空相关性,并使用Transformer捕获路线轨迹的自相关性。
  2. 模态交互器
    • 设计了一个共享的Transformer作为模态交互器,用于融合来自GPS轨迹和路线轨迹的信息。这种方法允许两种轨迹模式在表示空间中相互对齐,从而提高表示的质量和泛化能力。
  3. 自监督学习任务
    • MLM(Mask Language Modeling):通过随机遮蔽轨迹中的路段,然后重建这些路段来提供监督信号。这种任务鼓励模型学习到更连续的时空表示。
    • CMM(Cross-Modal Matching):利用GPS轨迹和路线轨迹之间的自然配对关系,通过匹配任务来指导两种模态的表示空间对齐。
  4. 实验验证
    • 在两个真实世界的数据集(成都和西安)上进行了广泛的实验,验证了JGRM在道路段表示和轨迹表示任务上的有效性。实验结果表明,JGRM在各种设置下都优于现有方法。

通过这些策略,JGRM能够有效地结合GPS轨迹的详细运动信息和路线轨迹的旅行语义,从而提高轨迹表示的质量和泛化能力。此外,自监督学习任务的设计使得模型能够在无需特定下游任务标签的情况下进行训练,这为轨迹表示学习提供了一种新的训练范式。

GPS轨迹点与路段的矩阵映射关系,以求实现GPS编码器

Q: 论文做了哪些实验?

成都和西安数据集

成都实验

成都消融实验

西安实验

西安消融实验

A: 论文中进行了一系列的实验来验证JGRM框架的有效性和性能。以下是主要的实验内容:

  1. 实验设置
    • 使用了两个真实世界的数据集:成都和西安。
    • 数据集包含了GPS轨迹、路线轨迹和道路网络信息。
    • 实验将数据分为训练集、验证集和测试集,时间跨度为15天。
  2. 下游任务
    • 道路分类:区分不同类型的道路段。
    • 道路速度推断:估计每个道路段的平均速度。
    • 行程时间估计:基于路线轨迹估计行程时间。
    • Top-k相似轨迹查询:在数据库中找到与查询轨迹最相似的轨迹。
  3. 性能比较
    • 将JGRM与10种不同的方法进行了比较,这些方法包括随机初始化、基于图的轨迹表示学习、基于GPS的轨迹表示学习和基于路线的轨迹表示学习。
    • 使用了不同的评价指标,如准确率(Mi-F1和Ma-F1)、平均绝对误差(MAE)、均方根误差(RMSE)和命中率(MR和HR@10)。
  4. 消融实验
    • 对JGRM的不同组件进行了消融实验,以评估每个模块对模型性能的贡献。这包括移除MLM损失、Match损失、GPS分支、路线分支、时间信息、模态交互器、GAT和模态嵌入等。
  5. 预训练模型的有效性
    • 研究了预训练模型在不同数据集大小下的表现,以及预训练对模型性能的影响。
  6. 模型迁移性研究
    • 评估了JGRM在不同城市之间的迁移能力,包括零样本适应(Zero Shot Adaptation)和少样本微调(Few Shot Finetune)。
  7. 参数敏感性分析
    • 对关键超参数进行了敏感性分析,包括嵌入大小、路线编码器层数、模态交互器层数、遮蔽长度和遮蔽概率。
  8. 定性研究
    • 对模态交互器的输出进行了定性分析,以展示不同表示方法在道路段和轨迹表示空间中的表现。
  9. 案例研究
    • 通过案例研究,比较了JGRM和子优Node2vec方法在Top-k相似轨迹查询任务上的表现。

这些实验全面地评估了JGRM框架的性能,并与其他现有方法进行了比较,从而证明了JGRM在轨迹表示学习方面的优越性。

模型的容量(不同大小数据集)和迁移能力

预训练对于TTE问题的影响

案例分析

成都数据集中随机选择三个轨迹,并使用JGRM和次优的Node2vec分别获得top-k个相似轨迹查询的轨迹表示(Top-k similar Trajectory Query)。

其中三列分别代表前1、前3和前10的结果,奇数行表示JGRM的结果,偶数行表示Node2vec的结果。红色表示查询轨迹(query),绿色表示关键轨迹(key),蓝色代表查询结果。

结果表明,虽然基于图嵌入的方法对路段的变化很敏感,但它不能捕捉序列、时间和运动学信息。这意味着Node2vec不能区分两个彼此相反的轨迹,也不能区分在同一OD下不同时间的不同用户的轨迹。相比之下,JGRM对绕道行为更为敏感,并且能够捕捉到轨迹中的细微变化。

Q: 总结一下论文的主要内容

A: 这篇论文提出了一个名为JGRM(Joint GPS and Route Modeling)的新型轨迹表示学习框架,旨在通过结合GPS轨迹和路线轨迹的信息来提高轨迹数据的表示能力。以下是论文的主要内容总结:

  1. 问题背景:传统的GPS轨迹处理方法通常关注于简化轨迹以过滤噪声,但这忽略了GPS数据中包含的运动细节。此外,早期的轨迹表示学习方法通常针对特定下游任务设计,泛化能力较差。
  2. 方法提出:为了解决这些问题,论文提出了JGRM框架,它包含两个主要的编码器(GPS编码器和路线编码器)以及一个模态交互器。GPS编码器使用分层的双向GRU来处理GPS轨迹,而路线编码器则利用图神经网络(GAT)和时间编码器来捕获路线轨迹的时空相关性。模态交互器通过共享的Transformer来融合两种轨迹的信息。
  3. 自监督学习:为了训练模型,论文设计了两种自监督学习任务:Mask Language Modeling (MLM) 和 Cross-Modal Matching (CMM)。MLM通过随机遮蔽轨迹中的路段然后重建这些路段来提供监督信号,而CMM则利用GPS轨迹和路线轨迹之间的自然配对关系来指导表示空间的对齐。
  4. 实验验证:在成都和西安的真实世界数据集上进行了广泛的实验,包括道路分类、道路速度推断、行程时间估计和Top-k相似轨迹查询等下游任务。实验结果表明,JGRM在各种设置下都优于现有方法。
  5. 消融实验:通过消融实验,论文评估了JGRM中各个组件的贡献,证明了MLM任务在提高模型性能方面的重要性,以及联合建模GPS和路线轨迹的有效性。
  6. 模型迁移性:研究了JGRM在不同城市之间的迁移能力,包括零样本适应和少样本微调,展示了模型的泛化能力。
  7. 未来工作:论文提出了未来研究方向,包括动态道路状态表示、多源数据融合、跨领域迁移学习、可解释性和可视化、实时轨迹预测等。

PS和路线轨迹的有效性。
6. 模型迁移性:研究了JGRM在不同城市之间的迁移能力,包括零样本适应和少样本微调,展示了模型的泛化能力。
7. 未来工作:论文提出了未来研究方向,包括动态道路状态表示、多源数据融合、跨领域迁移学习、可解释性和可视化、实时轨迹预测等。

总的来说,JGRM框架通过创新地结合GPS和路线轨迹信息,并利用自监督学习任务,为轨迹表示学习提供了一种新的有效方法。

🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

这篇关于AI论文速读 | 2024[WWW]不只是路线:联合 GPS 和路线建模的轨迹表示学习的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/876270

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题

题库来源:安全生产模拟考试一点通公众号小程序 2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题是由安全生产模拟考试一点通提供,流动式起重机司机证模拟考试题库是根据流动式起重机司机最新版教材,流动式起重机司机大纲整理而成(含2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题参考答案和部分工种参考解析),掌握本资料和学校方法,考试容易。流动式起重机司机考试技

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业