When Will You Arrive Estimating Travel Time Based on Deep Neural Networks

2024-01-08 22:10

本文主要是介绍When Will You Arrive Estimating Travel Time Based on Deep Neural Networks,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


1. 背景

这是一篇发表在2018AAAI上面的文章,其目的是通过对历史车辆轨迹的学习,然后用于预测车辆的通勤时间(Travel Time Estimation),也就是给定一条路径,然后预测从起点到终点所需要的时间。

在先前的论文中,对于一条路径travel time的预测主要有两种方式:Individual vs. Collective,也就是单独预测和整体预测。所谓单独预测就是将整个路径划分为若干个连续片段,并且预测每个部分的travel time,最后将所有的travel time相加作为整个路径的travel time。而整体预测则是直接预测整个travel time 不再进行分割。单独预测的优点在于能够准确的预测每个部分的travel time,但缺点在于不能够处理复杂的交通情况,例如包含十字路口、红绿灯、转向操作等;同时也不能很好的考虑到各个片段之间在空间和时间上的依赖关系。整体预测的缺点在于数据的稀疏性,因为预测路径越长,到后面轨迹点越少(对于这句话我也不是特别理解,原文如下:)。

However, as the length of a path increases, the number of trajectories traveling on the path decreases, which reduces the confidence of the travel time (derived from few drivers), pointing out that longer path is harder to estimate. Moreover, in many cases, there is no trajectory passing the entire path

因此,作者在这篇论文中选择的是将这两种方法结合起来。

接着,如图p0133(a)所示,在现实情况中每个轨迹的都可能伴随着不同的情况(直行、转弯、转向等)。而想要直接地来提取这些特征显然是困难的。同时,这些空间上的特征分布还伴随着时间上的变换。以图p0133(b)为例,在高峰时期,从主路上的速度快而辅路上的速度慢,因此从辅路进入主路耗时较多,从主路进入辅路耗时较少;而在非高峰时段,进入主路的时间会相对减少。其实还可以举出另外一个例子,在上下班高峰期和非高峰期,通过同一段路程的时间肯定是不一样的。

从作者的分析的确可以看出,这种轨迹数据的确在空间和时间上确实有着不同的特征分布,符合时空数据的特征。因此看到这儿,论文的所提出的模型中自然就是少不了CNN和RNN这两大利器了。可是该怎么通过CNN来刻画轨迹点空间上的特征呢?同样的,时序特征又该怎么用上(或者说套上)RNN呢? 我们知道,在以往的人流(订单需求)预测模型中,大多数都是进行网格划分,然后将轨迹点(需求量)映射到网格中,然后进行CNN处理。可是,在面对这种“点”与“点”之间有着序列关系的情况中显然是不能是这样。

2. 网络模型

整个网络结构如下图p1034所示,主要包括三个部分:主要部分(Spatio-Temporal Learning Component)以及两个部分(Attribute Component 和 Multi-task Learning Component)。

2.1 数据处理及问题定义
  • 数据处理:

    首先,将原始的GPS数据(以时间频率采样)重新以距离进行采样,相邻两个点之间的距离大约在200-400米。这样做的原因是为了避免这样一个问题:模型最终学到的映射只是通过简单的统计轨迹点的个数,然后乘以时间频率就得出了总的travel time,以至于无法预测新样本。最终,对于每个样本来说都是一串以距离采样的轨迹点序列( T = { p 1 , ⋯   , p T } T=\{p_1,\cdots,p_{T}\} T={p1,,pT});其中对于每个轨迹点包含的信息有:维度( p i . l a t p_i.lat pi.lat)、经度( p i . l n g p_i.lng pi.lng)和时间戳( p i . t s p_i.ts pi.ts),而对于一个样本来说,包含的信息有:天气编号(weatherID)、司机编号(driver ID)、周编号(weekID)和时间编号(timeID)。

    注:时间戳是指一个时间片(1天划分为1440个时间片,一分钟为一个时间片)

  • 问题定义:

    根据给定起点与终点(以及相关的external factors),然后预测整个所需的travel time。

2.2 Attribute Component

这部分主要是用来拟合一些额外的需要注意的因素,包括:天气编号(weatherID)、司机编号(driver ID)、周编号(weekID)和时间编号(timeID),如图p0135所示。同时,由于以上这4种类型的原始数据都是categorical value;因此,在处理的时候加入了Embedding方法,即每个类型值都将从 v ∈ [ V ] v\in[V] v[V]被映射为 R E × 1 R^{E\times 1} RE×1

同时,这部分还加入了另外一个比较重要的因素:起始地和目的地之间的距离 Δ d p a → p b \Delta d_{p_a\rightarrow p_b} Δdpapb。其计算规则为将 a , b a,b a,b两点之间所有的distance gap相加:
Δ d p a → p b = ∑ i = a b − 1 D i s ( p i , p i + 1 ) \Delta d_{p_a\rightarrow p_b}=\sum_{i=a}^{b-1}Dis(p_i,p_{i+1}) Δdpapb=i=ab1Dis(pi,pi+1)
最后,将各个部分的进行concatenate作为整个Attribute Component模块的输出,即向量 a t t r attr attr为输出。

2.3 Spatio-Temporal Component

这一部分作为整个网络模型的核心,主要分为两个部分如图p0136所示:Geo-Conv LayerRecurrent Layer。很明显,这两部分分别用来刻画数据空间上和时间上的特征分布。

  • Geo-Conv Layer

    如图p0137所示,该部分首先将一段包含有 T T T个点的轨迹坐标,经过一个非线性变换将每个点都映射成一个16维的向量。例 如:原始轨迹有12个点,也就是shape为[12,2]经过非线性变换后loc_i的shape为:[12,16].
    l o c i = t a n h ( W l o c ⋅ [ p i . l a t ∘ p i . l n g ] ) , l o c i ∈ R 16    , l o c ∈ R ∣ T ∣ × 16 loc_i=tanh(W_{loc} \cdot[p_i.lat\circ p_i.lng]),loc_i\in R^{16}\;,loc\in R^{|T|\times 16} loci=tanh(Wloc

这篇关于When Will You Arrive Estimating Travel Time Based on Deep Neural Networks的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/584989

相关文章

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

linux 下Time_wait过多问题解决

转自:http://blog.csdn.net/jaylong35/article/details/6605077 问题起因: 自己开发了一个服务器和客户端,通过短连接的方式来进行通讯,由于过于频繁的创建连接,导致系统连接数量被占用,不能及时释放。看了一下18888,当时吓到了。 现象: 1、外部机器不能正常连接SSH 2、内向外不能够正常的ping通过,域名也不能正常解析。

python内置模块datetime.time类详细介绍

​​​​​​​Python的datetime模块是一个强大的日期和时间处理库,它提供了多个类来处理日期和时间。主要包括几个功能类datetime.date、datetime.time、datetime.datetime、datetime.timedelta,datetime.timezone等。 ----------动动小手,非常感谢各位的点赞收藏和关注。----------- 使用datet

MonoHuman: Animatable Human Neural Field from Monocular Video 翻译

MonoHuman:来自单目视频的可动画人类神经场 摘要。利用自由视图控制来动画化虚拟化身对于诸如虚拟现实和数字娱乐之类的各种应用来说是至关重要的。已有的研究试图利用神经辐射场(NeRF)的表征能力从单目视频中重建人体。最近的工作提出将变形网络移植到NeRF中,以进一步模拟人类神经场的动力学,从而动画化逼真的人类运动。然而,这种流水线要么依赖于姿态相关的表示,要么由于帧无关的优化而缺乏运动一致性

QT Travel

Code Resource: https://github.com/MoreYoungGavin/QT_Travel.git What is QT? QT is a cross-platform application development framework for desktop,embedded and mobile. What need install QT before? Yo

A Comprehensive Survey on Graph Neural Networks笔记

一、摘要-Abstract 1、传统的深度学习模型主要处理欧几里得数据(如图像、文本),而图神经网络的出现和发展是为了有效处理和学习非欧几里得域(即图结构数据)的信息。 2、将GNN划分为四类:recurrent GNNs(RecGNN), convolutional GNNs,(GCN), graph autoencoders(GAE), and spatial–temporal GNNs(S

Deep Ocr

1.圈出内容,文本那里要有内容.然后你保存,并'导出数据集'. 2.找出deep_ocr_recognition_training_workflow.hdev 文件.修改“DatasetFilename := 'Test.hdict'” 310行 write_deep_ocr (DeepOcrHandle, BestModelDeepOCRFilename) 3.推理test.hdev

MACS bdgdiff: Differential peak detection based on paired four bedGraph files.

参考原文地址:[http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html](http://manpages.ubuntu.com/manpages/xenial/man1/macs2_bdgdiff.1.html) 文章目录 一、MACS bdgdiff 简介DESCRIPTION 二、用法

Neighborhood Homophily-based Graph Convolutional Network

#paper/ccfB 推荐指数: #paper/⭐ #pp/图结构学习 流程 重定义同配性指标: N H i k = ∣ N ( i , k , c m a x ) ∣ ∣ N ( i , k ) ∣ with c m a x = arg ⁡ max ⁡ c ∈ [ 1 , C ] ∣ N ( i , k , c ) ∣ NH_i^k=\frac{|\mathcal{N}(i,k,c_{

lua data time

local getTime = os.date(“%c”); 其中的%c可以是以下的一种:(注意大小写) %a abbreviated weekday name (e.g., Wed) %A full weekday name (e.g., Wednesday) %b abbreviated month name (e.g., Sep) %B full month name (e.g., Sep