AAAI2021论文速递:基于时空图扩散网络的交通流量预测

本文主要是介绍AAAI2021论文速递:基于时空图扩散网络的交通流量预测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、文章信息

《Traffic Flow Forecasting with Spatial-Temporal Graph Diffusion Network》。这是华南理工大学和京东数科合作发表在计算机顶级会议AAAI2021上的一篇文章。

2、摘要

在各种时空挖掘应用中,例如智能交通控制和公共风险评估,准确预测整个城市的交通流量一直发挥着至关重要的作用。尽管先前的工作已为学习交通时序动态和空间依赖性做出了巨大努力,但当前模型存在两个关键局限性:i)这些方法中的大多数仅专注于相邻区域之间的相邻空间相关性,而忽略了全局地理上下文信息;ii)这些方法无法对本质上具有时间依赖性和多分辨率的复杂流量转移规律进行编码。为了应对这些挑战,本文提出了一个新的交通流量预测框架-时空图扩散网络。特别地,ST-GDN是一种分层结构的图神经体系结构,它不仅从局部区域学习地理相关性,而且从全局角度学习空间语义。此外,本文中还开发了多尺度注意力网络以使ST-GDN具有捕获多级时间动态的能力。对四个真实交通数据集的实验表明,ST-GDN的性能优于其他类型的最新基准。

3、动机

在现实生活中,交通流模式通常是复杂且多周期的,因为每个单独的时间分辨率视图(例如,每小时,每天,每周)反映了来自不同时间维度的交通动态。所捕获的时间模式通常彼此互补。因此,学习交通变化模式的鲁棒表示需要具有不同时间分辨率的多个视图的协作。虽然递归网络在各种时空序列预测任务上均取得了良好的性能,但它们仅对短期,平稳的动力学有效,并且几乎无法在高阶多维时间范围内进行预测。

当前大多数的预测方法只专注于对邻近的地理相关性进行建模,而忽略了全局背景下的跨区域相互依赖性。例如,具有相似城市功能的两个地理区域(例如,购物区或交通枢纽)可以在交通分布方面相互关联,尽管它们在空间上并不相邻,甚至彼此相隔遥远。因此,没有全局级别的交通转移信息的学习的区域范围的关系结构不仅不能提炼局部的地理依存关系,而且还不足以提炼跨区域的语义关系,从而得到次优的预测。

为了解决上述挑战,论文中针对区域特定的交通流量提出了一种新的预测框架时空图扩散网络。在ST-GDN中开发了一个多尺度的自注意力网络来研究跨各种时间分辨率的多粒度时间动态,以便对交通转移规律的时间层次进行编码。为了促进不同分辨率的时间表示形式之间的协作,提出了一个聚合层来跨多级时间动态模型对基础依赖性进行建模。另外,通过注意力图扩散范例开发的分层图神经网络使ST-GDN能够以联合方式将空间语义从局部级别的空间邻近关系合并到整个城市的全局级别的交通模式表示。

4、模型

论文中图1介绍了本文中提出模型ST-GDN的框架,如下所示。它主要由时间层次建模,全局背景下的交通依赖学习,图扩散范式的区域关系学习,跨分辨率模式聚合四个模块组成。接下来分别对这几个主要模块做详细介绍。

(1)时间层次建模模块

论文中首先提出一个多尺度的自注意力网络,以将多级时间信号共同映射为共同的潜在表示,以捕获复杂的交通模式。这里的多尺度时间信息与经典交通预测模型ST-ResNet一样,分别整理为邻近性信息(最近几个小时的信息),周期性信息(前一天同时间片的信息),趋势性信息(前一周同时间片的信息)。

给定每个时间分辨率p,可以生成分辨率感知流量序列,其中Tp是具有p分辨率的相应流量序列长度。然后提出了一种自注意网络来从时间维度对流量变化模式进行编码。特别的,论文中的编码器是基于自注意力机制构建的:

其中查询Q,键K和值V矩阵都是由交通流量序列本身映射而成的张量。

(2)      全局背景下的交通依赖学习模块

此步骤的目标是根据动态流量转移模式来利用不同区域之间的全局级别依赖性。首先定义一个区域图G =(R,E),其中R是区域集,E表示两个空间区域之间的成对关系。这篇论文中开发了一种注意力聚集机制来捕获区域之间的局部和全局流量依赖关系。具体来说,通过以下注意的操作在图上执行消息聚合:

代表不同区域之间的特征消息传递机制。在这里,应用了多头注意力机制以捕获来自不同学习子空间的区域关系语义。此外是参数化投影矩阵。潜在的注意力相关性参数矩阵 如下所示:

到这里可以看出来这个模块中最本质的还是图注意力网络(GAT)。得到注意力矩阵后,通过消息传递机制输出graph embedding:

本文中还应用了多阶信息聚合的trick。具有高阶关系建模的从GAT的第(l)层到第(l +1)层的信息聚合表示为:

Propagate(·)和Aggregate(·)分别表示消息构造和信息融合。最后生成区域的全局级表示 :

(3)      图扩散范式的区域关系学习模块

除了在不同区域的流量演变模式方面具有全局依赖性外,还需要将区域之间的空间关系纳入了预测框架。特别是,论文中开发了一种图结构化扩散网络,以从图注意模块中完善学习到的分辨率感知区域表示。我们生成另一个区域关系图Gs =(Rs,Es,A),该图共同保留了地理相邻关系(K个相邻区域)和高流量相关性(较大的值)。A表示由顶点距离函数加权的相邻矩阵。在这里,我们定义Do = A·I来表示出对角线对角矩阵,其中I是Gs的单位矩阵。设计的扩散卷积运算在图G中的每个顶点上执行扩散过程,以生成新的特征表示,如下所示:

(4)      跨分时间辨率模式聚合模块

最后通过引入门控机制来汇总可感知分辨率的流量表示。具体来说,文中的门控聚合机制会对多时间分辨率流量模式表示形式进行基于参数矩阵的和运算:

在此可训练的变换矩阵表示为Wh,Wd和Ww,分别对应于每小时,每天和每周的模式。最后生成整合性的多分辨率流量表示,它保留了流量模式的多粒度时间层次。

5、实验结果

论文中使用了四个数据集,分别是BJ-Taxi ,NYC-Taxi,NYC-Bike-1和NYC-Bike-2,将ST-GDN与多种baseline方法进行了比较。这篇论文中把baseline方法分为了传统时间序列模型,传统混合学习模型,循环时空预测模型,基于卷积的交通预测模型,卷积循环预测模型,图神经网络模型,深度混合预测模型几大类,全方位验证了新模型的有效性。

6、创新点

这项工作通过提出一种基于新架构(ST-GDN)的图神经网络来研究交通预测问题。具体来说,它首先设计了一个分辨率感知的自注意网络以对多级时间信号进行编码。然后跨通过依次学习不同区域的局部空间上下文信息和全局交通依赖关系随后被整合以增强时空模式表示。

这篇关于AAAI2021论文速递:基于时空图扩散网络的交通流量预测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/551297

相关文章

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络 服务器端配置 在服务器端,你需要确保安装了必要的驱动程序和软件包,并且正确配置了网络接口。 安装 OFED 首先,安装 Open Fabrics Enterprise Distribution (OFED),它包含了 InfiniBand 所需的驱动程序和库。 sudo

【机器学习】高斯网络的基本概念和应用领域

引言 高斯网络(Gaussian Network)通常指的是一个概率图模型,其中所有的随机变量(或节点)都遵循高斯分布 文章目录 引言一、高斯网络(Gaussian Network)1.1 高斯过程(Gaussian Process)1.2 高斯混合模型(Gaussian Mixture Model)1.3 应用1.4 总结 二、高斯网络的应用2.1 机器学习2.2 统计学2.3