本文主要是介绍MRA-BGCN 论文总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Multi-Range Attentive Bicomponent Graph Convolutional Network for Traffic Forecasting论文总结
作者:Weiqi Chen,Ling Chen et al. , Zhejiang University, Alibaba Group,
来源:AAAI 2020
1 论文背景动机
交通预测对交通管理和公共安全有重要意义,由于路网和交通条件的复杂时空依赖性和不确定性,准确预测较为困难。最新研究主要是通过在固定加权图中用GCN建模空间依赖关系,但该法存在问题:1)忽略路网边的相互作用;2)GCN只考虑一个range(对某个固定K-hops neighbors卷积)。
本文提出交通预测模型MRA-BGCN:1)根据路网距离建立节点图,根据边交互模式建立边图,用双组分图卷积分别对节点和边进行卷积;2)引入multi-range attention (k-hops)机制,在不同邻域range内聚合信息,学习不同range的权重;3)叠加多个BGCGRU(MRA-BGCN与GRU组成)层,用Seq2Seq结构进行多步交通预测,得出预测结果。
2 论文创新
2.1引入bicomponent图卷积分别建模节点和边的相关性。
2.2引入multi-range attention mechanism,在不同邻域range聚合信息,学习不同范围重要性。
3 论文模型
模型含两部分输入:node-wise网络和edge-wise网络,分别卷积,同时设计了一个multi-range的attention (k-hops),再用attention的方式考虑v各个hop之间的权重比,最后经过时序处理(RNN)之后输出。
交通预测问题目的是学习函数f,预测给定历史图形信号和图G
MRA-BGCN组成:双组分图卷积模块;多距离注意层。
3.1双组分图卷积模块
含节点图卷积层和边图卷积层,可建模节点和边的相互作用。
边间的相互影响,2类
流连接关系(Stream connectivity)边权重
竞争关系(Competitive relationship),边权重
K跳双组分图卷积:
3.2 multi-range attention
multi-range attention layer从多个邻域范围捕获集成表示。
1)对每层每个节点作共享线性变换。2)通过相似度计算每层注意系数;3)SoftMax对系数归一化。
multi-range attention mechanism(计算各跳权重):
计算每个节点在每层中表示的线性组合:
3.3 Bicomponent Graph Convolutional RNN
论文将MRA-BGCN与GRU(GRU中的完全连接层替换为MRA-BGCN)相结合,成为双组分图卷积GRU(BGCGRU)。空间卷积结果直接作为GRU输入
BGCGRU:
3.4 多步预测
下图,论文叠加几个BGCGRU层,用Sequence to Sequence结构进行多步交通预测:
4 论文实验
4.1 数据集
1)METR-LA:含从2012年3月1日到2012年1月30日交通速度统计数据,包括洛杉矶县高速公路上的207个传感器。
2)PEMS-BAY:包含从2017年1月1日到2017年5月31日交通速度统计数据,包括湾区的325个传感器。
说明:
- 采用与李亚光等人相同的数据预处理程序。
- 传感器每5分钟聚合一次观测结果。
- 用阈值高斯核的道路网络距离构造节点图邻接矩阵。
- 输入数据要先进行Z-score归一化。
- 两个数据集按时间顺序拆分,训练:验证:测试=7:1:2。
4.2 基线方法
HA:历史平均,它将交通流量建模为一个季节过程,并用以前的平均季节作为预测。时间设置为1周,预测是基于前几周的相同时刻交通数据。
ARIMAkal:有卡尔曼滤波的自动回归综合移动平均模型(Hamilton,1994)。
FC-LSTM:有完全连接的LSTM隐藏单元的递归神经网络(Sutskever等人,2014年)。
DCRNN:扩散卷积递归神经网络(Li等人,2018b),它将递归神经网络与扩散卷积结合起来,对流入和流出关系进行建模。
ST-GCN:空间时间图卷积网络(Yu等人,2018年),它将1D卷积与图卷积结合起来。
图波网:一种卷积网络体系结构(Wu等人,2019a),它引入一个自适应图来捕获隐藏的空间依赖,并使用扩展卷积来捕获时间依赖。
说明:对所有基于神经网络的方法,用基于验证集上性能的网格搜索选择最佳超参数。
4.3 实验设置
实验目标:用最后一小时的交通速度预测未来一个小时的交通速度。
BGCGRU层数为2,隐藏单元为64。
双组分图卷积的最大跳=3。
Adam优化训练模型,在100个epoch中最小化MAE,batch size=64。
初始lr=0.01,衰减率为每经过10个epoch减少为原来lr的0.6。
为更好泛化,使用scheduled sampling(Bengio等,2015年)和L2正则化。
4.4 度量指标
平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)。
4.5 实验结果
下表显示MRA-BGCN和基线模型在15分钟、30分钟和1小时前预测的性能,这些预测是从两个数据集上的12个预测层中选择。结果如下:
结论:MRA-BGCN在所有预测领域都达到最佳性能:显著优于传统交通预测方法(HA、ARIMAkal和FC-LSTM);明显优于DCRNN和ST-GCN(后二者在路网距离建立的固定加权图上执行GCN)。
这篇关于MRA-BGCN 论文总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!