本文主要是介绍libcity笔记:支持的数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
数据下载地址:Standard Dataset in LibCity - Google 云端硬盘
1 交通速度数据
数据名称 | 地点 | 时间 | 出处 | 描述 |
METR_LA | 美国洛杉矶 | Mar. 1, 2012 ~ Jun. 27, 2012 | GitHub - liyaguang/DCRNN: Implementation of Diffusion Convolutional Recurrent Neural Network in Tensorflow | 由环路探测器在高速公路上收集,包含来自 207 个传感器的交通速度数据 |
LOS_LOOP | 美国洛杉矶 | Mar. 1, 2012 ~ Jun. 27, 2012 | https://github.com/lehaifeng/T-GCN/tree/master/data | 与METR LA略有不同,缺失值通过线性插值得到补充 |
PEMS | 美国加州 | 2001 ~ present | http://pems.dot.ca.gov | 记录加利福尼亚高速公路的速度数据,包括时间小时,平均时间,车道点 |
PEMSD3 | 美国加州3区 | Sept. 1, 2018 ~ Nov. 30, 2018 | GitHub - Davidham3/STSGCN: AAAI 2020. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data Forecasting | PeMSD3 数据集包括 358 个传感器和流量信息 |
PEMSD4 | 美国加州湾区 | Jan. 1, 2018 ~ Feb. 28, 2018 | ASTGCN-2019-mxnet/data/PEMS04 at master · Davidham3/ASTGCN-2019-mxnet · GitHub | 包含29条道路上的3848个传感器 |
PEMS_BAY | 美国加州湾区 | Jan. 1, 2017 ~ Jun. 30, 2017 | GitHub - liyaguang/DCRNN: Implementation of Diffusion Convolutional Recurrent Neural Network in Tensorflow | 包含6个月的交通速度统计数据,包括325个传感器 |
PEMSD7 | 美国加州7区 | Jul. 1, 2016 ~ Aug. 31, 2016 | GitHub - Davidham3/STSGCN: AAAI 2020. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data Forecasting | 包含883个传感器站的交通流量信息 |
PEMSD7(M) | 美国加州7区 | the weekdays of May and June of 2012 | STGCN/datasets at master · Davidham3/STGCN · GitHub | 述了加州第7区228个站点的高速公路速度信息 |
PEMSD8 | 美国加州San Bernardino | Jul. 1, 2016 ~ Aug. 31, 2016 | ASTGCN-2019-mxnet/data/PEMS08 at master · Davidham3/ASTGCN-2019-mxnet · GitHub | 数据来自8条公路上的1979个传感器 |
LOOP_SEATTLE | 美国西雅图 | 2015 全年 | https://github.com/zhiyongc/Seattle-Loop-Data | 由部署在西雅图地区高速公路(I-5、I-405、I-90和SR-520)上的感应环路探测器收集,包含来自323个传感器站的交通状态数据 |
Q_TRAFFIC | 中国北京 | Apr. 1, 2017 ~ May 31, 2017 | GitHub - JingqingZ/BaiduTraffic: This repo includes introduction, code and dataset of our paper Deep Sequence Learning with Auxiliary Information for Traffic Prediction (KDD 2018). | Q-Traffic 数据集包含三个子数据集:查询子数据集、交通速度子数据集和路网子数据集 |
SZ_TAXI | 中国深圳 | Jan. 1, 2015 ~ Jan. 31, 2015 | https://github.com/lehaifeng/T-GCN/tree/master/data | 包含深圳市的出租车轨迹,包括道路邻接矩阵和道路交通速度信息 |
M_DENSE | 西班牙马德里 | Jan. 1, 2018 - Dec. 21, 2019 | GitHub - rdemedrano/crann_traffic: A Spatio-Temporal Spot-Forecasting Framework for Urban Traffic Prediction | 包含马德里市交通测量的历史数据。在每个点每 15 分钟进行一次测量,包括每小时汽车数量的交通强度 |
ROTTERDAM | 荷兰鹿特丹 | 135 days of 2018 | https://github.com/RomainLITUD/DGCN_traffic_forecasting | 包含 208 条链路的交通状态信息 |
2 地铁数据(偏OD)
数据名称 | 地点 | 时间 | 出处 | 描述 |
SHMETRO | 中国上海 | Jul. 1, 2016 - Sept. 30, 2016 | GitHub - ivechan/PVCGN: code for "Physical-Virtual Collaboration Graph Network for Station-Level Metro Ridership Prediction" | 基于中国上海的地铁系统构建的。 2016年7月1日至2016年9月30日,共收集8.118亿笔交易记录,日客流量882万人次 |
BEIJING_SUBWAY | 中国北京 | Feb. 29, 2016 - Apr. 3, 2016 | GitHub - JinleiZhangBJTU/ResNet-LSTM-GCN: Code for Deep-learning Architecture for Short-term Passenger Flow Forecasting in Urban Rail Transit | 连续五周的05:00-23:00从北京地铁采集的数据。 截至2016年3月北京共有17条线路和276个地铁站(不包括机场快线及其上的车站) |
HZMETRO | 中国杭州 | Jan. 1, 2019 - Jan. 25, 2019 | GitHub - ivechan/PVCGN: code for "Physical-Virtual Collaboration Graph Network for Station-Level Metro Ridership Prediction" | 根据 2019 年 1 月收集的杭州地铁系统交易记录创建的。该系统拥有 80 个运营站点和 248 个边,每天有 235 万乘客 |
NYCTAXI_DYNA | 美国纽约 | 用不规则区域划分方法统计区域流入流出的数据集 源自下面的NYCTAXI | ||
NYCTAXI_OD | 美国纽约 | 它使用不规则区域划分方法计算区域之间的起点-终点流量 源自下面的NYCTAXI | ||
NYCTAXI_GRID | 美国纽约 | 用基于网格的划分方法计算区域的流入和流出 源自下面的NYCTAXI | ||
NYC_TOD | 美国纽约 | 2014 | GitHub - liulingbo918/CSTN: Taxi Origin-Destination Demand Prediction | 使用基于网格的划分方法计算区域的流入和流出 |
3 轨迹数据
数据名称 | 地点 | 时间 | 出处 | 描述 |
TAXIBJ | 中国北京 | Jul. 1, 2013 ~ Oct. 30, 2013, Mar. 1, 2014 ~ Jun. 30, 2014, Mar. 1, 2015 ~ Jun. 30, 2015 Nov. 1, 2015 ~ Apr. 10, 2016 | 数据地址失效 · Issue #3 · TolicWang/DeepST · GitHub | 包含出租车 GPS 数据,包括人流、气象和节假日信息 |
T_DRIVE | 中国北京 | Feb. 2, 2008 ~ Feb. 8, 2008 | T-Drive trajectory data sample - Microsoft Research | 包含10357辆北京出租车的每周轨迹约1500万个点,轨迹总距离达到900万公里 |
PORTO | 葡萄牙波尔图 | Jul. 1, 2013 ~ Jun. 30, 2014 | https://archive.ics.uci.edu/ml/datasets/Taxi+Service+Trajectory+-+Prediction+Challenge%2C+ECML+PKDD+2015 | 描述了在葡萄牙波尔图市运行的所有 442 辆出租车所执行的轨迹 |
NYCTAXI | 美国纽约 | 2009 ~ present | TLC Trip Record Data - TLC | 包含 GPS 为纽约市从 2009 年到 2020 年收集的不同类型出租车的轨迹 |
NYCBIKE | 美国纽约 | Jun. 2013 ~ present | Citi Bike System Data | Citi Bike NYC | 包含从 NYC CitiBike 系统收集的自行车轨迹 |
AUSTINRIDE | 美国奥斯汀 | Jun. 4, 2016 ~ Apr. 13, 2017 | Ride-Austin-june6-april13 - dataset by ride-austin | data.world | 包含从 2016 年 8 月 1 日到 2017 年 4 月 13 日的奥斯汀骑行轨迹,包括超过 140 万次旅行 |
BIKEDC | 美国华盛顿 | Sept. 20, 2010 ~ Oct. 2020 | System Data | Capital Bikeshare | 描述了华盛顿自行车系统的自行车道,其中包括 472 个停靠点 |
BIKECHI | 美国芝加哥 | Jun. 27, 2013 ~ 2018 | Divvy Data | 展示了 2013 年至 2018 年芝加哥共享单车的发展情况 |
Foursquare | 东京、美国 | Apr. 12, 2012 ~ Feb. 16, 2013 | https://sites.google.com/site/yangdingqi/home/foursquare-dataset#h.p_ID_46 | Foursquare 是一个基于位置的社交网站,用户可以在其中通过签到来分享他们的位置。 使用链接中的第二个数据集,即 NYC and Tokyo Check-in Dataset 。 对链接提供的原始数据进行了预处理,并将其拆分为 Foursquare-TKY 和 Foursquare-NYC |
Gowalla | Feb. 2009 ~ Oct. 2010 | SNAP: Network datasets: Gowalla | Gowalla 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID | |
Brightkite | Apr. 2008 ~ Oct. 2010 | SNAP: Network datasets: Brightkite | Brightkite 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID | |
| 美国纽约 | Jun. 15, 2011 - Nov. 8, 2016 | DMIS Lab, Korea University - CAPE | 该数据集最大的特点是每条签到记录不仅包含POI信息,还包含用户创建签到记录时写入的文本信息。 因此,该数据集对于将轨迹语义特征纳入轨迹预测的相关研究尤为重要。 |
Chengdu_Taxi_Sample1 | 中国成都 | Aug. 03, 2014 - Aug. 30, 2014 | https://github.com/UrbComp/DeepTTE/tree/master/data | Chengdu_Taxi_Sample1 数据集是Chengdu_Taxi 数据集的部分样例数据集。包含1800条成都市出租车轨迹数据。 |
Beijing_Taxi_Sample | 中国北京 | Oct. 01, 2013 - Oct. 31, 2013 | https://github.com/YibinShen/TTPNet/tree/master/data | Beijing_Taxi_Sample 数据集是Beijing_Taxi 数据集的部分样例数据集,这里每一天只提供了1000条北京市出租车轨迹数据 |
4 地图匹配
数据名称 | 地点 | 时间 | 出处 | 描述 |
Seattle | 美国西雅图 | Jan. 17,2009 20:27:37~22:34:28 | https://www.microsoft.com/en-us/research/publication/hidden-markov-map-matching-noise-sparseness/ | 这个用于地图匹配的数据集显示了在美国华盛顿州西雅图及其东部郊区开车时拍摄的GPS数据。 轨迹从Marymoor公园附近开始。 数据是用RoyalTek RBT-2300 GPS记录器以1HZ的频率采样的。 这次驾驶发生在2009年1月17日星期六,从20:27:37 UTC(当地时间12:27:37)开始,到22:34:28 UTC(当地时间14:34:28)结束,经过的时间为02:06:51。 |
Global | Dataset for testing and training map-matching methods | 这个用于地图匹配的数据集可以在世界范围内验证地图匹配的假设。 由于这个数据集覆盖全球,可以提高泛化能力 | ||
BJ_ROADMAP | 中国北京 | 原始数据集包含 OpenStreetMap 格式的节点和边的属性。 建图有两种实现方式,分别是节点为交叉点,关系为路段,以及节点为路段,关系为交叉点。分别命名为 “bj_roadmap_node” 和 “bj_roadmap_edge”。 |
5 风险数据
数据名称 | 地点 | 时间 | 出处 | 描述 |
NYC_RISK | 美国纽约 | Jan.01,2013 ~ Dec.31,2013 | GitHub - Echohhhhhh/GSNet: AAAI 2021. GSNet: Learning Spatial-Temporal Correlations from Geographical and Semantic Aspects for Traffic Accident Risk Forecasting | NYC_RISK 数据集包含了2013年纽约道路、风险和POI数据 |
CHICAGO_RISK | 美国芝加哥 | Feb.01,2016 ~ Sep.30,2016 | GitHub - Echohhhhhh/GSNet: AAAI 2021. GSNet: Learning Spatial-Temporal Correlations from Geographical and Semantic Aspects for Traffic Accident Risk Forecasting | 2016年1月到9月芝加哥道路和风险数据 |
这篇关于libcity笔记:支持的数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!