libcity笔记:支持的数据

2024-05-06 17:36
文章标签 数据 笔记 支持 libcity

本文主要是介绍libcity笔记:支持的数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据下载地址:Standard Dataset in LibCity - Google 云端硬盘

1 交通速度数据

数据名称地点时间出处

描述

METR_LA

美国洛杉矶

 Mar. 1, 2012 ~

Jun. 27, 2012

GitHub - liyaguang/DCRNN: Implementation of Diffusion Convolutional Recurrent Neural Network in Tensorflow由环路探测器在高速公路上收集,包含来自 207 个传感器的交通速度数据

LOS_LOOP

美国洛杉矶

 Mar. 1, 2012 ~

Jun. 27, 2012

https://github.com/lehaifeng/T-GCN/tree/master/data 与METR LA略有不同,缺失值通过线性插值得到补充

PEMS

美国加州2001 ~ presenthttp://pems.dot.ca.gov记录加利福尼亚高速公路的速度数据,包括时间小时,平均时间,车道点

PEMSD3

美国加州3区Sept. 1, 2018 ~ Nov. 30, 2018GitHub - Davidham3/STSGCN: AAAI 2020. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data ForecastingPeMSD3 数据集包括 358 个传感器和流量信息

PEMSD4

美国加州湾区Jan. 1, 2018 ~ Feb. 28, 2018ASTGCN-2019-mxnet/data/PEMS04 at master · Davidham3/ASTGCN-2019-mxnet · GitHub包含29条道路上的3848个传感器

PEMS_BAY

美国加州湾区 Jan. 1, 2017 ~ Jun. 30, 2017GitHub - liyaguang/DCRNN: Implementation of Diffusion Convolutional Recurrent Neural Network in Tensorflow包含6个月的交通速度统计数据,包括325个传感器

PEMSD7

美国加州7区Jul. 1, 2016 ~ Aug. 31, 2016GitHub - Davidham3/STSGCN: AAAI 2020. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data Forecasting包含883个传感器站的交通流量信息

PEMSD7(M)

美国加州7区 the weekdays of May and June of 2012STGCN/datasets at master · Davidham3/STGCN · GitHub述了加州第7区228个站点的高速公路速度信息

PEMSD8

美国加州San Bernardino Jul. 1, 2016 ~ Aug. 31, 2016ASTGCN-2019-mxnet/data/PEMS08 at master · Davidham3/ASTGCN-2019-mxnet · GitHub数据来自8条公路上的1979个传感器

LOOP_SEATTLE

美国西雅图 2015 全年https://github.com/zhiyongc/Seattle-Loop-Data由部署在西雅图地区高速公路(I-5、I-405、I-90和SR-520)上的感应环路探测器收集,包含来自323个传感器站的交通状态数据

Q_TRAFFIC

中国北京Apr. 1, 2017 ~ May 31, 2017GitHub - JingqingZ/BaiduTraffic: This repo includes introduction, code and dataset of our paper Deep Sequence Learning with Auxiliary Information for Traffic Prediction (KDD 2018).Q-Traffic 数据集包含三个子数据集:查询子数据集、交通速度子数据集和路网子数据集

SZ_TAXI

中国深圳Jan. 1, 2015 ~ Jan. 31, 2015https://github.com/lehaifeng/T-GCN/tree/master/data包含深圳市的出租车轨迹,包括道路邻接矩阵和道路交通速度信息

M_DENSE

西班牙马德里Jan. 1, 2018 - Dec. 21, 2019GitHub - rdemedrano/crann_traffic: A Spatio-Temporal Spot-Forecasting Framework for Urban Traffic Prediction包含马德里市交通测量的历史数据。在每个点每 15 分钟进行一次测量,包括每小时汽车数量的交通强度

ROTTERDAM

荷兰鹿特丹135 days of 2018https://github.com/RomainLITUD/DGCN_traffic_forecasting包含 208 条链路的交通状态信息

2 地铁数据(偏OD)

数据名称地点时间出处

描述

SHMETRO

中国上海Jul. 1, 2016 - Sept. 30, 2016GitHub - ivechan/PVCGN: code for "Physical-Virtual Collaboration Graph Network for Station-Level Metro Ridership Prediction"基于中国上海的地铁系统构建的。 2016年7月1日至2016年9月30日,共收集8.118亿笔交易记录,日客流量882万人次

BEIJING_SUBWAY

中国北京Feb. 29, 2016 - Apr. 3, 2016GitHub - JinleiZhangBJTU/ResNet-LSTM-GCN: Code for Deep-learning Architecture for Short-term Passenger Flow Forecasting in Urban Rail Transit

连续五周的05:00-23:00从北京地铁采集的数据。

截至2016年3月北京共有17条线路和276个地铁站(不包括机场快线及其上的车站)

HZMETRO

中国杭州Jan. 1, 2019 - Jan. 25, 2019GitHub - ivechan/PVCGN: code for "Physical-Virtual Collaboration Graph Network for Station-Level Metro Ridership Prediction"根据 2019 年 1 月收集的杭州地铁系统交易记录创建的。该系统拥有 80 个运营站点和 248 个边,每天有 235 万乘客

NYCTAXI_DYNA

美国纽约

用不规则区域划分方法统计区域流入流出的数据集

源自下面的NYCTAXI

NYCTAXI_OD

美国纽约

它使用不规则区域划分方法计算区域之间的起点-终点流量

源自下面的NYCTAXI

NYCTAXI_GRID

美国纽约

用基于网格的划分方法计算区域的流入和流出

源自下面的NYCTAXI

NYC_TOD

美国纽约2014GitHub - liulingbo918/CSTN: Taxi Origin-Destination Demand Prediction使用基于网格的划分方法计算区域的流入和流出

3 轨迹数据

数据名称地点时间出处

描述

TAXIBJ

中国北京

Jul. 1, 2013 ~ Oct. 30, 2013,

Mar. 1, 2014 ~ Jun. 30, 2014,

Mar. 1, 2015 ~ Jun. 30, 2015

 Nov. 1, 2015 ~ Apr. 10, 2016

数据地址失效 · Issue #3 · TolicWang/DeepST · GitHub包含出租车 GPS 数据,包括人流、气象和节假日信息

T_DRIVE

中国北京Feb. 2, 2008 ~ Feb. 8, 2008T-Drive trajectory data sample - Microsoft Research包含10357辆北京出租车的每周轨迹约1500万个点,轨迹总距离达到900万公里

PORTO

葡萄牙波尔图Jul. 1, 2013 ~ Jun. 30, 2014https://archive.ics.uci.edu/ml/datasets/Taxi+Service+Trajectory+-+Prediction+Challenge%2C+ECML+PKDD+2015描述了在葡萄牙波尔图市运行的所有 442 辆出租车所执行的轨迹

NYCTAXI

美国纽约2009 ~ presentTLC Trip Record Data - TLC包含 GPS 为纽约市从 2009 年到 2020 年收集的不同类型出租车的轨迹

NYCBIKE

美国纽约Jun. 2013 ~ presentCiti Bike System Data | Citi Bike NYC包含从 NYC CitiBike 系统收集的自行车轨迹

AUSTINRIDE

美国奥斯汀Jun. 4, 2016 ~ Apr. 13, 2017Ride-Austin-june6-april13 - dataset by ride-austin | data.world包含从 2016 年 8 月 1 日到 2017 年 4 月 13 日的奥斯汀骑行轨迹,包括超过 140 万次旅行

BIKEDC

美国华盛顿Sept. 20, 2010 ~ Oct. 2020System Data | Capital Bikeshare描述了华盛顿自行车系统的自行车道,其中包括 472 个停靠点

BIKECHI

美国芝加哥Jun. 27, 2013 ~ 2018Divvy Data展示了 2013 年至 2018 年芝加哥共享单车的发展情况

Foursquare

东京、美国Apr. 12, 2012 ~ Feb. 16, 2013https://sites.google.com/site/yangdingqi/home/foursquare-dataset#h.p_ID_46

Foursquare 是一个基于位置的社交网站,用户可以在其中通过签到来分享他们的位置。

使用链接中的第二个数据集,即 NYC and Tokyo Check-in Dataset 。

对链接提供的原始数据进行了预处理,并将其拆分为 Foursquare-TKY 和 Foursquare-NYC

Gowalla

 Feb. 2009 ~ Oct. 2010SNAP: Network datasets: GowallaGowalla 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID

Brightkite

Apr. 2008 ~ Oct. 2010SNAP: Network datasets: BrightkiteBrightkite 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID

Instagram

美国纽约Jun. 15, 2011 - Nov. 8, 2016DMIS Lab, Korea University - CAPE

该数据集最大的特点是每条签到记录不仅包含POI信息,还包含用户创建签到记录时写入的文本信息。

因此,该数据集对于将轨迹语义特征纳入轨迹预测的相关研究尤为重要。

Chengdu_Taxi_Sample1

中国成都Aug. 03, 2014 - Aug. 30, 2014https://github.com/UrbComp/DeepTTE/tree/master/dataChengdu_Taxi_Sample1 数据集是Chengdu_Taxi 数据集的部分样例数据集。包含1800条成都市出租车轨迹数据。

Beijing_Taxi_Sample

中国北京Oct. 01, 2013 - Oct. 31, 2013https://github.com/YibinShen/TTPNet/tree/master/dataBeijing_Taxi_Sample 数据集是Beijing_Taxi 数据集的部分样例数据集,这里每一天只提供了1000条北京市出租车轨迹数据

 4 地图匹配

数据名称地点时间出处

描述

Seattle

美国西雅图Jan. 17,2009 20:27:37~22:34:28https://www.microsoft.com/en-us/research/publication/hidden-markov-map-matching-noise-sparseness/

这个用于地图匹配的数据集显示了在美国华盛顿州西雅图及其东部郊区开车时拍摄的GPS数据。

轨迹从Marymoor公园附近开始。

数据是用RoyalTek RBT-2300 GPS记录器以1HZ的频率采样的。

这次驾驶发生在2009年1月17日星期六,从20:27:37 UTC(当地时间12:27:37)开始,到22:34:28 UTC(当地时间14:34:28)结束,经过的时间为02:06:51。

Global

Dataset for testing and training map-matching methods

这个用于地图匹配的数据集可以在世界范围内验证地图匹配的假设。

由于这个数据集覆盖全球,可以提高泛化能力

BJ_ROADMAP

中国北京

原始数据集包含 OpenStreetMap 格式的节点和边的属性。

建图有两种实现方式,分别是节点为交叉点,关系为路段,以及节点为路段,关系为交叉点。分别命名为 “bj_roadmap_node” 和 “bj_roadmap_edge”。

5 风险数据

数据名称地点时间出处

描述

NYC_RISK

美国纽约Jan.01,2013 ~ Dec.31,2013GitHub - Echohhhhhh/GSNet: AAAI 2021. GSNet: Learning Spatial-Temporal Correlations from Geographical and Semantic Aspects for Traffic Accident Risk ForecastingNYC_RISK 数据集包含了2013年纽约道路、风险和POI数据

CHICAGO_RISK

美国芝加哥Feb.01,2016 ~ Sep.30,2016GitHub - Echohhhhhh/GSNet: AAAI 2021. GSNet: Learning Spatial-Temporal Correlations from Geographical and Semantic Aspects for Traffic Accident Risk Forecasting2016年1月到9月芝加哥道路和风险数据

这篇关于libcity笔记:支持的数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/964924

相关文章

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Python实现将实体类列表数据导出到Excel文件

《Python实现将实体类列表数据导出到Excel文件》在数据处理和报告生成中,将实体类的列表数据导出到Excel文件是一项常见任务,Python提供了多种库来实现这一目标,下面就来跟随小编一起学习一... 目录一、环境准备二、定义实体类三、创建实体类列表四、将实体类列表转换为DataFrame五、导出Da

Python实现数据清洗的18种方法

《Python实现数据清洗的18种方法》本文主要介绍了Python实现数据清洗的18种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录1. 去除字符串两边空格2. 转换数据类型3. 大小写转换4. 移除列表中的重复元素5. 快速统

Python数据处理之导入导出Excel数据方式

《Python数据处理之导入导出Excel数据方式》Python是Excel数据处理的绝佳工具,通过Pandas和Openpyxl等库可以实现数据的导入、导出和自动化处理,从基础的数据读取和清洗到复杂... 目录python导入导出Excel数据开启数据之旅:为什么Python是Excel数据处理的最佳拍档

在Pandas中进行数据重命名的方法示例

《在Pandas中进行数据重命名的方法示例》Pandas作为Python中最流行的数据处理库,提供了强大的数据操作功能,其中数据重命名是常见且基础的操作之一,本文将通过简洁明了的讲解和丰富的代码示例,... 目录一、引言二、Pandas rename方法简介三、列名重命名3.1 使用字典进行列名重命名3.编

Python使用Pandas库将Excel数据叠加生成新DataFrame的操作指南

《Python使用Pandas库将Excel数据叠加生成新DataFrame的操作指南》在日常数据处理工作中,我们经常需要将不同Excel文档中的数据整合到一个新的DataFrame中,以便进行进一步... 目录一、准备工作二、读取Excel文件三、数据叠加四、处理重复数据(可选)五、保存新DataFram