libcity笔记:支持的数据

2024-05-06 17:36
文章标签 数据 笔记 支持 libcity

本文主要是介绍libcity笔记:支持的数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据下载地址:Standard Dataset in LibCity - Google 云端硬盘

1 交通速度数据

数据名称地点时间出处

描述

METR_LA

美国洛杉矶

 Mar. 1, 2012 ~

Jun. 27, 2012

GitHub - liyaguang/DCRNN: Implementation of Diffusion Convolutional Recurrent Neural Network in Tensorflow由环路探测器在高速公路上收集,包含来自 207 个传感器的交通速度数据

LOS_LOOP

美国洛杉矶

 Mar. 1, 2012 ~

Jun. 27, 2012

https://github.com/lehaifeng/T-GCN/tree/master/data 与METR LA略有不同,缺失值通过线性插值得到补充

PEMS

美国加州2001 ~ presenthttp://pems.dot.ca.gov记录加利福尼亚高速公路的速度数据,包括时间小时,平均时间,车道点

PEMSD3

美国加州3区Sept. 1, 2018 ~ Nov. 30, 2018GitHub - Davidham3/STSGCN: AAAI 2020. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data ForecastingPeMSD3 数据集包括 358 个传感器和流量信息

PEMSD4

美国加州湾区Jan. 1, 2018 ~ Feb. 28, 2018ASTGCN-2019-mxnet/data/PEMS04 at master · Davidham3/ASTGCN-2019-mxnet · GitHub包含29条道路上的3848个传感器

PEMS_BAY

美国加州湾区 Jan. 1, 2017 ~ Jun. 30, 2017GitHub - liyaguang/DCRNN: Implementation of Diffusion Convolutional Recurrent Neural Network in Tensorflow包含6个月的交通速度统计数据,包括325个传感器

PEMSD7

美国加州7区Jul. 1, 2016 ~ Aug. 31, 2016GitHub - Davidham3/STSGCN: AAAI 2020. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data Forecasting包含883个传感器站的交通流量信息

PEMSD7(M)

美国加州7区 the weekdays of May and June of 2012STGCN/datasets at master · Davidham3/STGCN · GitHub述了加州第7区228个站点的高速公路速度信息

PEMSD8

美国加州San Bernardino Jul. 1, 2016 ~ Aug. 31, 2016ASTGCN-2019-mxnet/data/PEMS08 at master · Davidham3/ASTGCN-2019-mxnet · GitHub数据来自8条公路上的1979个传感器

LOOP_SEATTLE

美国西雅图 2015 全年https://github.com/zhiyongc/Seattle-Loop-Data由部署在西雅图地区高速公路(I-5、I-405、I-90和SR-520)上的感应环路探测器收集,包含来自323个传感器站的交通状态数据

Q_TRAFFIC

中国北京Apr. 1, 2017 ~ May 31, 2017GitHub - JingqingZ/BaiduTraffic: This repo includes introduction, code and dataset of our paper Deep Sequence Learning with Auxiliary Information for Traffic Prediction (KDD 2018).Q-Traffic 数据集包含三个子数据集:查询子数据集、交通速度子数据集和路网子数据集

SZ_TAXI

中国深圳Jan. 1, 2015 ~ Jan. 31, 2015https://github.com/lehaifeng/T-GCN/tree/master/data包含深圳市的出租车轨迹,包括道路邻接矩阵和道路交通速度信息

M_DENSE

西班牙马德里Jan. 1, 2018 - Dec. 21, 2019GitHub - rdemedrano/crann_traffic: A Spatio-Temporal Spot-Forecasting Framework for Urban Traffic Prediction包含马德里市交通测量的历史数据。在每个点每 15 分钟进行一次测量,包括每小时汽车数量的交通强度

ROTTERDAM

荷兰鹿特丹135 days of 2018https://github.com/RomainLITUD/DGCN_traffic_forecasting包含 208 条链路的交通状态信息

2 地铁数据(偏OD)

数据名称地点时间出处

描述

SHMETRO

中国上海Jul. 1, 2016 - Sept. 30, 2016GitHub - ivechan/PVCGN: code for "Physical-Virtual Collaboration Graph Network for Station-Level Metro Ridership Prediction"基于中国上海的地铁系统构建的。 2016年7月1日至2016年9月30日,共收集8.118亿笔交易记录,日客流量882万人次

BEIJING_SUBWAY

中国北京Feb. 29, 2016 - Apr. 3, 2016GitHub - JinleiZhangBJTU/ResNet-LSTM-GCN: Code for Deep-learning Architecture for Short-term Passenger Flow Forecasting in Urban Rail Transit

连续五周的05:00-23:00从北京地铁采集的数据。

截至2016年3月北京共有17条线路和276个地铁站(不包括机场快线及其上的车站)

HZMETRO

中国杭州Jan. 1, 2019 - Jan. 25, 2019GitHub - ivechan/PVCGN: code for "Physical-Virtual Collaboration Graph Network for Station-Level Metro Ridership Prediction"根据 2019 年 1 月收集的杭州地铁系统交易记录创建的。该系统拥有 80 个运营站点和 248 个边,每天有 235 万乘客

NYCTAXI_DYNA

美国纽约

用不规则区域划分方法统计区域流入流出的数据集

源自下面的NYCTAXI

NYCTAXI_OD

美国纽约

它使用不规则区域划分方法计算区域之间的起点-终点流量

源自下面的NYCTAXI

NYCTAXI_GRID

美国纽约

用基于网格的划分方法计算区域的流入和流出

源自下面的NYCTAXI

NYC_TOD

美国纽约2014GitHub - liulingbo918/CSTN: Taxi Origin-Destination Demand Prediction使用基于网格的划分方法计算区域的流入和流出

3 轨迹数据

数据名称地点时间出处

描述

TAXIBJ

中国北京

Jul. 1, 2013 ~ Oct. 30, 2013,

Mar. 1, 2014 ~ Jun. 30, 2014,

Mar. 1, 2015 ~ Jun. 30, 2015

 Nov. 1, 2015 ~ Apr. 10, 2016

数据地址失效 · Issue #3 · TolicWang/DeepST · GitHub包含出租车 GPS 数据,包括人流、气象和节假日信息

T_DRIVE

中国北京Feb. 2, 2008 ~ Feb. 8, 2008T-Drive trajectory data sample - Microsoft Research包含10357辆北京出租车的每周轨迹约1500万个点,轨迹总距离达到900万公里

PORTO

葡萄牙波尔图Jul. 1, 2013 ~ Jun. 30, 2014https://archive.ics.uci.edu/ml/datasets/Taxi+Service+Trajectory+-+Prediction+Challenge%2C+ECML+PKDD+2015描述了在葡萄牙波尔图市运行的所有 442 辆出租车所执行的轨迹

NYCTAXI

美国纽约2009 ~ presentTLC Trip Record Data - TLC包含 GPS 为纽约市从 2009 年到 2020 年收集的不同类型出租车的轨迹

NYCBIKE

美国纽约Jun. 2013 ~ presentCiti Bike System Data | Citi Bike NYC包含从 NYC CitiBike 系统收集的自行车轨迹

AUSTINRIDE

美国奥斯汀Jun. 4, 2016 ~ Apr. 13, 2017Ride-Austin-june6-april13 - dataset by ride-austin | data.world包含从 2016 年 8 月 1 日到 2017 年 4 月 13 日的奥斯汀骑行轨迹,包括超过 140 万次旅行

BIKEDC

美国华盛顿Sept. 20, 2010 ~ Oct. 2020System Data | Capital Bikeshare描述了华盛顿自行车系统的自行车道,其中包括 472 个停靠点

BIKECHI

美国芝加哥Jun. 27, 2013 ~ 2018Divvy Data展示了 2013 年至 2018 年芝加哥共享单车的发展情况

Foursquare

东京、美国Apr. 12, 2012 ~ Feb. 16, 2013https://sites.google.com/site/yangdingqi/home/foursquare-dataset#h.p_ID_46

Foursquare 是一个基于位置的社交网站,用户可以在其中通过签到来分享他们的位置。

使用链接中的第二个数据集,即 NYC and Tokyo Check-in Dataset 。

对链接提供的原始数据进行了预处理,并将其拆分为 Foursquare-TKY 和 Foursquare-NYC

Gowalla

 Feb. 2009 ~ Oct. 2010SNAP: Network datasets: GowallaGowalla 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID

Brightkite

Apr. 2008 ~ Oct. 2010SNAP: Network datasets: BrightkiteBrightkite 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID

Instagram

美国纽约Jun. 15, 2011 - Nov. 8, 2016DMIS Lab, Korea University - CAPE

该数据集最大的特点是每条签到记录不仅包含POI信息,还包含用户创建签到记录时写入的文本信息。

因此,该数据集对于将轨迹语义特征纳入轨迹预测的相关研究尤为重要。

Chengdu_Taxi_Sample1

中国成都Aug. 03, 2014 - Aug. 30, 2014https://github.com/UrbComp/DeepTTE/tree/master/dataChengdu_Taxi_Sample1 数据集是Chengdu_Taxi 数据集的部分样例数据集。包含1800条成都市出租车轨迹数据。

Beijing_Taxi_Sample

中国北京Oct. 01, 2013 - Oct. 31, 2013https://github.com/YibinShen/TTPNet/tree/master/dataBeijing_Taxi_Sample 数据集是Beijing_Taxi 数据集的部分样例数据集,这里每一天只提供了1000条北京市出租车轨迹数据

 4 地图匹配

数据名称地点时间出处

描述

Seattle

美国西雅图Jan. 17,2009 20:27:37~22:34:28https://www.microsoft.com/en-us/research/publication/hidden-markov-map-matching-noise-sparseness/

这个用于地图匹配的数据集显示了在美国华盛顿州西雅图及其东部郊区开车时拍摄的GPS数据。

轨迹从Marymoor公园附近开始。

数据是用RoyalTek RBT-2300 GPS记录器以1HZ的频率采样的。

这次驾驶发生在2009年1月17日星期六,从20:27:37 UTC(当地时间12:27:37)开始,到22:34:28 UTC(当地时间14:34:28)结束,经过的时间为02:06:51。

Global

Dataset for testing and training map-matching methods

这个用于地图匹配的数据集可以在世界范围内验证地图匹配的假设。

由于这个数据集覆盖全球,可以提高泛化能力

BJ_ROADMAP

中国北京

原始数据集包含 OpenStreetMap 格式的节点和边的属性。

建图有两种实现方式,分别是节点为交叉点,关系为路段,以及节点为路段,关系为交叉点。分别命名为 “bj_roadmap_node” 和 “bj_roadmap_edge”。

5 风险数据

数据名称地点时间出处

描述

NYC_RISK

美国纽约Jan.01,2013 ~ Dec.31,2013GitHub - Echohhhhhh/GSNet: AAAI 2021. GSNet: Learning Spatial-Temporal Correlations from Geographical and Semantic Aspects for Traffic Accident Risk ForecastingNYC_RISK 数据集包含了2013年纽约道路、风险和POI数据

CHICAGO_RISK

美国芝加哥Feb.01,2016 ~ Sep.30,2016GitHub - Echohhhhhh/GSNet: AAAI 2021. GSNet: Learning Spatial-Temporal Correlations from Geographical and Semantic Aspects for Traffic Accident Risk Forecasting2016年1月到9月芝加哥道路和风险数据

这篇关于libcity笔记:支持的数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/964924

相关文章

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

SpringKafka消息发布之KafkaTemplate与事务支持功能

《SpringKafka消息发布之KafkaTemplate与事务支持功能》通过本文介绍的基本用法、序列化选项、事务支持、错误处理和性能优化技术,开发者可以构建高效可靠的Kafka消息发布系统,事务支... 目录引言一、KafkaTemplate基础二、消息序列化三、事务支持机制四、错误处理与重试五、性能优

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解