天气数据集-Jena Climate dataset

2024-06-03 02:20

本文主要是介绍天气数据集-Jena Climate dataset,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

天气数据集-Jena Climate dataset

1.数据集基本信息

  • Dataset Name:  mpi_saale_2021b.csv  

  • Size: 26495 rows;  1 year (2021), 10 min  

  • 气象学、农业、环境科学

  • 开源机构:  Max Planck Institute for Biogeochemistry

2.数据特征

2.1 特征简介

  • 数据共有31个特征,包括一些地理测量数据,如气压、温度、湿度、降雨量、风向等等

  • 我们是希望通过各种测量数据预测气温,这里很多特征是类似的,比如不同高度下的温度就是彼此相似

2.2 特征可视化

因为这个数据随时间变化,我们直接画出数据各个特征随时间变化的趋势图, 这里用index作为x 轴:

2.3 数据特征细节

1. ‘Date Time', 日期和时间2. ‘p (mbar)',  大气压力(毫bar) 3. ’T (degC)',  温度(摄氏度)4. ‘rh (%)', relative_humidity 相对湿度 (%)5. ‘sh (g/kg)', 每千克空气中的水汽含量6. ‘Tpot (K)', 相当位温(以开尔文为单位)> 指在将大气气块压缩或扩张到参考压力下(通常为1000毫巴),使其在对流过程中不发生任何相变(即凝结或蒸发)的温度> 开尔文(Kelvin)是温度的国际单位,通常用于科学和工程领域。开尔文温度标度是绝对温度标度,以绝对零度(零度的-273.15摄氏度)作为零点。开尔文温度通常用符号 "K" 表示,不加摄氏度符号。因此,绝对零度为0K,而水的冰点是273.15K,水的沸点是373.15K。> 空气在湿度和压力保持恒定时的温度7. ‘Tdew (degC)', 露点温度(以摄氏度为单位)> 指空气在恒定压力下,通过降低温度使其饱和,产生露珠或霜的温度。简单来说,就是当空气中的水汽凝结成液态水或冰时的温度。露点温度通常用来描述空气中的湿度。当露点温度与空气温度相近时,空气的相对湿度较高;当它们之间的差距较大时,相对湿度较低。> 在气象学中,露点温度是一个重要的指标,用于衡量空气中的水汽含量以及空气的湿度。较高的露点温度意味着空气中含有较多的水汽,较低的露点温度则表示空气较为干燥。露点温度也是天气预报中的一个重要参数,因为它与空气中的水汽含量直接相关,对天气的变化和降水的可能性具有一定的预测意义。8. ‘VPmax (mbar)', 最大水汽压力(以毫巴为单位)> 在达到饱和状态时,液体表面的蒸汽压力达到最大值,此时液体中的分子以与气体中相同的速率从液体表面蒸发,并与气体中的分子再次凝结,这样就建立了动态平衡。9. ’VPact (mbar)', 实际水汽压力(以毫巴为单位)> 液体表面上的蒸汽与液体达到动态平衡时的压力。液体分子会不断从液体表面蒸发成气体,同时也会有气体分子再凝结成液体,当这两个过程达到平衡时,液体表面上就会有一定的蒸汽压。蒸汽压受温度和液体性质的影响,温度越高,蒸汽压越高;液体的性质(比如分子间力)也会影响蒸汽压的大小。10. ‘VPdef (mbar)', 水汽压力缺失(以毫巴为单位)> 际水汽压力与空气中饱和水汽压力之间的差值11. ‘H2OC (mmol/mol)', 水汽含量(以毫摩尔/毫摩尔为单位)12. ‘rho (g/m**3)', 空气密度(以克/立方米为单位)13. ‘wv (m/s)',  风速 (米/秒)> 强风可能伴随着暴风雨或暴风14. ‘wd (deg)',  风向(度)15. ‘rain (mm)',  降雨量(毫米)> 降水的数量,可用于判断是否下雨16. ‘SWDR (W/m**2)', 短波辐射(瓦特/平方米)> 短波辐射(Shortwave Downward Radiation)是指太阳短波辐射能量在大气层顶进入地面或水面的辐射能量。它是太阳能辐射的一部分,主要包括可见光和紫外光,通常以瓦特每平方米(W/m²)为单位表示。短波辐射是地球能量平衡中的一个重要组成部分,它决定了地球表面的能量收入。> 在气象学和气候学中,短波辐射是一个重要的气象参数,用于分析太阳辐射对地球能量平衡和气候变化的影响。它受到大气中云量、气溶胶、水汽含量等因素的影响,因此对于研究大气辐射传输和气候模拟具有重要意义。17. ‘SDUR (s)', 短波辐射持续时间(以秒为单位)18. ’TRAD (degC)', 地表温度(以摄氏度为单位)19. ‘Rn (W/m**2)',  净辐射(以瓦特/平方米为单位)20. ‘ST002 (degC)', 地表温度在 2 厘米深度的测量值(以摄氏度为单位)21. ’ST004 (degC)', 地表温度在 4 厘米深度的测量值(以摄氏度为单位)22. ‘ST008 (degC)', 地表温度在 8 厘米深度的测量值(以摄氏度为单位)23. ‘ST016 (degC)',  地表温度在 16 厘米深度的测量值(以摄氏度为单位)24. ’ST032 (degC)', 地表温度在 32 厘米深度的测量值(以摄氏度为单位)25. ’ST064 (degC)', 地表温度在 64 厘米深度的测量值(以摄氏度为单位)26. ‘ST128 (degC)', 地表温度在 128 厘米深度的测量值(以摄氏度为单位)27. ‘SM008 (%)', 土壤湿度在 8 厘米深度的测量值(以百分比表示)28. ‘SM016 (%)', 土壤湿度在 16 厘米深度的测量值(以百分比表示)29. ‘SM032 (%)', 土壤湿度在 32 厘米深度的测量值(以百分比表示)30. ’SM064 (%)', 土壤湿度在 64 厘米深度的测量值(以百分比表示)31. ‘SM128 (%)'   土壤湿度在 128 厘米深度的测量值(以百分比表示)

3.数据预处理

3.1 特征选择

- 由于顺序数据index和data性质类似,这里删掉 “Data Time”

- 由于ST002(degC)-ST064(degC)是不同地表高度的温度,和我们要预测的数据T(degC),在性质上类似,因此全部删掉

3.2 输入输出

我们计划用RNN模型来预测温度,大概是知道前n-1时刻的特征数据(包括温度),预测第n时刻的温度,因此:

我们要对shape为(26495,31)的数据进行处理。

  • 先删掉不需要的特征13个,剩下18个,删后的shape为(26495,18)

  • 我们用过8个连续时间点预测第9个时间点,即模型输入为 x = (_, 8, 18), 输出为 y = (_, 1)

> 这里的shape留了个空位给batch_size,用于模型批量化处理数据

  • 我们假设输出的参考真实值为标签y‘,即数据集中第三列特征

参考链接

  • LSTM 原版: Weather forecast using LSTM networks
  • 天气数据集:   Max-Planck-Institut fuer Biogeochemie - Wetterdaten

这篇关于天气数据集-Jena Climate dataset的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1025772

相关文章

【服务器运维】MySQL数据存储至数据盘

查看磁盘及分区 [root@MySQL tmp]# fdisk -lDisk /dev/sda: 21.5 GB, 21474836480 bytes255 heads, 63 sectors/track, 2610 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesSector size (logical/physical)

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

数据时代的数字企业

1.写在前面 讨论数据治理在数字企业中的影响和必要性,并介绍数据治理的核心内容和实践方法。作者强调了数据质量、数据安全、数据隐私和数据合规等方面是数据治理的核心内容,并介绍了具体的实践措施和案例分析。企业需要重视这些方面以实现数字化转型和业务增长。 数字化转型行业小伙伴可以加入我的星球,初衷成为各位数字化转型参考库,星球内容每周更新 个人工作经验资料全部放在这里,包含数据治理、数据要

如何在Java中处理JSON数据?

如何在Java中处理JSON数据? 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们将探讨在Java中如何处理JSON数据。JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,在现代应用程序中被广泛使用。Java通过多种库和API提供了处理JSON的能力,我们将深入了解其用法和最佳

两个基因相关性CPTAC蛋白组数据

目录 蛋白数据下载 ①蛋白数据下载 1,TCGA-选择泛癌数据  2,TCGA-TCPA 3,CPTAC(非TCGA) ②蛋白相关性分析 1,数据整理 2,蛋白相关性分析 PCAS在线分析 蛋白数据下载 CPTAC蛋白组学数据库介绍及数据下载分析 – 王进的个人网站 (jingege.wang) ①蛋白数据下载 可以下载泛癌蛋白数据:UCSC Xena (xena

AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著

中国341城市生态系统服务价值数据集(2000-2020年)

生态系统服务反映了人类直接或者间接从自然生态系统中获得的各种惠益,对支撑和维持人类生存和福祉起着重要基础作用。目前针对全国城市尺度的生态系统服务价值的长期评估还相对较少。我们在Xie等(2017)的静态生态系统服务当量因子表基础上,选取净初级生产力,降水量,生物迁移阻力,土壤侵蚀度和道路密度五个变量,对生态系统供给服务、调节服务、支持服务和文化服务共4大类和11小类的当量因子进行了时空调整,计算了

【计算机网络篇】数据链路层(12)交换机式以太网___以太网交换机

文章目录 🍔交换式以太网🛸以太网交换机 🍔交换式以太网 仅使用交换机(不使用集线器)的以太网就是交换式以太网 🛸以太网交换机 以太网交换机本质上就是一个多接口的网桥: 交换机的每个接口考研连接计算机,也可以理解集线器或另一个交换机 当交换机的接口与计算机或交换机连接时,可以工作在全双工方式,并能在自身内部同时连通多对接口,使每一对相互通信的计算机都能像

使用Jsoup抓取数据

问题 最近公司的市场部分布了一个问题,到一个网站截取一下医院的数据。刚好我也被安排做。后来,我发现为何不用脚本去抓取呢? 抓取的数据如下: Jsoup的使用实战代码 结构 Created with Raphaël 2.1.0 开始 创建线程池 jsoup读取网页 解析Element 写入sqlite 结束

Excel实用技巧——二级下拉菜单、数据验证

EXCEL系列文章目录   Excel系列文章是本人亲身经历职场之后萌发的想法,为什么Excel覆盖如此之广,几乎每个公司、学校、家庭都在使用,但是它深藏的宝藏功能却很少被人使用,PQ、BI这些功能同样适用于数据分析;并且在一些需要简单及时的数据分析项目前,Excel是完胜python、R、SPSS这些科学专业的软件的。因此决心开启Excel篇章。 数据分析为什么要学Excel Excel图表