雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演

本文主要是介绍雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

内容一览:雷暴、冰雹、龙卷风等极端天气总是让人捉摸不透又避之不及。然而澳洲的研究者们却以身犯险,深入雹暴收集数据,只为让天气预报得更准。在超级计算机和
AI 的加持下,人类能否追上风暴,让混沌的天气系统不再那么捉摸不透?且看这部追风者们主演的「追风者也」。

关键词:大模型 追风者 极端天气

作者 | 雪菜
编辑 | 三羊

本文首发于 HyperAI 超神经微信公众平台~

1996 年上映的知名冒险灾难片《龙卷风》中,主角为了对龙卷风进行深入的研究,将探测设备亲身带入到龙卷风中心,以实现实时的数据记录。

受这部电影启发,澳大利亚气象学者 Joshua Soderholm 及 Julian Brimelow 一起开始了自己的追风之旅,并成功将小型天气传感器冰探 (hailsonde) 带入了雹暴 (hail storm),以收集雹暴当中的气象数据,变革极端天气的研究方法。

在这里插入图片描述

图 1:电影《龙卷风》剧照

更多电影详情可参见:

https://movie.douban.com/subject/1292454/

冰探的形状与冰雹类似,重约 24 g。它们和气球连在一起,被一同释放到雹暴当中。进入雹暴中心后,二者分离,冰探就和冰雹一样,经历冰雹在雹暴中的轨迹,并记录冰雹在雹暴中移动的生长条件。此外,冰探还记录到了显著的冰增长,并跟随超级单体的中气旋旋转了半圈。

在这里插入图片描述

图 2:两个冰探在雹暴中的轨迹

「起初这只是一个课余项目。当时我们想试一下能否利用现有的技术,制造出一个电影中的设备。为确保冰探能够在雹暴的极端条件中生存下来,制作过程中我们解决了很多工程问题。」 Joshua Soderholm 说道。

在这里插入图片描述

图 3:冰探的结构,3D 打印的零件、电池及其他电子器件被封装在聚苯乙烯外壳中

从雹暴中心收集数据就像是追寻气象学中的白鲸,既危险又令人着迷。从雹暴中心收集得到的数据,将会提升我们模拟雹暴的能力,并为冰雹在雹暴中的行为提供直接证据。但这没有听起来那么容易,它需要你在正确的时间出现在正确的位置,还得遇上正确的雹暴。」

在几天的坏运气之后,他们撞上了一个超级单体,并成功将两个冰探放进了雹暴中。**超级单体是一种水平尺度达十几千米,生命期达几十分钟到数小时,比普通的成熟单体雷暴更巨大、更持久、天气更为剧烈的单体强雷暴系统。**冰探被超级单体捕获之后,与气球分离,之后像冰雹一样随雹暴漂浮,最终被时速超过 120 km 的风带到了 7 km 外的区域。

在这里插入图片描述

图 4:Joshua Soderholm 在放飞冰探

在这一研究的基础上,他们正计划使用更多冰探对下一次超级单体进行记录,并收集落在地上的冰探,对下落的冰雹进行更深入的研究。

令人捉摸不透的天气系统

气象预测离不开人的参与。即使利用超级计算机,借助卫星数据和雷达数据,我们依然很难对气象系统做出准确的预测。1961 年,美国的气象学家爱德华·诺顿·洛伦茨 (Edward Norton Lorenz) 尝试用计算机程序预测未来的天气。

在得到结果之后,他将程序在中间步骤的输出值,作为下一个步骤的输入值,再次运行了程序。然而,由于输入值只保留了 3 位小数,而程序是以 6 位浮点数运行的,这千分之一的偏差使得程序的输出值和上次得到的结果完全不同。

据此,他提出了混沌系统这一概念。气象系统就是典型的混沌系统,它并非完全的随机,但很容易因某个因素的变化而发生剧烈的变化。也就是说,气象系统是一个很敏感的系统。

「蝴蝶效应」就是一个夸张但又典型的例子,一只南美洲热带雨林的蝴蝶扇动两下翅膀,就可能为美国带来一场龙卷风。这一切的源头,就是蝴蝶扰动了系统的初始变量。

在这里插入图片描述

图 5:蝴蝶效应

因此,天气的预测很难实现完全准确。现有的气象预测方式,也就是数值天气预报 (NWP),首先会将预测区域划分为网格,之后利用超级计算机通过数值模拟求解偏微分方程获得。

这一方法耗时很长,即使是使用有上百个节点的超级计算机,对未来 10 天的天气进行预测也需要花费数个小时。同时,受网格分辨率的限制,一些小尺度的气象过程会被近似函数参数化,为气象预测带来误差。

正因为此,对于小尺度的极端天气和中长期的气象预测,NWP 很难做到完美。 今年的 5 号台风杜苏芮生成后,不同机构基于不同的模型利用超级计算机进行了路径预测,结构大相径庭。即使是同一模型做出的预测,也在随着气象条件的变化不断进行修正,直到台风登陆前才能做出相对准确的预测。

之后的 6 号台风卡努,走位也很独特,在太平洋上突然转弯,然后开始漫步,最后直击日本,让超级计算机也一头雾水。

在这里插入图片描述

图 6:全球集合预报系统 (GEFS) 对 2023 年 6 号台风卡努的路径预测,可谓天花乱舞

同时,由于各个机构做出的气象预测千差万别,天气的预测还需要预报员的参与。预报员会综合所有的气象预测结果,并结合当地的气候特点、地形条件、个人经验等,做出最终的天气预报,但依然不能保证完全正确。没办法,气象系统就是这么的捉摸不透。

在这里插入图片描述

图 7:1986 年 16 号台风韦恩路径图

极端气象的追逐者

小尺度的超级单体更是中长期天气预报的一条漏网之鱼。超级单体的特点就是形成快、难预测,易形成雷暴、冰雹、强降雨或龙卷风等极端天气。

2021 年 8 月 16 日晚,北京市海淀区遭遇超级单体,突降暴雨。旱河路铁路桥桥下积水在 30 分钟内涨到 1.75 米,导致 2 人死亡。2023 年 8 月 13 日下午,江苏省盐城市大丰区遭遇龙卷风,造成 2 人死亡,15 人受伤。这场龙卷风的形成也与超级单体有关。

在这里插入图片描述

图 8:盐城大丰区龙卷风

然而,雷暴、冰雹、龙卷风等壮观的气象景观,可以让探险者们大饱眼福,也因此吸引了很多像 Soderholm 这样的追风者。每当台风来临,或是附近有超级单体将要形成时,追风者们就会做足准备,向风暴奔去。

同时,作为极端天气的第一见证者,追风者们还可以收集到极端天气的第一手信息,为气象研究提供宝贵的材料, 丰富现有的计算模型和 AI 模型的数据库,为气象学的发展做出重要贡献。

媲美 NWP 的气象大模型

早在 2021 年,阿里云就透露称,达摩院与国家气象中心联合研发了 AI 算法用于天气预测, 并成功预测了多次强对流天气。同年 9 月,Deepmind 在《Nature》上发表文章,利用深度生成模型进行降雨量的实时预报。

今年年初,Deepmind 正式推出了 GraphCast,可以在一分钟内对全球未来 10 天的气象,进行分辨率为 0.25° 的预测。 4 月,南京信息工程大学和上海人工智能实验室合作研发了「风乌」气象预测大模型,误差较 GraphCast 进一步降低。

随后,华为推出了「盘古」气象大模型。由于模型中引出了三维神经网络,**「盘古」的预测准确率首次超过了目前最准确的 NWP 预测系统。**近期,清华大学和复旦大学相继发布了「NowCastNet」和「伏羲」模型。前者在短时极端天气预测上大有作用,后者则将预测时长延长到了 15 天。

在这里插入图片描述

图 9:「盘古」模型和 ECMWF 对 2018 年 25 号台风康妮(图 a)和 26 号台风玉兔(图 b)的路径预测。

红色:「盘古」模型的预测

蓝色:ECMWF 的预测

黑色:实际情况

可以看到,气象预测大模型在预测精度和预测时间上都在不断逼近,甚至部分超过了传统的 NWP 分析模式。 同时,相比于 NWP ,AI 大模型的气象预测需要的设备条件更低,花费时间也更短。仅用一张 Google TPU v4,GraphCast 就可以在分钟之间预测出未来的天气。

然而,现有的 AI 大模型只能通过学习过去的气象数据,对未来的气象进行预测。因此,在极端天气和突发天气的场景中,大模型还需要其他算法的辅助,更离不开人的参与。 此时,活跃在风暴中心的追风者们提供的气象数据对 AI 大模型的优化则显得更为重要。人类与大模型携手,定能拍出一部优秀的「追风者也」。

参考链接:

[1] https://phys.org/news/2023-08-movie-inspired-technology-successfully-hail-eye.html

[2] http://m.nmc.cn/ty/

[3] http://henan.china.com.cn/tech/2021-06/22/content_41599891.htm

[4] https://arxiv.org/abs/2212.12794

[5] https://www.nature.com/articles/s41586-023-06185-3/figures/4

[6] 江燕如,典型天气过程分析 [M]. 北京:气象出版社,2016.

本文首发于 HyperAI 超神经微信公众平台~

这篇关于雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/358206

相关文章

JS常用组件收集

收集了一些平时遇到的前端比较优秀的组件,方便以后开发的时候查找!!! 函数工具: Lodash 页面固定: stickUp、jQuery.Pin 轮播: unslider、swiper 开关: switch 复选框: icheck 气泡: grumble 隐藏元素: Headroom

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

跨国公司撤出在华研发中心的启示:中国IT产业的挑战与机遇

近日,IBM中国宣布撤出在华的两大研发中心,这一决定在IT行业引发了广泛的讨论和关注。跨国公司在华研发中心的撤出,不仅对众多IT从业者的职业发展带来了直接的冲击,也引发了人们对全球化背景下中国IT产业竞争力和未来发展方向的深思。面对这一突如其来的变化,我们应如何看待跨国公司的决策?中国IT人才又该如何应对?中国IT产业将何去何从?本文将围绕这些问题展开探讨。 跨国公司撤出的背景与

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi