软件学院王建民、龙明盛团队提出极端降水临近预报大模型

本文主要是介绍软件学院王建民、龙明盛团队提出极端降水临近预报大模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

cd388103d80686df09f91ba3dc7ce7ca.png

 近日,清华大学软件学院王建民教授、龙明盛副教授团队提出了极端降水临近预报大模型,将数据驱动与物理驱动两大科学范式紧密结合,显著提高了公里尺度下0~3小时极端降水的预报能力,在全国62位气象预报专家的过程检验中大幅领先国际上的同类方法。目前该大模型已经在国家气象中心短临预报业务平台(SWAN 3.0)部署上线,将为全国极端降水天气短临预报业务提供支撑。

近年来,受全球气候变化的影响,短时强降水、暴风雨、暴雪、冰雹等极端降水天气发生频率逐年增加,严重威胁生产安全和人民的生命财产安全。更准确、更精细和更长预警提前量的降水临近预报业务能够更好地提供气象决策支持,为农业生产、新能源开发、航空航天等国家重大需求保驾护航。然而,极端降水天气过程大多只持续几十分钟且空间尺度在几公里范围,受到对流、气旋、地形等复杂过程和大气系统混沌效应的严重影响。基于物理方程模拟的数值预报技术很难对公里尺度的极端降水做出有效预报。在2023年5月27日世界气象组织峰会上,三小时内降水临近预报被列为未解决的重要科学难题之一。

e7f7dd5e82e88261ad50d53812ac6f01.png

基于雷达观测的降水临近预报是世界性难题之一

数值计算和深度学习是降水临近预报的两类主流方法,但均存在明显的缺陷。数值计算方法难以有效建模降水过程的时空多尺度特征,同时受到预报累积误差的制约,预报时效往往在一小时以内。深度学习方法虽然擅长建模非线性系统,但统计模型存在固有的小样本过平滑问题,预报求解过程缺少物理守恒规律约束,生成的数值场模糊失真严重,难以提供有业务价值的极端降水预报。

2acfa3d60fe8896690f6ae3c27e88e14.jpeg

物理建模与深度学习融合的临近预报大模型NowcastNet

针对上述挑战,2017年起,软件学院与国家气象中心、国家气象信息中心建立研究团队,就人工智能技术在气象大数据的应用开展合作。经过三年联合攻关,提出了临近预报大模型NowcastNet。该模型的核心是端到端建模降水物理过程的神经演变算子,实现了深度学习与物理规律的无缝隙融合。具体而言,研究团队首先设计了中尺度演变网络,用以建模平流运动等物理性质更显著的中尺度降水过程,并基于物质连续性方程(即质量守恒定律)设计了神经演变算子,端到端模拟降水过程中的十公里尺度运动,并通过反向传播最小化预报累积误差。其次,研究团队提出了对流尺度生成网络,以中尺度演变网络预测结果为条件,通过概率生成模型进一步捕捉对流生消等混沌效应更显著的公里尺度降水过程。NowcastNet在美国和中国近六年雷达观测资料上完成了训练。得益于上述融合设计,该模型兼具深度学习与物理建模的优势,在国际上首次将降水临近预报的时效延长至3小时,并弥补了极端降水预报的短板。

a2b81fd942f66c66690a6af4f97f2f35.jpeg

气象专家检验结果和数值指标评测结果

为了充分检验临近预报大模型NowcastNet对典型天气过程的业务指导价值,国家气象中心邀请了62位来自23个省市气象台的一线预报专家,针对中美两国2400个极端降水过程进行了后验检验和先验检验,并与目前业务中使用的PySTEPS系统、谷歌DeepMind与英国气象局联合提出的DGMR模型等进行了对比。NowcastNet在临界成功指数(CSI)、能量谱密度(PSD)等数值指标上全面超越现有技术,在71%的天气过程中被认为具有最高的预报价值。

50259f6515486150e5ca24495585de50.jpeg

1dcb4a76d85500d190da80a1d72561fe.jpeg

中国和美国极端降水天气过程的典型案例分析

在极端降水过程中,NowcastNet是唯一展现较强业务价值的临近预报技术。以中美两国的典型极端天气过程为例:2021年5月14日23时40分,中国江淮地区出现强降水过程,湖北、安徽等多个地区发布了暴雨红色预警,NowcastNet可以准确预测出三个强降水超级单体的变化过程。2021年12月11日9时30分,美国中部地区突发龙卷风灾害,造成89人死亡、676人受伤,NowcastNet可以对强降水的强度、落区和运动形态等给出更清晰、更准确的预报结果。检验表明,NowcastNet对于极端灾害天气的精准防控具有良好的指导意义。

研究成果以“高技巧极端降水临近预报大模型”(Skilful Nowcasting of Extreme Precipitation with NowcastNet)为题发表在《自然》(Nature)上,同时被《自然·新闻和观点》以“The Outlook for AI Weather Prediction”为题做了报道。该研究探索了数据驱动与物理驱动的“科学学习”新范式,提出了物理守恒约束下时空物质场建模和预测的一般方法,对其他具有多尺度物理特性的问题也具有应用前景。未来,研究团队将进一步推进该方案在物理问题求解、大气海洋模拟、工业设计仿真等场景下的应用。

清华大学软件学院王建民教授、龙明盛副教授和加州大学伯克利分校教授、清华大学荣誉教授迈克尔·乔丹(Michael I. Jordan)为论文的通讯作者。清华大学软件学院博士生张育宸和龙明盛副教授为论文的第一作者,硕士生陈凯源、邢蓝翔参加了研究工作。国家气象中心金荣花研究员提供了气象知识和数据支持并主持了全国范围内气象专家检验工作,罗兵、张小玲、薛峰、盛杰、韩丰、张小雯等专家为研究工作提供了指导、建议和帮助。研究得到国家自然科学基金创新研究群体项目、优秀青年科学基金项目和大数据系统软件国家工程研究中心的支持。

论文链接:

https://www.nature.com/articles/s41586-023-06184-4

供稿:软件学院

编辑:李华山

审核:郭玲

3737f82e9d358276ec41a0b4049449aa.png

这篇关于软件学院王建民、龙明盛团队提出极端降水临近预报大模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/323612

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

软件设计师备考——计算机系统

学习内容源自「软件设计师」 上午题 #1 计算机系统_哔哩哔哩_bilibili 目录 1.1.1 计算机系统硬件基本组成 1.1.2 中央处理单元 1.CPU 的功能 1)运算器 2)控制器 RISC && CISC 流水线控制 存储器  Cache 中断 输入输出IO控制方式 程序查询方式 中断驱动方式 直接存储器方式(DMA)  ​编辑 总线 ​编辑

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者