AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

本文主要是介绍AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著提升。Aurora 不仅在预测技术上取得了重大突破,更在应用层面展现出了巨大潜力。


aurora-1

2023年11月,风暴“夏兰”席卷了欧洲西北部,造成了严重破坏,伴随而来的低压系统刷新了英格兰的记录,成为极为罕见的气象事件。这场风暴的猛烈程度让许多人措手不及,在暴露当前天气预测模型不足的同时,也凸显了气候变化日益加剧的情况下,提升气候预测准确性的迫切需求。我们如何才能更好地预测此类极端天气事件,并做好更为充分的准备?

Charlton-Perez 等人(2024年)近期的一项研究指出,即便是目前最先进的人工智能天气预测模型,在准确捕捉风暴“夏兰”的快速增强过程及其峰值风速方面也面临着挑战。为应对这些挑战,微软研究院开发了先进的人工智能基础模型 Aurora,可以从海量的大气数据中洞察到有价值的信息。Aurora 所展示出的创新天气预测方法,有望显著提升人们预测并减轻极端天气事件影响的能力,包括对风暴“夏兰”这类恶劣天气事件的急剧恶化进行预测。

Aurora 论文:Aurora: A Foundation Model of the Atmosphere

灵活的大气三维基础模型

Aurora 的有效性在于它经过了超一百万小时的多样化天气和气候模拟的训练,能够全面了解大气动力学。这使得该模型在广泛的预测任务中都表现出色,即使在数据稀疏的地区或极端天气的情况下也能如此。通过以0.1°(赤道处约11公里)的高空间分辨率运行,Aurora 可以捕捉大气过程的复杂细节,提供比以往更准确的预报,而且其计算成本仅为传统数值天气预报系统的一小部分。据估计,Aurora 相较于最先进的数值预报系统(Integrated Forecasting System, IFS)可提升约5000倍的计算速度。

Aurora 不仅拥有极高的预报准确性和效率,还具有多功能性,可以预测各种大气变量,从温度和风速到空气污染水平和温室气体浓度。Aurora 的架构旨在处理异构的黄金标准输入,并以不同的分辨率和保真度生成预测。该模型由一个灵活的 3D Swin Transformer 和基于 Perceiver 的编码器和解码器组成,使其能够处理和预测一系列跨空间和压力水平的大气变量。通过对大量多样化数据进行预训练并针对特定任务进行微调,Aurora 学会了捕捉大气中的复杂模式和结构,即使在有限的训练数据下对特定任务进行微调时,它仍然能有出色的表现。

图1:Aurora 架构

图1:Aurora 架构

大气化学和空气污染的快速预测

Aurora 多功能性的一个典型例子是其能够利用哥白尼大气监测服务(CAMS)的数据预测空气污染水平。这是一项众所周知的艰巨任务,因为大气化学、天气模式和人类活动之间复杂的相互作用,以及 CAMS 数据的高度异构性。通过利用灵活的编码器-解码器架构和注意力机制,Aurora 可以有效处理并学习这些具有挑战性的数据,捕捉空气污染物的独特特征及其与气象变量的关系。这使得 Aurora 能够在0.4°的空间分辨率下生成精确的五天全球空气污染预报,并在所有目标的74%中超越了最先进的大气化学模拟,从而证明了 Aurora 在解决各种环境预测问题方面的高度适应性和巨大潜力,即使在数据稀缺或高度复杂的情况下也是如此。

aurora-3-1

图2:Aurora 在许多目标上的表现都优于现行的 CAMS:(a) Aurora 对二氧化氮柱总量的样本预测与 CAMS 的分析比较;(b) Aurora 相对于 CAMS 的纬度加权均方根误差(RMSE),负值(蓝色)表示 Aurora 的表现更佳

图2:Aurora 在许多目标上的表现都优于现行的 CAMS:(a) Aurora 对二氧化氮柱总量的样本预测与 CAMS 的分析比较;(b) Aurora 相对于 CAMS 的纬度加权均方根误差(RMSE),负值(蓝色)表示 Aurora 的表现更佳

利用数据多样性与模型缩放改善大气预测

该研究的主要发现之一是,与在单一数据集上的训练相比,在多样化的数据集上进行预训练可以显著提升 Aurora 的性能。通过整合气候模拟、再分析产品及业务预报的数据,Aurora 能够学习到更强大、更通用的大气动力学表征。得益于庞大的规模和多样化的预训练数据,Aurora 可以在各种任务和分辨率上,超越目前最先进的数值天气预报模型和专业的深度学习方法。

aurora-4-1

aurora-4-2

图3:在不同数据上进行预训练并扩大模型规模均有助于提升性能

图3:在不同数据上进行预训练并扩大模型规模均有助于提升性能

Aurora 模型的规模化直接带来了在架构设计、训练数据语料库以及预训练和微调协议方面的性能优势,使得 Aurora 的性能超过了现有的专业深度学习模型。为进一步验证在多个数据集上预训练大模型的优势,研究员们将 Aurora 与 GraphCast 进行了比较,后者仅在 ERA5 上进行了预训练,并被认为是分辨率为0.25°、交付时间长达五天的最先进的人工智能模型。此外,研究员们还将 IFS HRES(数值天气预报的黄金标准)也纳入了比较范围。结果表明,无论是在与气象分析、气象站观测数据还是极端值的对比中,Aurora 的表现均优于 GraphCast 和 IFS HRES。

aurora-5-1

aurora-5-2

图4:在绝大多数目标上,Aurora 的性能都优于现行的 GraphCast 和 HRES。在每幅图中,中心线右侧的值代表高于阈值的累积均方根误差,左侧的值表示低于阈值的累积均方根误差。

图4:在绝大多数目标上,Aurora 的性能都优于现行的 GraphCast 和 HRES。在每幅图中,中心线右侧的值代表高于阈值的累积均方根误差,左侧的值表示低于阈值的累积均方根误差。

地球系统建模的范式转变

Aurora 的影响力远不止于大气预报领域。通过展示基础模型在地球科学中的潜力,该研究为开发覆盖整个地球系统的综合模型奠定了基础。基础模型可以在数据稀缺的情况下出色地完成下游任务,有望使得在数据稀缺地区(例如发展中国家和极地地区)的民众也能够更加平等地获取准确的天气和气候信息。同时,这一进展也将对农业、交通、能源开发以及灾害应对等多个领域产生深远影响,让人们能够更好地适应气候变化带来的挑战。

随着人工智能在环境预测领域的不断进步,微软研究院希望 Aurora 能够成为未来研究和发展的新范式。该研究强调了多样化预训练数据集、模型扩展和灵活架构在构建地球科学强大的基础模型时的重要性。随着计算资源和数据可用性的不断进步,可以预见,未来像 Aurora 这样的基础模型将成为天气和气候领域预测系统的核心,为全球决策者和公众提供及时、准确和可操作的洞见。

这篇关于AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1090072

相关文章

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

五大特性引领创新! 深度操作系统 deepin 25 Preview预览版发布

《五大特性引领创新!深度操作系统deepin25Preview预览版发布》今日,深度操作系统正式推出deepin25Preview版本,该版本集成了五大核心特性:磐石系统、全新DDE、Tr... 深度操作系统今日发布了 deepin 25 Preview,新版本囊括五大特性:磐石系统、全新 DDE、Tree

Linux Mint Xia 22.1重磅发布: 重要更新一览

《LinuxMintXia22.1重磅发布:重要更新一览》Beta版LinuxMint“Xia”22.1发布,新版本基于Ubuntu24.04,内核版本为Linux6.8,这... linux Mint 22.1「Xia」正式发布啦!这次更新带来了诸多优化和改进,进一步巩固了 Mint 在 Linux 桌面

多模块的springboot项目发布指定模块的脚本方式

《多模块的springboot项目发布指定模块的脚本方式》该文章主要介绍了如何在多模块的SpringBoot项目中发布指定模块的脚本,作者原先的脚本会清理并编译所有模块,导致发布时间过长,通过简化脚本... 目录多模块的springboot项目发布指定模块的脚本1、不计成本地全部发布2、指定模块发布总结多模

MySQL中my.ini文件的基础配置和优化配置方式

《MySQL中my.ini文件的基础配置和优化配置方式》文章讨论了数据库异步同步的优化思路,包括三个主要方面:幂等性、时序和延迟,作者还分享了MySQL配置文件的优化经验,并鼓励读者提供支持... 目录mysql my.ini文件的配置和优化配置优化思路MySQL配置文件优化总结MySQL my.ini文件

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统