AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

本文主要是介绍AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著提升。Aurora 不仅在预测技术上取得了重大突破,更在应用层面展现出了巨大潜力。


aurora-1

2023年11月,风暴“夏兰”席卷了欧洲西北部,造成了严重破坏,伴随而来的低压系统刷新了英格兰的记录,成为极为罕见的气象事件。这场风暴的猛烈程度让许多人措手不及,在暴露当前天气预测模型不足的同时,也凸显了气候变化日益加剧的情况下,提升气候预测准确性的迫切需求。我们如何才能更好地预测此类极端天气事件,并做好更为充分的准备?

Charlton-Perez 等人(2024年)近期的一项研究指出,即便是目前最先进的人工智能天气预测模型,在准确捕捉风暴“夏兰”的快速增强过程及其峰值风速方面也面临着挑战。为应对这些挑战,微软研究院开发了先进的人工智能基础模型 Aurora,可以从海量的大气数据中洞察到有价值的信息。Aurora 所展示出的创新天气预测方法,有望显著提升人们预测并减轻极端天气事件影响的能力,包括对风暴“夏兰”这类恶劣天气事件的急剧恶化进行预测。

Aurora 论文:Aurora: A Foundation Model of the Atmosphere

灵活的大气三维基础模型

Aurora 的有效性在于它经过了超一百万小时的多样化天气和气候模拟的训练,能够全面了解大气动力学。这使得该模型在广泛的预测任务中都表现出色,即使在数据稀疏的地区或极端天气的情况下也能如此。通过以0.1°(赤道处约11公里)的高空间分辨率运行,Aurora 可以捕捉大气过程的复杂细节,提供比以往更准确的预报,而且其计算成本仅为传统数值天气预报系统的一小部分。据估计,Aurora 相较于最先进的数值预报系统(Integrated Forecasting System, IFS)可提升约5000倍的计算速度。

Aurora 不仅拥有极高的预报准确性和效率,还具有多功能性,可以预测各种大气变量,从温度和风速到空气污染水平和温室气体浓度。Aurora 的架构旨在处理异构的黄金标准输入,并以不同的分辨率和保真度生成预测。该模型由一个灵活的 3D Swin Transformer 和基于 Perceiver 的编码器和解码器组成,使其能够处理和预测一系列跨空间和压力水平的大气变量。通过对大量多样化数据进行预训练并针对特定任务进行微调,Aurora 学会了捕捉大气中的复杂模式和结构,即使在有限的训练数据下对特定任务进行微调时,它仍然能有出色的表现。

图1:Aurora 架构

图1:Aurora 架构

大气化学和空气污染的快速预测

Aurora 多功能性的一个典型例子是其能够利用哥白尼大气监测服务(CAMS)的数据预测空气污染水平。这是一项众所周知的艰巨任务,因为大气化学、天气模式和人类活动之间复杂的相互作用,以及 CAMS 数据的高度异构性。通过利用灵活的编码器-解码器架构和注意力机制,Aurora 可以有效处理并学习这些具有挑战性的数据,捕捉空气污染物的独特特征及其与气象变量的关系。这使得 Aurora 能够在0.4°的空间分辨率下生成精确的五天全球空气污染预报,并在所有目标的74%中超越了最先进的大气化学模拟,从而证明了 Aurora 在解决各种环境预测问题方面的高度适应性和巨大潜力,即使在数据稀缺或高度复杂的情况下也是如此。

aurora-3-1

图2:Aurora 在许多目标上的表现都优于现行的 CAMS:(a) Aurora 对二氧化氮柱总量的样本预测与 CAMS 的分析比较;(b) Aurora 相对于 CAMS 的纬度加权均方根误差(RMSE),负值(蓝色)表示 Aurora 的表现更佳

图2:Aurora 在许多目标上的表现都优于现行的 CAMS:(a) Aurora 对二氧化氮柱总量的样本预测与 CAMS 的分析比较;(b) Aurora 相对于 CAMS 的纬度加权均方根误差(RMSE),负值(蓝色)表示 Aurora 的表现更佳

利用数据多样性与模型缩放改善大气预测

该研究的主要发现之一是,与在单一数据集上的训练相比,在多样化的数据集上进行预训练可以显著提升 Aurora 的性能。通过整合气候模拟、再分析产品及业务预报的数据,Aurora 能够学习到更强大、更通用的大气动力学表征。得益于庞大的规模和多样化的预训练数据,Aurora 可以在各种任务和分辨率上,超越目前最先进的数值天气预报模型和专业的深度学习方法。

aurora-4-1

aurora-4-2

图3:在不同数据上进行预训练并扩大模型规模均有助于提升性能

图3:在不同数据上进行预训练并扩大模型规模均有助于提升性能

Aurora 模型的规模化直接带来了在架构设计、训练数据语料库以及预训练和微调协议方面的性能优势,使得 Aurora 的性能超过了现有的专业深度学习模型。为进一步验证在多个数据集上预训练大模型的优势,研究员们将 Aurora 与 GraphCast 进行了比较,后者仅在 ERA5 上进行了预训练,并被认为是分辨率为0.25°、交付时间长达五天的最先进的人工智能模型。此外,研究员们还将 IFS HRES(数值天气预报的黄金标准)也纳入了比较范围。结果表明,无论是在与气象分析、气象站观测数据还是极端值的对比中,Aurora 的表现均优于 GraphCast 和 IFS HRES。

aurora-5-1

aurora-5-2

图4:在绝大多数目标上,Aurora 的性能都优于现行的 GraphCast 和 HRES。在每幅图中,中心线右侧的值代表高于阈值的累积均方根误差,左侧的值表示低于阈值的累积均方根误差。

图4:在绝大多数目标上,Aurora 的性能都优于现行的 GraphCast 和 HRES。在每幅图中,中心线右侧的值代表高于阈值的累积均方根误差,左侧的值表示低于阈值的累积均方根误差。

地球系统建模的范式转变

Aurora 的影响力远不止于大气预报领域。通过展示基础模型在地球科学中的潜力,该研究为开发覆盖整个地球系统的综合模型奠定了基础。基础模型可以在数据稀缺的情况下出色地完成下游任务,有望使得在数据稀缺地区(例如发展中国家和极地地区)的民众也能够更加平等地获取准确的天气和气候信息。同时,这一进展也将对农业、交通、能源开发以及灾害应对等多个领域产生深远影响,让人们能够更好地适应气候变化带来的挑战。

随着人工智能在环境预测领域的不断进步,微软研究院希望 Aurora 能够成为未来研究和发展的新范式。该研究强调了多样化预训练数据集、模型扩展和灵活架构在构建地球科学强大的基础模型时的重要性。随着计算资源和数据可用性的不断进步,可以预见,未来像 Aurora 这样的基础模型将成为天气和气候领域预测系统的核心,为全球决策者和公众提供及时、准确和可操作的洞见。

这篇关于AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1090072

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验