Aurora是微软研究院推出的13亿参数的大气基础模型,基于从海量大气数据中提取有价值信息,用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训练和微调的架构,处理不同分辨率和压力水平的数据。Aurora在多个预测任务中表现出色,包括高分辨率天气预测、空气污染预测和热带气旋轨迹预测,计算速度比传统数值天气模型快约5000倍。模型提高了预测精度,降低计算成本,为应对气候变化和极端天气事件提供有力工具。
Aurora的主要功能
- 高分辨率天气预测:Aurora能生成高分辨率(如0.1°)的全球天气预测,覆盖未来10天的气象变量,包括温度、风速、气压等。
- 空气污染预测:Aurora能预测全球空气污染水平,包括二氧化氮(NO₂)、二氧化硫(SO₂)、臭氧(O₃)和颗粒物(PM1、PM2.5、PM10)等污染物的浓度。
- 海洋波浪预测:Aurora能预测海洋波浪的高度、周期和方向,帮助航运、沿海防御和海洋能源开发等领域。
- 热带气旋轨迹预测:Aurora能准确预测热带气旋的移动轨迹,为防灾减灾提供重要支持。
- 极端天气事件预测:Aurora在预测极端天气事件(如风暴、洪水、干旱)方面表现出色,能提前发出预警,减少灾害损失。
Aurora的技术原理
- 基础模型架构:Aurora用预训练和微调的两阶段训练方法。预训练阶段,模型在大量多样化的大气数据上学习通用的天气和气候表示;微调阶段,模型针对特定任务(如天气预测或空气污染预测)进行优化。
- 3D Swin Transformer:Aurora的核心是灵活的3D Swin Transformer,支持处理不同空间分辨率和压力水平的大气变量。
- Perceiver编码器和解码器:基于Perceiver的编码器和解码器,处理异构输入,在不同分辨率和保真度下生成预测。
- 数据多样性:在预训练阶段用多种数据源,包括分析数据、再分析数据、气候模拟和业务预报数据。多样化的数据输入让模型能学习到更广泛的大气动力学模式。
- 计算效率:基于高效的模型架构和训练方法,显著提高计算效率,在短时间内生成高精度的预测,计算速度比传统数值天气模型快约5000倍。
Aurora的项目地址
- 项目官网:https://microsoft.github.io/aurora
- GitHub仓库:https://github.com/microsoft/aurora
- arXiv技术论文:https://arxiv.org/pdf/2405.13063