当下,AI几乎无处不在——无论是你打字时被数字"助手"不断打断,还是想买一台不需要联网的冰箱却发现难觅踪影。面对这股浪潮,你或许会忍不住发问:我们究竟是站在了一场技术飞跃的门槛上,还是只是在为一堆泡沫摇旗呐喊?
那么,AI在天气预报和气候建模领域日益广泛的应用,又该如何看待?
今年年初,一件事让这场讨论开局不利——美国国家气象局某办公室发布了一张预报地图,图上出现了几个莫名其妙的爱达荷州城市名称,比如"Whata Bod"和"Orangeotild"。好在这只是用于社交媒体的AI生成图片,并非真正的预报模型。气象学家和气候科学家目前还没有被大语言模型的提示词工程师所取代。
但AI确实已经以机器学习的形式进入了这些领域。研究人员对这些技术已有多年的深入研究,其优势与局限也相对清晰。值得注意的是,天气预报模型与气候模拟模型在AI技术的应用方式上有所不同,这背后自有其合理逻辑。
在这些模型中,"AI"指的就是机器学习。无需深入其众多技术变体的细节,其核心思路其实很简单:让计算机从数据中发现规律。
机器学习的起点是从零开始训练模型。首先为模型确定一个结构——比如神经网络——其中包含大量可独立调节的参数,用于精细控制算法行为。随后,模型会被输入海量带标注的样本数据,例如数千张按物种分类的鸟类照片。模型通过反复迭代,找到最优参数组合,从而将图像内容与正确的物种标签对应起来。
此外,如果不投入大量额外工作,我们往往无法得知模型是如何得出结论的。其内部机制大多数时候都是一个"黑盒"。
不过,机器学习的优势也是实实在在的。机器学习算法往往能超越我们精心设计的人工算法——至少在计算效率上如此,有时在精度上也不例外。关键在于是否使用得当,一旦方法失当,其局限性便会暴露无遗。
谷歌、英伟达、华为、微软等多家公司已陆续开发出初代机器学习天气模型——有些还与独立学术机构合作完成——其预报效果可与现有模型相媲美。随着研究人员逐步摸清这些模型的优势与短板,多个主要天气预报中心也开始着手自主研发。
欧洲中期天气预报中心(ECMWF)于2025年2月正式投入使用其首个基于机器学习的模型,并与其长期运行的综合预报系统(IFS)并行运作。
这一名为AIFS的模型以再分析数据集为基础进行训练。所谓再分析数据集,是通过整合所有可用的气象观测数据,在缺乏实测的区域补全一幅物理上自洽的全球气象图景。这一关键工具极大简化了机器学习的任务:基于过去的气象快照,预测下一个时间节点(六小时后)的全球气象状态。
Q&A
Q1:机器学习在天气预报模型中是如何工作的?
A:天气预报中的机器学习模型,通过学习两组相邻时间点的气象数据来训练,使其能够预测下一个时间节点的天气状况。由于不需要在每个地点求解大量物理方程,这类模型运行速度远快于传统气象模型。目前谷歌、英伟达、华为、微软等公司均已开发出相关模型,欧洲中期天气预报中心也于2025年2月正式启用了自研的AIFS机器学习模型。
Q2:机器学习算法有哪些主要局限性?
Q3:ECMWF的AIFS模型是用什么数据训练的?
A:AIFS模型使用"再分析数据集"进行训练。再分析数据集是通过整合所有可用的气象观测数据,在没有实测数据的区域补全一幅物理上自洽的全球气象图景所构建的数据集。这种数据处理方式大大简化了机器学习的任务,让模型能够基于历史气象快照,有效预测六小时后的全球气象状态。