大模型能否提高台风预报的准确性?


【资料图】

作者|王博

“我们已经做好准备了。”

一位福建漳州的网友在社交媒体上展示了全套的防台风装备,她不仅给窗户贴上了胶带,还用木板和木棍牢牢抵住了窗户。尽管做了这些准备,但是她还是有些担心地说:“希望有用吧。”

在厦门市湖里区长乐三期小区,小区门口的扩音器不断播放着防台风注意事项,小区的树叶掉落区和外墙脱落区也拉起了安全警戒线,以防居民靠近发生危险。

当地居民严阵以待的,就是今年第5号台风“杜苏芮”。

而在距离厦门2000多公里的北京,自从7月21日“杜苏芮”生成后,中央气象台的预报员们就在密切关注台风的移动路径,并发布预报和预警信息。

“预警发出去,通常就睡不着了,就算已经下班,也会随时盯着看台风到底在哪里登陆。”国家气象中心台风与海洋气象预报中心首席预报员高拴柱在接受中国气象报社记者采访时说。

7月24日,中央气象台发布预报信息,“杜苏芮”将于28日上午登陆,最大可能在福建中南部沿海登陆。7月27日,中央气象台继续发布预报信息,“杜苏芮”将于28日早晨到上午登陆,最大可能在福建东山到惠安沿海登陆 (强台风级或超强台风级) 。

“尤其是自己做的预报,很想知道有没有报准,那种心情就跟等待考试成绩出来一样。”高拴柱说。

据中央气象台监测,“杜苏芮”的中心在7月28日9时55分前后在福建晋江沿海登陆,登陆时中心附近最大风力50米/秒,强度为强台风级。晋江就在东山到惠安之间。

台风预报从来都不是一件容易的事情。

在百度“台风吧”中,有网友对比了国内外专业气象机构发布的“杜苏芮”预报,光是登陆地点,就有广东、福建、浙江等多个版本。而AI气象大模型在台风预报中的表现也是近期“台风吧”内热议的话题之一,其中一款国产气象大模型关于“杜苏芮”路径的预报图被吧友频繁引用,该大模型除了在“杜苏芮”产生之初预测的登陆地有些偏差外,后续预测的登陆地就一直是福建。

国产气象大模型也得到了“国家队”的认可。根据中国气象报社的报道, 国家气象中心台风与海洋气象预报中心在“杜苏芮”影响期间,就与浦江实验室、华为公司联合开展了人工智能大模型试验,在台风预报中应用了“风乌”“盘古大模型”。

当一些AI大模型的应用走出PPT,它们可能没有出现在热搜、头条中,甚至不容易被大众感知,但是它们提供了专业的工具,提高了分析速度和精度,创造了经济价值,甚至挽救了生命。

“杜苏芮”路径预报(图片来源:香港天文台)

7月21日“杜苏芮”生成后,香港天文台给出过一版路径预报,“杜苏芮”登陆华东或是华南都存在一定可能性。有网友基于这张图调侃,“这范围像老师给划的重点,第一页到最后一页”。

调侃归调侃,其他国家或地区的专业气象机构预测的“杜苏芮”路径也存在差异,台风预测需要经过反复研判分析,不断根据最新监测数据,滚动订正预测结果。

“杜苏芮”本身也很特殊,一路上拐了多个直角弯,多次冲上“热搜”。此前,中央气象台专家在分析“杜苏芮”的情况时坦言,“杜苏芮”移动路径不确定性大,具体登陆位置很难确定,强度变化也需要再三分析。

“杜苏芮”路径图(图片来源:中央气象台·台风网)

回顾历史,1986年的“韦恩”、1991年的“纳德”以及2001年的“百合”,都是路径较为曲折的台风,有的甚至可以用“贪吃蛇”般的走位来形容,这给台风预报带来了很多不确定性。

将台风预报的不确定性降到最低,是各家专业气象机构的目标。 台风预报路径越准确,相关地区的防范措施越及时、有效,台风对人的伤害就会越小。从经济角度来看,2017年发表的《登陆热带气旋路径和强度预报的效益评估初步研究》一文就指出,对于登陆中国大陆的台风, 24小时路径预报误差每减小1千米,可减少因灾直接经济损失约亿元。

但是,减少台风预报的不确定性是一个长期且缓慢的过程。《自然》 (Nature) 杂志在2015年刊载的《数值天气预报的寂静革命》 (The quiet revolution of numerical weather prediction) 一文就指出,囿于气象观测的准确度,大气系统中物理过程的复杂性,以及求解大气模型所需资源规模巨大,全球中期天气预报的有效性每10年才提高1天。

根据中国气象局、日本气象厅、美国联合台风警报中心等专业气象机构的评估报告,从1990年到2020年,西北太平洋台风路径预报能力进步显著,2020年的72小时预报已达到上世纪90年代初的24小时预报水平,可预报时效延长了整整2天。但是, 各机构的评估结果还表明,台风路径预报误差的减小趋势在近几年明显减缓。 这引发了学术界对台风路径预报是否已接近可预报性极限的关注。

上海台风研究所余晖研究员团队2022年初在美国气象学会会刊BAMS上发表文章指出,从1990年到2020年,西北太平洋台风路径预报技术的发展经历了三个阶段,每个阶段历时约10年。

在1990年代,气候类和统计类方法占主导,区域数值模式崭露头角。 进入2000年代后,区域和全球数值模式均飞速发展,气候和统计类方法逐步退出了历史舞台。 2010年代,随着分辨率的进一步提升,全球数值模式逐渐居于主导地位。同时,关于台风预报技术和数据的国际合作极大推动了基于集合预报系统和多模式预报的客观集成预报技术在各大机构的广泛应用,也使得各机构的台风路径预报表现出显著的趋同性。

余晖在文中同时表示,假设过去十年的发展趋势能继续保持,预计将在2035年前后达到由当前台风位置观测能力所决定的预报极限。

那么,台风路径预报是否已接近可预报性极限?还有没有方式可以提高台风预报的准确性?

变化已经发生。

2023年7月6日,《自然》 (Nature) 杂志正刊发表了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期全球天气预报》 (Accurate medium-range global weather forecasting with 3D neural networks) 。数据显示,这是近年来中国科技公司首篇作为唯一署名单位发表的《自然》正刊论文。

《自然》审稿人对该成果给予高度评价: “华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”

华为云盘古气象大模型研究成果在《自然》(Nature)杂志正刊发表(图片来源:《自然》(Nature)杂志)

今年4月7日,上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所及上海中心气象台发布全球中期天气预报大模型“风乌”。

“风乌”取名自秦汉时期的“相风铜乌”,是世界上最早的测风设备。

在2023世界人工智能大会上,这两款大模型也受到了关注。尤其在华为云盘古气象大模型团队的论文登上《自然》 (Nature) 杂志的消息传开后,很多人慕名来到华为云盘古气象大模型的展位了解情况,在展位负责讲解的工作人员告诉「甲子光年」:“今年5月,在台风‘玛娃’的路径预报中,华为云盘古气象大模型就在应用了,提前五天预报出‘玛娃’的转向路径。”

华为云盘古气象大模型在2023世界人工智能大会展示(图片来源:「甲子光年」现场拍摄)

同样在大会上,上海人工智能实验室方面也介绍,“风乌”对台风“玛娃”进行了准确的轨迹预报。

AI气象大模型预报似乎有超过传统的数值天气预报 (numerical weather prediction) 之势。

数值天气预报是指根据大气实际情况,在一定的初值和边值条件下,通过大型计算机作数值计算,求解描写天气演变过程的流体力学和热力学的方程组,预测未来一定时段的大气运动状态和天气现象的方法。

近三十年来,随着算力的迅速发展,数值天气预报在每日天气预报、极端灾害预警、气候变化预测等领域取得了巨大的成功。 但是随着算力增长的趋缓和物理模型的逐渐复杂化,传统数值预报的瓶颈日益突出:一方面,传统数值预报对算力的消耗非常大;另一方面,复杂的参数化物理模型始终是不完备的。

中国气象学会副理事长、国防科技大学气象海洋学院教授费建芳表示,近10年来,台风路径预报准确率稳步提升,而强度预报准确率提升较为缓慢,主要是数值模式对海洋响应过程的描述还不够准确。“提高台风预报水平,实现科学减灾,迫切需要进一步深入研究台风影响下的多尺度海气相互作用过程,研发准确考虑海气相互作用过程的海气耦合数值预报系统。”费建芳说。

近年来,研究者们开始尝试引入AI大模型来进行气象预报。

2021年,华为云提出要打造针对气象领域的垂直行业大模型,但是在研发初期,团队发现AI预报的精度无法超越数值预报方法,这让其大模型的发展一度陷入瓶颈。

华为云研发团队发现,AI气象预报模型的精度不足主要有两个原因:第一,原有的AI气象预报模型都是基于2D神经网络,无法很好地处理不均匀的3D气象数据;第二,AI方法缺少数学物理机理约束,因此在迭代的过程中会不断积累迭代误差。

为此,团队创造性地提出了适应地球坐标系统的三维神经网络 (3D Earth-Specific Transformer) 来处理复杂的不均匀3D气象数据,并且使用层次化时域聚合策略来减少预报迭代次数,从而减少迭代误差。

在台风预报领域,原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,只需1台服务器、1卡配置、10秒时间,就可以获得更精确的预测结果。

华为云盘古气象大模型方面表示,通过在43年的全球天气数据上训练深度神经网络,盘古气象大模型在精度和速度方面超越传统数值预测方法。例如,在热带风暴预测任务中,盘古气象大模型的预测精度显著超过欧洲气象中心的高精度预报 (ECMWF HRES Forecast) 结果。

但是,去年11月,在社交媒体上,曾有气象专家质疑其有过度宣传之嫌。对此,华为云盘古气象大模型论文创作团队成员解释:“我们将NWP (数值天气预报) 限定为‘基于同化数据进行预测的方法’,而不是指代‘整个数值气象预报领域’。盘古确实首次在同化数据上超越了传统方法,我们使用了与英伟达FourCastNet完全相同的测试环境,确保对比的公平性和结论的可信度。”

对于AI和传统数值预报的关系,上海人工智能实验室在其官网文章中表达了观点:实践证明,将观测与数值预报和人工智能相结合,可有效提升数值预报的准确性。由于不需要通过复杂的物理系统仿真,AI气象预报模型突破了传统预报方法的计算瓶颈,因此能够高效地进行预报和集成。

AI to B已是行业大趋势,深度融合、优势互补,为人们生产、生活提供更准确、更实用的信息和分析才是新技术应用的目的。

今年第5号台风“杜苏芮”刚刚登陆,第6号台风“卡努”则已在菲律宾以东洋面上生成。

在下一场台风来临之前,相信会有更多人根据预报信息说出:

“我们已经做好准备了。”

(封面图:台风“杜苏芮”登陆前卫星云图。图片来源:国家卫星气象中心)

参考资料:

*《“捕”台风的人———走进“杜苏芮”登陆前的中央气象台》,中国气象报社

/2011xwzx/2011xqxxw/2011xqxyw/202307/t20230727_

*《专家详解:“杜苏芮”系本世纪以来对福建影响最严重的台风之一》,澎湃新闻

/s?id=1772621967125574401

*台风路径预报是否已接近可预报性极限?

/keyanchengguo/

*《华为云盘古气象大模型研究成果在《Nature》正刊发表》,华为官网

/cn/news/2023/7/pangu-ai-model-nature-publish

*《华为云提出盘古气象大模型:中长期气象预报精度首次超过传统数值方法,速度提升10000倍以上》,盘古气象大模型团队

/p/582285853

*《上海人工智能实验室发布“风乌”大模型,全球气象有效预报时间首破10天》,上海人工智能实验室

/news/5443382

推荐内容