中国工程院院士、中国气象科学研究院研究员张小曳的团队基于地面气象观测数据,构建了考虑空间气象效应的高性能机器学习模型,能够获取1960年代以来的长序列细颗粒物(PM2.5)历史数据集。该数据集对理解气溶胶长期变化趋势、环境和气候影响以及通过同化到化学-天气耦合模型中构建长期再分析数据具有重要价值。
我国PM2.5业务观测始于2013年,在此之前的历史数据难以获取,导致长序列PM2.5数据缺失,为认识PM2.5长期变化带来挑战。为解决这一问题,张小曳团队基于国家级地面气象观测网,抽取空间特征并结合先进的机器学习技术(LightGBM),构建了考虑空间气象效应的高性能机器学习模型,获取1960年代以来的长序列PM2.5历史数据集。
此前已经存在基于卫星气溶胶光学厚度(AOD)来估算PM2.5的方法,但卫星数据中存在大量缺失值、采样频率低且整体预测能力不高,估算结果在很大程度上受到了影响。与卫星数据相比,地面气象观测具有序列时间长、时间分辨率高、数据完整性好等优势。
目前,我国PM2.5观测站点的空间分布不均,大部分都位于中东部城市地区。相比之下,气象站的分布较为均匀,且密度较高。因此,除了补足历史数据之外,该模型还能利用气象站数据构建高时间分辨率的密集PM2.5格点网络。