空气污染是一个全球性问题,中国尤为严重。近年来,随着治理力度的不断加大,空气污染治理取得了长足进步,但与发达国家的标准相比仍存在一定差距。PM2.5(直径小于2.5微米的颗粒物)不仅能够深入人体呼吸道和肺部,还可能通过血液循环影响心血管系统,引发多种疾病。为了降低 PM2.5 带来的危害,准确预测未来的 PM2.5 浓度对于政府和公众至关重要。例如,通过预测高浓度污染的发生时间和范围,可以帮助城市管理者采取提前限产或限行等应对措施。
然而,PM2.5 浓度的预测是一项极具挑战的任务,其主要复杂性体现在以下两方面:
1. 复杂多因素耦合:PM2.5 的生成和扩散过程受到多种因素影响,包括污染源的排放强度、地理环境特性以及气象条件(如风速、温度和湿度)的动态变化。这些因素之间通常存在复杂的非线性关系。
2. 长程时空依赖:PM2.5 不仅局限于局地扩散,还可能随着气流进行长距离传输,覆盖多个区域并持续数天。准确预测这一过程需要综合考虑空间传输和时间动态。
传统的空气质量预报模型,如CMAQ(Community Multiscale Air Quality),依赖于基于微分方程的数值模拟,其核心在于排放清单的准确性。然而,排放清单通常存在滞后性和不确定性,直接影响了模型的预报精度。此外,CMAQ 在计算时需要处理复杂的微分方程,计算量庞大,难以实现实时的高效预报。一般的深度学习预测方法(如基于图像或图结构的方法)在处理上述复杂性和长时间依赖性方面存在显著不足。基于图像的卷积神经网络(CNN)通常依赖固定网格来建模空间相关性,但无法有效处理监测站分布不均的情况。另一方面,基于图的图卷积网络(GCN)尽管能够利用不规则的空间结构,但在传统实现中通常只考虑静态无向图,忽略了如风向等领域知识的重要性。
针对这些问题,我们提出了一种新型的 PM2.5 浓度预测方法:PM2.5-GNN (Wang, S. et al. PM2.5-GNN)。该方法通过引入领域知识(如气象特征和地理特性)构建动态有向图,结合图神经网络(GNN)与时空递归神经网络(GRU),实现对 PM2.5 浓度的高精度预测。
模型设计
我们基于城市的空间位置构建了如下所示的图(Graph)用来建模空气污染的空间相关性。
其中,
节点(Node):代表城市,每个节点 i 与其对应的 PM2.5 浓度 及气象特征
相关联。
边(Edge):表示城市之间的潜在污染物传输路径。边的属性由传输系数 S 表示。
节点特征:每个节点 i 的特征由两部分组成:
1. PM2.5 浓度历史值:表示城市 i 在上一时间步的 PM2.5 浓度,反映了污染物的历史状态。
• 边界层高度(PBL):影响大气垂直扩散能力。
• 风速和风向:影响污染物的水平传输能力。
• 温度和湿度:与污染物的化学反应(如二次颗粒物的生成)有关。
• 降水量:通过湿沉降机制降低 PM2.5 浓度。
• 气压:与大气稳定性相关。
节点特征用表示为:。
边特征:
2. 传输方向 :由风向与城市间连线的夹角
决定。
3. 城市间距离 d:表示城市 i 和 j 之间的地理距离。
消息传递机制:消息传递机制是图神经网络的核心,用于在图结构中传递和聚合信息。PM2.5-GNN 的消息传递机制专门设计用于捕捉城市间污染物的传输特性,结合节点和边的动态特征,动态地计算每个节点的状态表示。
边信息生成:边信息生成的目的是通过边上的动态特征(如风速、风向、节点间距离)以及相邻节点的状态,构造从节点 j 到节点 i 的传输信息:
1. 短期动态:突发污染事件(如工业排放、交通高峰)或气象条件(如冷空气)引起的快速变化。
2. 长期趋势:污染物的累积效应和气象条件长期稳定时的扩散行为。
传统图神经网络难以捕捉时间动态特性,而 PM2.5-GNN 通过引入 GRU(Gated Recurrent Unit)模块,结合节点的历史信息和空间动态信息,实现对时间序列的高效建模。
输入表示 GRU 的输入由当前节点特征和来自 GNN 模块的空间特征
拼接而成:
,
: 包含当前时间步的气象变量和历史 PM2.5 浓度。
: 表示邻居节点对当前节点的传输影响。污染物浓度的时间变化不仅与历史值相关,还受到空间传输特性的影响。将
,
结合,可以让 GRU 同时建模时间和空间依赖。
节点 i 在时间 t 的隐藏状态,包含当前节点的历史信息。
GRU 的两个关键机制:
更新门 :决定新信息与历史信息的融合程度。
重置门 :控制历史信息对当前输入的影响。
隐藏状态更新:
总体性能:PM2.5-GNN在所有数据集上表现最佳,RMSE,MAE 等指标显著优于其他模型。
尽管 PM2.5-GNN 取得了良好的性能,未来仍有多方面的改进方向:
增强模型解释性:引入可解释性模块,帮助揭示 PM2.5 的主要污染源及其影响因子,为政策制定提供科学依据。
集成多模态数据:结合卫星遥感数据(如 AOD)与地面监测数据,进一步提升模型的预测精度和空间分辨率。
适配多区域预测:优化模型在全球不同区域的适应性,扩展到跨国界的污染物传输建模任务。
通过进一步优化,PM2.5-GNN 有望成为高效、准确、可扩展的空气质量预报工具,为全球空气污染治理提供支持。
Wang, S. et al. PM2.5-GNN: A Domain Knowledge Enhanced Graph Neural Network For PM2.5 Forecasting. ACM SIGSPATIAL 163–166 (2020) doi:10.1145/3397536.3422208.
代码详见:https://github.com/shuowang-ai/PM2.5-GNN