cover_image

PM2.5-GNN:领域知识增强的图神经网络 PM2.5 预测模型

王硕 彩云技术团队
2025年01月06日 05:03

空气污染是一个全球性问题,中国尤为严重。近年来,随着治理力度的不断加大,空气污染治理取得了长足进步,但与发达国家的标准相比仍存在一定差距。PM2.5(直径小于2.5微米的颗粒物)不仅能够深入人体呼吸道和肺部,还可能通过血液循环影响心血管系统,引发多种疾病。为了降低 PM2.5 带来的危害,准确预测未来的 PM2.5 浓度对于政府和公众至关重要。例如,通过预测高浓度污染的发生时间和范围,可以帮助城市管理者采取提前限产或限行等应对措施。

图片

图1. 彩云天气APP空气页面

然而,PM2.5 浓度的预测是一项极具挑战的任务,其主要复杂性体现在以下两方面:

1. 复杂多因素耦合:PM2.5 的生成和扩散过程受到多种因素影响,包括污染源的排放强度、地理环境特性以及气象条件(如风速、温度和湿度)的动态变化。这些因素之间通常存在复杂的非线性关系。

2. 长程时空依赖:PM2.5 不仅局限于局地扩散,还可能随着气流进行长距离传输,覆盖多个区域并持续数天。准确预测这一过程需要综合考虑空间传输和时间动态。

传统的空气质量预报模型,如CMAQ(Community Multiscale Air Quality),依赖于基于微分方程的数值模拟,其核心在于排放清单的准确性。然而,排放清单通常存在滞后性和不确定性,直接影响了模型的预报精度。此外,CMAQ 在计算时需要处理复杂的微分方程,计算量庞大,难以实现实时的高效预报。一般的深度学习预测方法(如基于图像或图结构的方法)在处理上述复杂性和长时间依赖性方面存在显著不足。基于图像的卷积神经网络(CNN)通常依赖固定网格来建模空间相关性,但无法有效处理监测站分布不均的情况。另一方面,基于图的图卷积网络(GCN)尽管能够利用不规则的空间结构,但在传统实现中通常只考虑静态无向图,忽略了如风向等领域知识的重要性。

针对这些问题,我们提出了一种新型的 PM2.5 浓度预测方法:PM2.5-GNN (Wang, S. et al. PM2.5-GNN)。该方法通过引入领域知识(如气象特征和地理特性)构建动态有向图,结合图神经网络(GNN)与时空递归神经网络(GRU),实现对 PM2.5 浓度的高精度预测。


模型设计

数据特征

PM2.5 的生成、传输和扩散过程受到多个动态因素的综合影响。污染源排放是基础驱动,例如工业排放、交通尾气、燃煤和秸秆焚烧。然而,这些初始排放并非孤立的,它们与气象条件(如风速、湿度、降水等)以及地理环境特性(如山脉阻隔)相互作用,形成复杂的污染动态。例如:气象条件的作用:强风速可能促进污染物的水平传输,而低风速条件下污染物容易累积。降水则会通过湿沉降机制降低 PM2.5 浓度。地理因素的影响:高山地形会对污染物的传输形成阻碍,从而导致局地污染的加剧。

图片

图2. 污染扩散示意图

图神经网络

图神经网络具有以下显著优势:
1. 灵活性:能够自然处理不规则的空间结构(空气质量监测站点,在地理空间稀疏且不规则分布),并通过消息传递机制建模复杂的非欧空间关系。
2. 动态扩展性:可以通过引入动态图表示多时间步的时空变化。
3. 可组合性:易于与其他深度学习模块(如RNN或Transformer)结合,以实现更高维度的时空建模。
图神经网络(Graph Neural Network, GNN)是 PM2.5-GNN 的核心模块,主要用于捕捉城市间的空间相关性,建模污染物在不同城市之间的传输过程。其设计考虑了以下两点:
1. 动态传输过程:PM2.5 的扩散受到风速、风向等动态气象因素的显著影响。这些信息通过边特征和消息传递机制反映。
2. 领域知识增强:引入领域知识(如地理距离、气象特征)来更准确地描述城市之间的污染物交互关系。


的定义

我们基于城市的空间位置构建了如下所示的图(Graph)用来建模空气污染的空间相关性。

图片

图3. 城市网络(Graph)

其中,

节点(Node):代表城市,每个节点 i 与其对应的 PM2.5 浓度 图片及气象特征 图片相关联。

(Edge):表示城市之间的潜在污染物传输路径。边的属性由传输系数 S 表示。

节点特征:每个节点 i 的特征由两部分组成:

1. PM2.5 浓度历史值:表示城市 i 在上一时间步的 PM2.5 浓度,反映了污染物的历史状态。

2. 气象特征图片:包括以下变量:

•  边界层高度(PBL):影响大气垂直扩散能力。

•  风速和风向:影响污染物的水平传输能力。

•  温度和湿度:与污染物的化学反应(如二次颗粒物的生成)有关。

•  降水量:通过湿沉降机制降低 PM2.5 浓度。

•  气压:与大气稳定性相关。

节点特征用表示为:图片

图片

边特征

边特征图片表示从城市 j 到城市 i 的传输能力,主要由以下三部分构成:
1.  风速 |v| :描述污染物水平移动的强度。

2.  传输方向 图片:由风向与城市间连线的夹角图片决定。

3.  城市间距离 d:表示城市 i 和 j 之间的地理距离。

图片

定义平流系数 S 为:
图片
其中,ReLU 函数确保传输系数非负。

图片

图4. 平流系数计算示意图


图神经网络模块


消息传递机制:消息传递机制是图神经网络的核心,用于在图结构中传递和聚合信息。PM2.5-GNN 的消息传递机制专门设计用于捕捉城市间污染物的传输特性,结合节点和边的动态特征,动态地计算每个节点的状态表示。

边信息生成:边信息生成的目的是通过边上的动态特征(如风速、风向、节点间距离)以及相邻节点的状态,构造从节点 j 到节点 i 的传输信息:

图片

    图片:节点 j 的特征,包括历史 PM2.5 浓度和气象变量。
    图片:边的特征,描述了污染物从 j 到 i 的传输能力。
    图片:多层感知机(MLP),用于映射输入到边的信息表示。
边信息生成机制的设计启发自污染物的传输过程。在实际大气环境中,污染物的扩散受到风速、风向等动态因素的显著影响,单纯依赖节点信息不足以准确刻画传输行为。通过整合边特征,模型能够动态地模拟污染物在不同城市间的传输。
节点信息聚合节点信息聚合将来自所有邻居节点的信息与当前节点的信息结合,计算目标节点的状态表示:

图片

    图片:节点 i 的邻居节点集合。
    图片:从节点 j 到节点 i 的边信息。
    图片:另一个 MLP,用于提取高阶特征。
污染物的浓度变化不仅与本地的污染源相关,还与周围城市的污染物传输息息相关。通过聚合邻居节点的信息,模型能够有效捕捉污染物的空间扩散特性。此外,采用 MLP 映射使得模型具备较高的非线性表达能力。

时空 GRU 模块


图片

图5. PM2.5-GNN 框图

PM2.5 浓度的变化具有显著的时间动态特性,包括:

1. 短期动态:突发污染事件(如工业排放、交通高峰)或气象条件(如冷空气)引起的快速变化。

2. 长期趋势:污染物的累积效应和气象条件长期稳定时的扩散行为。

传统图神经网络难以捕捉时间动态特性,而 PM2.5-GNN 通过引入 GRU(Gated Recurrent Unit)模块,结合节点的历史信息和空间动态信息,实现对时间序列的高效建模。

输入表示 GRU 的输入由当前节点特征图片和来自 GNN 模块的空间特征图片拼接而成:图片图片包含当前时间步的气象变量和历史 PM2.5 浓度。图片表示邻居节点对当前节点的传输影响。污染物浓度的时间变化不仅与历史值相关,还受到空间传输特性的影响。将图片图片结合,可以让 GRU 同时建模时间和空间依赖。

状态更新 GRU 模块通过门控机制更新隐藏状态,捕捉时间动态特性:

图片

图片节点 i 在时间 t 的隐藏状态,包含当前节点的历史信息。

GRU 的两个关键机制:

更新门 图片:决定新信息与历史信息的融合程度。

图片

重置门 图片控制历史信息对当前输入的影响。

图片

隐藏状态更新

图片

图片

GRU 的门控机制允许模型灵活控制历史信息和当前输入的权重,避免信息流动过程中因长期依赖导致的梯度消失问题。这种特性对于捕捉 PM2.5 的长期累积效应至关重要。
输出生成:最终输出由隐藏状态通过全连接层生成:

图片

用多层感知机(MLP),用于将隐藏状态映射为 PM2.5 浓度预测值。使用 MLP 作为输出层可以增强非线性表达能力,适配复杂的大气污染数据特性。

实验设计与结果


数据设置

数据集分割:
  • 训练集(2015-2016年):用于模型的训练,包括 PM2.5 浓度和气象特征的历史记录。
  • 验证集(2017年):用于超参数调优和模型性能的中期评估。
  • 测试集(2018年):用于评估模型的泛化能力和最终性能。


对比模型:
  • MLP:仅利用当前节点的特征,无法捕捉空间或时间依赖。
  • LSTM 和 GRU:用于建模时间序列动态,但忽略了空间结构信息。
  • GC-LSTM:结合图卷积网络和 LSTM,但仅支持无向图结构,无法有效处理动态传输信息。


实验结果

总体性能:PM2.5-GNN在所有数据集上表现最佳,RMSE,MAE 等指标显著优于其他模型。

图片

消融实验:移除边界层高度或边特征会显著降低性能。其中,PBL 直接影响大气污染的垂直扩散能力,对污染物的时空扩散建模至关重要。边特征的移除使得模型无法准确刻画污染物的远距离传输行为。

图片

案例分析以图6西安的Case Study为例,分析 PM2.5-GNN 对局地和远程污染传播的建模能力:局地污染:模型能够准确预测西安市区内的 PM2.5 浓度变化趋势,尤其是在高污染天气(如静稳气象条件)下,能够捕捉到污染物的累积效应。远程污染:通过模拟污染物从周边工业城市向西安的传输过程,PM2.5-GNN 成功预测了跨区域污染的时间和强度。这表明,模型在长程时空依赖建模方面具备显著优势。

图片

图6. Case Study

总结

    我们提出的 PM2.5-GNN 模型通过结合领域知识与深度学习技术,在 PM2.5 浓度预测任务中取得了显著优势。实验表明:
  1. 精度提升:通过引入动态边特征(如风速、风向),模型能够更准确地建模污染物的空间扩散和远程传输过程,在 RMSE 和 MAE 等指标上显著优于其他方法。
  2. 高效预测:与基于数值模拟的方法相比,PM2.5-GNN 具备更高的计算效率,适用于实时空气质量预测。
  3. 灵活性强:模型能够适应不同区域和多种复杂气象条件,具备良好的泛化能力。

尽管 PM2.5-GNN 取得了良好的性能,未来仍有多方面的改进方向:

  1. 增强模型解释性:引入可解释性模块,帮助揭示 PM2.5 的主要污染源及其影响因子,为政策制定提供科学依据。

  2. 集成多模态数据:结合卫星遥感数据(如 AOD)与地面监测数据,进一步提升模型的预测精度和空间分辨率。

  3. 适配多区域预测:优化模型在全球不同区域的适应性,扩展到跨国界的污染物传输建模任务。

通过进一步优化,PM2.5-GNN 有望成为高效、准确、可扩展的空气质量预报工具,为全球空气污染治理提供支持。

Reference

Wang, S. et al. PM2.5-GNN: A Domain Knowledge Enhanced Graph Neural Network For PM2.5 Forecasting. ACM SIGSPATIAL 163–166 (2020) doi:10.1145/3397536.3422208.

代码详见:https://github.com/shuowang-ai/PM2.5-GNN

继续滑动看下一个
彩云技术团队
向上滑动看下一个