﻿ 大气污染资料同化与应用综述 大气污染资料同化与应用综述
 大气科学  2018, Vol. 42 Issue (3): 607-620 PDF

1 中国科学院大气物理研究所国际气候与环境科学中心(ICCES), 北京 100029
2 中国科学院大气物理研究所大气边界层物理与大气化学国家重点实验室(LAPC), 北京 100029
3 中国科学院大学, 北京 100049

A Review of Air Quality Data Assimilation Methods and Their Application
ZHU Jiang1,3, TANG Xiao2, WANG Zifa2,3, WU Lin2
1 International Center for Climate and Environment Sciences(ICCES), Institute of Atmospheric Physics, Beijing 100029
2 State Key Laboratory of Atmospheric Boundary Layer Physics and Atmospheric Chemistry(LAPC), Institute of Atmospheric Physics, Beijing 100029
3 University of Chinese Academy of Sciences, Beijing 100049
Abstract: China is facing serious air pollution problems especially that caused by high concentrations of ozone and fine particles. A key step to effectively control air pollution is the modeling and forecasting of air pollution. However, large uncertainties with complicated sources still exist in air pollution forecasting. The nonlinearity in chemical processes makes it difficult to identify those key uncertainty sources and carry out targeted constraints and corrections in the modeling study. Data assimilation method can combine modeling information with multi-source observations to improve the accuracy of air pollution simulation and forecast. In this paper, we briefly introduce model uncertainties, assimilation algorithms, and optimization of initial concentrations and emissions for air quality model in the field of air pollution data assimilation. Challenges and development trends in the study of atmospheric pollution data assimilation are also highlighted.
Key words: Data assimilation      Air pollution      Model uncertainty      Concentration field assimilation      Emission inversion
1 引言

2 大气污染预报不确定性

（1）数值模式不可避免的误差

（2）初始条件和边界条件的误差

（3）气象场输入误差

（4）排放源的误差

（5）化学转化过程的误差

（6）干沉降过程的误差

3 资料同化的作用和主要算法 3.1 定义和作用

（1）状态变量估计

（2）参数估计

（3）自适应观测或目标观测

3.2 主要算法介绍

 ${x_{\rm{a}}}(j) = {x_{\rm{b}}}(j) + \frac{{\sum\nolimits_{i = 1}^n {w(i, j)} [y(i) - {x_b}(i)]}}{{\sum\nolimits_{i = 1}^n {w(i, j)} }}$ (1)
 $w(i, j) = \max (0, f(R, {d_{i, j}}))$ (2)

（2）牛顿松弛逼近法（Kistler，1974Hoke and Anthes, 1976

 $\frac{{\partial x}}{{\partial t}} = M(x, t) + \frac{{y - \mathit{\boldsymbol{H}}x}}{\tau },$ (3)

（3）最优插值（Gandin，1963

 ${\mathit{\boldsymbol{x}}_a} = {\mathit{\boldsymbol{x}}_b} + \mathit{\boldsymbol{K}}(\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{H}}{\mathit{\boldsymbol{x}}_b})$ (4)
 $\mathit{\boldsymbol{K}} = \mathit{\boldsymbol{B}}{\mathit{\boldsymbol{H}}^{\rm{T}}}{{\rm{(}}\mathit{\boldsymbol{HB}}{\mathit{\boldsymbol{H}}^{\rm{T}}} + \mathit{\boldsymbol{R}}{\rm{)}}^{-1}}$ (5)

（4）变分方法（Sasaki，1970Parrish and Derber, 1992

 $J(\mathit{\boldsymbol{x}}) = {(\mathit{\boldsymbol{x}} - {\mathit{\boldsymbol{x}}_b})^{\rm{T}}}{\mathit{\boldsymbol{B}}^ - }^1\mathit{\boldsymbol{x}} - {\mathit{\boldsymbol{x}}_b} + \mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Hx}}{^{\rm{T}}}{\mathit{\boldsymbol{R}}^ - }^1(\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Hx}}).$ (6)

 $\begin{array}{l} J(\mathit{\boldsymbol{x}}) = {(\mathit{\boldsymbol{x}} - {\mathit{\boldsymbol{x}}_b})^{\rm{T}}}{\mathit{\boldsymbol{B}}^{ - 1}}\mathit{\boldsymbol{x}} - {\mathit{\boldsymbol{x}}_b} + \\ \sum\limits_{i = 1}^N {{\mathit{\boldsymbol{y}}_i} - \mathit{\boldsymbol{H}}{\mathit{\boldsymbol{x}}_i}{^{\rm{T}}}{\mathit{\boldsymbol{R}}^{ - 1}}{\mathit{\boldsymbol{y}}_i} - \mathit{\boldsymbol{H}}{\mathit{\boldsymbol{x}}_i}} {\rm{ }}, \end{array}$ (7)

（5）卡尔曼滤波（Kalman，1960

 ${\mathit{\boldsymbol{x}}_a} = {\mathit{\boldsymbol{x}}_b} + \mathit{\boldsymbol{K}}(\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{H}}{\mathit{\boldsymbol{x}}_b}),$ (8)

 $\mathit{\boldsymbol{K}} = \mathit{\boldsymbol{B}}{\mathit{\boldsymbol{H}}^{\rm{T}}}{(\mathit{\boldsymbol{HB}}{\mathit{\boldsymbol{H}}^{\rm{T}}} + \mathit{\boldsymbol{R}})^{ - 1}}.$ (9)

4 大气污染资料同化的发展 4.1 浓度场同化的研究进展

4.2 源清单反演的研究进展

Chang et al.（1996）对比了南加州地区空气质量观测数据和模拟数据，发现光化学传输模型低估了环境异戊二烯的浓度水平，推断是由于排放清单低估了异戊二烯的排放强度导致。然后，依据在多个站点观测到的异戊二烯浓度，利用卡尔曼滤波法对异戊二烯排放清单进行校正。Elbern et al.（2000）利用四维变分方法开展理想条件下臭氧前体物排放反演试验，发现四维变分能有效订正一氧化氮的排放误差，但不能有效订正挥发性有机物（VOCs）的排放误差。Fu et al.（2007）利用GOME卫星反演的甲醛柱浓度作为约束条件来校正甲醛前体物VOCs的排放数据。将GEO-CHEM模型模拟的甲醛柱浓度与卫星观测到的甲醛柱浓度进行比较，发现冬季卫星观测值要显著高于模拟值，推断是甲醛的一次来源或者甲醛前体物的排放强度在清单中被低估造成的。Martin et al.（2003）Wang et al.（2007）Boersma et al.（2008）分别同化卫星观测的月均二氧化氮数据对氮氧化物排放源进行了反演订正。Stavrakou et al.（2009）通过分析SCIAMACHY卫星的乙二醛和甲醛柱浓度数据，发现已有模型研究大大低估了大气环境中乙二醛的柱浓度，考虑陆地上可能还存在额外的来自生物排放的乙二醛源。因此，选取甲醛柱浓度作为约束条件，利用IMAGESv2全球化学传输模型的伴随模块，分别反演估算了直接排放和前体物二次生成两种情形下的乙二醛排放源的量，结果表明直接排放估算的乙二醛排放源的量较先验排放源的量高约38 Tg a−1（T为单位词头，表示1012），而由前体物二次生成估算的乙二醛排放源的量约为先验排放源量的2倍。Barbu et al.（2009）反演硫化物排放时发现，二氧化硫氧化速率模拟对反演影响很大，反演时不考虑其不确定性会导致源排放的错误订正。Cheng et al.（2010）采用变分订正方法建立卫星遥感产品源同化模型，采用卫星观测NO2柱浓度观测数据对源清单进行了订正。Manning et al.（2011）通过同化反演得到了英国1990~2007年间甲烷和氮氧化物排放的演变趋势。Yang et al.（2011）通过卫星资料同化反演评估了华北地区氮氧化物在2008年北京奥运期间的减排幅度及其对臭氧的影响。Corazza et al.（2011）使用变分方法，结合地面观测反演欧洲的N2O排放。大部分污染源反演研究基本都假定模式是完美的，即假定观测和模拟差异全部来自排放源和观测误差，对模式误差（排放源和观测误差以外的误差）关注较少。Jiang et al.（2011）发现CO源反演中忽略模式误差引入的反演偏差超过20%，并导致排放源负值的出现。Mijling and Van Der A（2012）通过大气化学传输模式的模拟建立短寿命物种的排放与浓度关系，再通过后向轨迹找出敏感区域，从而用观测模拟的浓度差异调整排放源。Koohkan et al.（2013）基于西欧地区11个站点VOCs观测数据，利用经过验证的快速伴随化学传输模型，反演估算了包括5种芳香烃、6种烷烃、2种烯烃、1种炔烃和1种生物二烯烃共15种VOCs的排放量，反演估算结果表明初始清单中丙烷、乙烷、乙烯和乙炔低估将近一半。此外，研究也指出使用相对稀疏的站点观测数据来估算异戊二烯是不恰当的，因为异戊二烯在大气中的生命周期很短，站点数据的空间代表性十分有限。Tang et al.（2013）基于集合卡尔曼滤波建立了城市尺度的大气污染源清单反演系统，通过随机参数化在反演中对模式误差进行了估计，解决了污染源反演过程中模式误差不恰当估计导致的反演偏差，并且量化了反演清单不确定性。Wang et al.（2014）等利用北京市27个站点2009年6月至2012年1月的VOC观测数据，选取CO作为参比化合物和基于甲苯和二甲苯观测数据的光化学龄法，结合反演校正后的CO清单，估算了北京市VOCs排放量，结果显示现有清单可能低估了含氧挥发性有机物（OVOC）和C2-C4的链式烷烃的排放量，而苯乙烯和1, 3-丁二烯的排放量可能被高估。Wang et al.（2016）利用集合最优插值算法对地面黑炭观测数据进行同化，反演订正了中国地区黑炭排放源清单。Zhang et al.（2016）通过地面PM2.5和SO2观测数据反演估计了2015年APEC（Asia–Pacific Economic Cooperation）阅兵期间京津冀气溶胶排放，指出反演结果对无机气溶胶、氨和氮氧化物不确定性非常敏感。

5 面临的挑战

（1）大气污染监测数据从以往少量稀缺开始向区域性全覆盖海量多源转变，地面、卫星、雷达等使得大气污染监测在空间上向立体多维发展，而以往资料同化方法研发主要针对某一类观测或污染物种，海量多源数据使同化变量维度大幅增加，也使观测误差协方差估计变得困难。国家环境空气质量监测网包含上千个地面观测站点，站点空间分布很不规则，受局地源排放和气象场等因素影响，不同站点监测数据的空间代表性差异很大。同化这些数据进模式系统时，需合理评估其代表性误差。目前估计大气污染地面观测代表性误差主要采用Elbern et al.（2007）提出的方法，观测站点的代表性范围根据站点分类（城区、郊区和农村）分别设为2、4、10 km。由于我国排放水平、气象条件与欧美地区存在显著差异，将其直接应用于我国存在很大不确定性。考虑我国地面观测的自身特点，客观合理评估观测的空间代表性误差非常必要。因此，如何结合我国自身观测特点，构建具备海量多源数据同化能力的三维立体资料同化方法是一个关键挑战。

（2）与数值天气预报的资料同化相比，大气污染资料同化最大的不同与挑战主要有两点。第一，数值天气预报主要是初值问题，因此气象资料同化重点在减少初值的不确定性。而大气污染预报不仅是污染物浓度的初值问题，还涉及污染源清单、天气预报场和模式参数的不确定性等。因此大气污染资料同化不但要减少污染物初始浓度场的不确定性，还要尽可能减少污染源清单的误差，并且这些工作也需要同时考虑气象预报场的不确定性，否则就会把帐都算到污染物初值、源清单上，导致“过分调整”问题。第二，大气复合污染资料同化需要处理强非线性的化学反应。Tang et al.（2016）研究表明，采用目前大气资料同化上最为先进的算法之一集合卡尔曼滤波算法，其在处理臭氧资料同化的强化学非线性问题时，也会出现同化负效应。因此，如何处理强化学非线性同化问题是大气污染资料同化面临的关键难题。同时，大气复合污染数值模式中PM2.5的成分多达几十乃至上百个，其平衡关系复杂，远比气象资料同化的“热成风”关系复杂。

（3）大气污染资料同化的一个重要目标是减小源清单不确定性，然而目前仍侧重于弱化学活性物质（CH4、CO等）以及少数强化学活性物质（如NOx）的排放源反演，对臭氧和细颗粒物预报至关重要的强活性前体物排放源（NH3和VOCs等）反演工作有限，原因在于这些污染物观测数据稀缺，且对强活性物质化学反应过程认识不足。例如，Barbu et al.（2009）对硫化物反演时发现不考虑二氧化硫氧化速率存在的较大不确定性会导致对源的错误订正。

（4）PM2.5数据同化与CO、O3等污染物数据同化最显著差别在于，PM2.5在模式中是基于硫酸盐、硝酸盐等气溶胶组分诊断出来的间接变量，实际观测变量主要是PM2.5总质量浓度，而气溶胶组分观测非常稀少，难以满足大范围数据同化对气溶胶组分观测数据的需求。常用做法是同化PM2.5观测数据，得到对PM2.5模拟浓度的订正量，然后将该订正量按模拟的气溶胶组分比例线性分摊到气溶胶组分（Pagowski et al., 2014）。其主要局限在于：难以考虑不同气溶胶组分模拟不确定性的动态变化，当模拟的气溶胶组分比例与实际大气差别较大时，这种订正方式会给气溶胶组分估计引入新的不确定性。背景场误差协方差矩阵决定了同化时观测信息对模式变量的订正范围和程度，其估计问题是资料同化的核心。PM2.5模拟误差受气象场、排放源、模式参数等众多复杂因子影响，时空变化非常复杂，并且缺乏足够观测信息对其进行完整评估。扰动模式参量来构建集合预报是解决这一问题的可行途径，但扰动单因子可能导致背景场误差协方差的严重低估（Pagowski and Grell, 2012），扰动过多参量会引入大量随机噪声，产生的虚假相关性会导致虚假同化订正。因此，如何克服上述问题，动态合理估计PM2.5背景场误差协方差，如何合理考虑不同气溶胶组分模拟不确定性的差别，实现PM2.5观测数据的多变量协同同化是目前面临的一大关键挑战。