大气科学  2018, Vol. 42 Issue (6): 1273-1285   PDF    
改进的超级集成预报方法在长江三角洲地区O3预报中的应用
姚雪峰1,2, 葛宝珠1, 王自发1,3,4, 范凡1,5, 汤莉莉6, 郝建奇1,4, 张祥志6, 晏平仲1, 张稳定1, 吴剑斌7     
1 中国科学院大气物理研究所大气边界层物理与大气化学国家重点试验室, 北京 100029
2 解放军 96631 部队, 北京 102208
3 中国科学院城市环境研究所城市环境科学卓越中心, 厦门 361021
4 中国科学院大学, 北京 100049
5 南京信息工程大学, 南京 210044
6 江苏省环境监测中心, 南京 210036
7 上海市气象局, 上海 200030
摘要: 针对当前单模式系统臭氧(O3)预报的不确定性问题,提出了一种基于活动区间的多模式超级集成的、高效的预报方法。本研究基于长江三角洲(长三角)地区多模式空气质量预报系统,将改进后的超级集成预报方法(AR-SUP)运用到2015年长三角地区的O3预报中,并与滑动训练期的超级集成预报(R-SUP)、多模式集成平均预报(EMN)、消除偏差的集成平均预报(BREM)对比,结果表明AR-SUP对预报效果的改善最明显,其在暖季和冷季的均方根误差(RMSE)较最优单模式平均下降了20%和23%。将AR-SUP运用到48 h和72 h预报中发现,当预报时效增加时该方法依旧保持较高的预报技巧。多项统计数据均证明AR-SUP在研究时段内所有站点均能显著减小O3预报误差、提高整体相关性和一致性,有效提高当前短期(三天)预报准确率。
关键词: 臭氧    多模式系统    超级集成预报    活动区间    
Application of Improved Super Ensemble Forecast Method for O3 and Its Performance Evaluation over the Yangtze River Delta Region
YAO Xuefeng1,2, GE Baozhu1, WANG Zifa1,3,4, FAN Fan1,5, TANG Lili6, HAO Jianqi1,4, ZHANG Xiangzhi6, YAN Pingzhong1, ZHANG Wending1, WU Jianbin7     
1 State Key Laboratory of Atmospheric Boundary Layer Physics and Atmospheric Chemistry, Institute of Atmospheric Physics, Chinese Academy of Sciences, Beijing 100029
2 96631 Army, People's Liberation Army of China, Beijing 102208
3 Center for Excellence in Urban Atomsprheric Environment, Institute of Urban Environment, Chinese Academy of Sciences, Xiamen 361021
4 University of Chinese Academy of Sciences, Beijing 100049
5 Nanjing University of Information Science and Technology, Nanjing 210044
6 Jiangsu Environmental Monitoring Center, Nanjing 210036
7 Shanghai Meteorological Service, Shanghai 200030
Abstract: Aiming at existing problems in current O3 single model forecast, an efficient superensemble forecast based on running active range (AR-SUP) is proposed and applied to the EMS-YRD (multi-model ensemble air quality forecast system for the Yangtze River Delta) O3 forecast during the study period in 2015. The performance of the newly proposed method is compared with those of R-SUP (Running Training Period Superensemble), EMN (Ensemble Mean), and BREM (Bias-Removed Ensemble Mean). The results show that compared with the other three ensemble methods, the AR-SUP exhibits significant improvement in daily O3 forecast with the RMSE reduced by 20% and 23% from that of the best single model in cool and warm seasons respectively. Further application of the AR-SUP in O3 ensemble forecast also shows high forecasting skills when the predicting time is extended to 48 h and 72 h. A number of statistical measures (i.e., reduced errors, increased correlation coefficients, and index of agreement) show that the forecasting skill has been improved at all the locations within the study region during all seasons, which indicates this method can be used to help improve the accuracy and reliability of short-term forecasts.
Keywords: O3    Ensemble air quality multi-model forecast system    Superensemble forecast    Running active range    
1 引言

随着快速的能源消耗、城市群发展和人口增长,近年来以高浓度臭氧为典型特征的光化学污染在长江三角洲(长三角)地区日益严重(Gao et al., 2011)。研究表明,高浓度臭氧严重影响人体健康、危害生态环境(Zhang et al., 2006)。向公众特别是敏感人群提供准确的臭氧污染的预报和预警服务很有必要(唐晓等,2013)。中国科学院大气物理研究所以其自主研发的嵌套网格空气质量预报系统(NAQPMS)模式为核心、综合集成国际上先进的CAMx、CMAQ和WRF-Chem等空气质量模式,建立了长三角地区区域空气质量多模式预报系统。该系统在江苏省环境监测中心已投入运行,能够提供长三角地区五天以内的逐小时精细化臭氧预报。

由于数值解法、排放清单、边界条件以及对大气中的物理化学过程的有限认知,臭氧的数值预报不可避免的存在误差和不确定性(Kang et al., 2010, 唐晓等,2013)。而对多模式系统而言,如何将多个数值模式结果综合集成一个准确、可靠、直观的预报结果是目前面临的重要问题。多模式集成方法是一种提高模式准确率的非常有效的后处理方法(杨学胜,2001)。Danard et al.(1968)Thompson(1977)发现,通过将两个相互独立的预测结果进行特定的线性组合,其预测均方根误差可以小于单个预测的均方根误差。基于此,多模式集成平均(Ensemble Mean, EMN)、消除偏差的集成平均(Bias-removed Ensemble Mean, BREM)、回归改进集成平均(Regression-improved Ensemble Mean)、超级集成法(Superensemble Prediction, SUP)(Krishnamurti et al., 1999, 2000)等集成方法被相继提出,且广泛运用到气象上的中短期预报、延伸期预报及气候预测中(智协飞等, 2009, 2014, 2015, 2016崔慧慧和智协飞,2013; 张涵斌等,2015)。以上研究皆认为,在众多集成方法中,超级集成法可以更有效的减小均方根误差,提高预报技巧。其思想是将时间序列分为训练期和预报期两段,通过在训练期建立模式距平与实况距平的回归方程来确定各个模式权重信息,并将这些权重信息运用于预报期内多模式集成预报。

近年来,多模式集成平均、回归改进集成平均等具有代表性的集成方法也被拓展运用到空气质量预报领域(王自发等,2009黄思等,2015),但将超级集成法应用到环境空气质量要素的研究却鲜有案例;另外,以往超级集成法的研究多为针对某特定时间序列展开的预报试验(智协飞等,2009刘建国等,2013),最佳训练期长度也多通过固定的培训期数据来确定,并未随时间变化;且未提出一套适用于业务预报的集成方法(崔慧慧和智协飞,2013黄思等,2015; 智协飞等,2016)。

针对上述问题,本文尝试将多模式超级集成的方法进行改进,使其适用于实时业务化预报。基于长三角地区区域空气质量多模式预报系统2015年的预报结果,将改进后的超级集成法、超级集成法、多模式集成平均和消除偏差的集成平均等多模式集成方法运用到长三角地区O3的24 h预报中,比较四种多模式集成方案的预报效果;然后将最优的集成方案运用到48 h和72 h预报中,考察其短期(三天)预报水平。

2 资料和方法 2.1 长三角地区多模式空气质量预报系统

长三角地区多模式空气质量预报系统中,区域空气质量模式包括中国科学院大气物理研究所自主开发的嵌套网格空气质量预报模式NAQPMS(王自发等,2006)、美国环保署(EPA)的CMAQ模式(Dennis et al., 1996)、美国Environ公司的空气质量综合模拟系统CAMx模式(ENVIRON International Corporation, 2002)及由美国NOAA预报系统实验室(FSL)开发的气象模式(WRF)和化学模式(CHEM)在线耦合的WRF-CHEM模式(Grell et al., 2005)。所有化学传输模式均采用三层嵌套,区域设置如图 1a所示:第一层(D1)为东亚地区(170×160格点),第二层(D2)覆盖中国东部地区(160×154格点),第三层(D3)涵盖江苏省全部、山东南部、安徽大部及浙江北部(199×181格点)。三层嵌套区域的水平空间分辨分别为27、9、3 km。各个模式垂直方向上从地面到20 km分为20层。系统所用气象模式为WRF模式(3.5.1版本)。WRF模式水平网格设置与化学传输模式一致,采用地形追随坐标,垂直方向分为30层,模式层顶为50 hPa。外层选择较大的区域可以保证长期模拟过程中内层区域具有较为合理的侧边界条件,并可以充分考虑大尺度天气系统对长三角地区的影响。

图 1 长三角地区(a)多模式系统区域设置,(b)代表空气质量监测站的分布 Figure 1 (a) Domain setting of the multi-model ensemble air quality forecast system, (b) representative air quality monitoring stations for the Yangtze River Delta

系统排放源输入是由清华大学基于中国多尺度排放清单模型MEIC(Multi-resolution Emission Inventory for China,http://meicmodel.org/ [2017-04-20])制作的实时更新的排放源清单。大气污染物排放源分类是在参考《区域高分辨率大气排放源清单建立的技术方法与应用》及国内已有较为成熟的排放源分类体系的基础上,结合目前我国统计年鉴活动数据分类特征、国民经济行业分类情况以及江苏省的实际情况,针对SO2、NOx、CO、PM10、PM2.5和NH3等九种污染物,将排放源主要分为农业源、生物源、工业源、电厂源、居民源、交通源及其他源共七类。排放源的空间分辨率和化学传输模式及气象模式匹配,时间分辨率为1小时。

2.2 站点选取及观测资料
$ {{S}_\text{picked}}=\text{max}(D({{S}_\text{refer}}, {{S}_\text{candidate}})), $ (1)

长三角地区大部分空气质量监测站点的空间位置存在向城市集中叠加的现象,故按照测站之间的距离远近,挑选了有代表性的26个站点(图 1b)。具体算法是:任选一个站点作为基准站Srefer,然后按(1)式从余下站点中选取代表站点。从备选站点Scandidate中找出距离基准站Srefer最远的站点作为已选站点Spicked,然后将已选站点从备选站点中剔除,重复(1)式表述的挑选过程,直到已选站点个数满足研究需求。

选取的空气质量数据来自中国环境监测总站,包括臭氧(O3)和二氧化氮(NO2)。研究时段为2015年1~12月,其中,1月1日至3月5日为准备期,评估时段为3月6日至12月31日,按月分为冷暖两季,冷季为3~4月和10~12月,暖季为5~9月。模式数据为相应时段系统包含的NAQPMS、CMAQ、CAMx及WRFCHEM模式的24、48及72 h预报产品。观测及模式数据分辨率均为1 h。

O3因极易受气象及城市排放条件影响,短时及日变化显著(殷永泉等,2004);同时由于O3关注短期急性健康效应,我国于2012年将日最大8 h浓度作为O3日评估标准纳入到新的《环境空气质量标准》中(中华人民共和国环境保护部,2016)。故文中O3的评估考察日最大8 h浓度,具体算法参考了美国环保署公布的8 h O3数据处理指南,即先对小时分辨率资料进行8 h滑动平均,然后逐日对滑动平均结果求最大值得到(Park, 1998)。

2.3 集成方法

(1)多模式集成平均(EMN)

将多个模式的结果通过求平均转化为一个预报结果,即多模式集成平均:

$ {{V}_\text{EMN}}(j, \text{ }t)=\frac{1}{N}\sum\nolimits_{i=1}^{N}{{{F}_{i}}(j, \text{ }t)}, $ (2)

其中,VEMN (j, t)为第j个测站t时刻的多模式集成平均的预报值,N为参加集成的模式总数,Fi (j, t)为第i个模式在第j个测站t时刻的预报值。

(2)消除偏差的集成平均(BREM)

模式通常存在系统偏差,通过引入观测平均态,并在其基础上叠加模式预报距平,可得到无偏的集成平均:

$ {{V}_\text{BREM}}\left(j, \text{ }t \right)=\overline{O}\left(j, \text{ }t-1 \right)+\frac{1}{N}\sum\nolimits_{i=1}^{N}{\left[ {{F}_{i}}\left(j, \text{ }t \right)-\overline{{{F}_{i}}}\left(j, \text{ }t \right) \right]}, $ (3)

其中,VBREM (j, t)为第j个测站t时刻的消除偏差的集成预报值,$\overline{O}\left(j, \text{ }t-1 \right)$为从初始时刻到t-1时刻所有观测值的平均,$\overline{{{F}_{i}}}\left(j, \text{ }t \right)$为第i个模式在第j个测站从初始时刻到t时刻预报值的平均。该方法与多模式集成平均的差异在于参与集成模式结果是无偏的,但此刻的集成仍是等权相加。

(3)超级集成法(SUP)及滑动训练期的超级集成(R-SUP)

Krishnamurti et al.(1999)指出,系统偏差信息还可通过模式在训练期的表现提取得到,并在预报期予以消除。通过选定一段训练期,在训练期获取各个模式的权重系数,并在训练期内得到观测平均态和模式距平,综合考虑模式的不等权重和消除偏差即得到超级集成预报(SUP):

$ \begin{align} &{{V}_\text{SUP}}\left(j, \text{ }t \right)=\overline{O}\left(j, \text{ }t-1 \right)+ \\ &\sum\nolimits_{i=1}^{N}{{{a}_{i}}\left(j, \text{ }t \right)\left[ {{F}_{i}}\left(j, \text{ }t \right)-\overline{{{F}_{i}}}\left(j, \text{ }t \right) \right]}, \\ \end{align} $ (4)

其中,${{V}_\text{SUP}}(j, \text{ }t)$为超级集成预报值,${{a}_{i}}(j, \text{ }t)$为权重系数。

$ G\text{=}{{\sum\nolimits_{t=1}^{{{N}_\text{tr}}}{({{{{V}'}}_{\text{SU}{{\text{P}}_{\text{t}}}}}-{{{{O}'}}_\text{t}})}}^{2}}, $ (5)

根据最小二乘法原理建立训练期回归方程使得训练期中误差G最小,以此确定最佳的训练期长度及参与超级集合的各模式权重系数${{a}_{i}}(j, \text{ }t)$,如(5)式所示。其中,${{{V}'}_\text{SUPt}}$为训练期超级集合预报值,${{{O}'}_{t}}$为实测值,${{N}_\text{tr}}$为训练期长度。${{a}_{i}}(j, \text{ }t)$的获取既可以采用线性回归,也可采用非线性神经网络技术(智协飞等, 2009, 2013)。将${{a}_{i}}(j, \text{ }t)$代入公式(4),即可获得预报期的超级集成预报值。由于训练期的选取对集成预报结果有重要影响,一般需要通过试验来确定。以上的超级集成预报模型中,权重${{a}_{i}}(j, \text{ }t)$不随时间变化,并将运用于整个训练期的预报。智协飞等(2009)指出,随着预报期的增长固定的权重系数会逐渐失效,并提出了滑动训练期的超级集成预报(R-SUP)方案,即最佳训练长度Nbest