气候与环境研究  2019, Vol. 24 Issue (1): 116-124   PDF    
基于机器学习的华北气温多模式集合预报的订正方法
门晓磊1 , 焦瑞莉1 , 王鼎2 , 赵晨光2 , 刘亚昆2 , 夏江江3 , 李昊辰4 , 严中伟3,5 , 孙建华3 , 王立志3     
1 北京信息科技大学信息与通信工程学院, 北京 100101;
2 北京信息科技大学信息管理学院, 北京 100192;
3 中国科学院大气物理研究所东亚区域气候-环境重点实验室, 北京 100029;
4 北京大学数学科学学院, 北京 100871;
5 中国科学院大学, 北京 100049
摘要: 模式预报的订正是决定局地天气预报结果的一个重要步骤,基于机器学习的后处理模型近年来开始崭露头角。本文发展了基于岭回归(Ridge)、随机森林(Random Forest,RF)和深度学习(Deep Learning,DL)的3种后处理模型,基于中国气象局(CMA)的BABJ模式、欧洲中期天气预报中心(ECMWF)的ECMF模式、日本气象厅(JMA)的RJTD模式和NCEP的KWBC模式这4个数值天气预报模式2014年2月至2016年9月(训练期)近地面2 m气温预报和实况资料确定各模型参数,进而对2016年10月至2017年9月(预报期)华北地区(38°N~43°N,113°E~119°E)的逐日地面2 m气温预报进行了多模式集合预报分析。采用均方根误差对预报效果进行评估,这3种后处理模型的预报效果和4个数值天气预报模式以及通常的多模式集合平均(Ensemble Mean,EMN)的预报效果的对比表明:1)随着预报时长增加,4个数值预报模式及各种后处理模型的均方根误差均呈上升趋势;但区域平均而言,Ridge、RF和DL的预报效果在任何预报时长上都明显优于EMN和单个天气预报模式;特别是前几天的短期预报DL的预报效果更好,中后期预报Ridge的预报效果略好。2)华北地区的东南部均方根误差较小,其余格点上均方根误差较高,从空间分布而言,DL的订正预报效果最好,3种机器学习模型的误差在1.24~1.26℃之间,而EMN的误差达1.69℃。3)夏季各种方法的预报效果都较好,冬季预报效果都较差;但是Ridge、RF和DL的预报效果明显优于EMN,这3种模型预报的平均均方根误差在2.15~2.18℃之间,而EMN的平均均方根误差达2.45℃。
关键词: 地面2 m气温      多模式集合平均      岭回归      随机森林      深度学习     
A Temperature Correction Method for Multi-model Ensemble Forecast in North China Based on Machine Learning
MEN Xiaolei1, JIAO Ruili1, WANG Ding2, ZHAO Chenguang2, LIU Yakun2, XIA Jiangjiang3, LI Haochen4, YAN Zhongwei3,5, SUN Jianhua3, WANG Lizhi3     
1 School of Information and Communication Engineering, Beijing Information Science and Technology University, Beijing 100101;
2 School of Information Management, Beijing Information Science and Technology University, Beijing 100192;
3 Key Laboratory of Regional Climate-Environment for Temperate East Asia, Institute of Atmospheric Physics, Chinese Academy of Sciences, Beijing 100029;
4 School of Mathematical Sciences, Peking University, Beijing 100871;
5 University of Chinese Academy of Sciences, Beijing 100049
Abstract: Post-forecast data processing is critical for obtaining reliable local weather forecast. In this study, the authors developed three post-processing models based on ridge regression (Ridge), random forest (RF), and deep learning (DL) methods. The post-processing models were trained by observational and forecast data of daily 2-m above surface air temperature in North China (38°N-43°N, 113°E-119°E) from four numerical weather forecast (NWF) models (BABJ model from China Meteorological Administration, ECMF model from ECMWF, RJTD model from Japan Meteorological Agency, and KWBC model from NCEP, respectively), for the training period from February 2014 to September 2016, and then applied to the forecast period from October 2016 to September 2017. The forecast results of the post-processing models together with those of commonly-used multi-model ensemble mean (EMN) and individual NWF models were evaluated according to the root-mean-square error (RMSE). The main results are as follows:1) For the region as a whole, with the increase in the forecast lead time, all the NWF models, EMN and the post-processing models exhibit increasing RMSEs, but the RMSEs of the three post-processing models are all significantly smaller than those of EMN and individual NWF models; especially, DL is slightly better for the short-term (the first few days) forecast and RF is slightly better for the longer-term prediction. 2) The RMSEs are relatively smaller in the southeastern part of North China, approximately in the range of (38°N-41°N, 115.5°E-119°E) than else where; on average, DL is slightly better, and the RMSEs of the three machine learning models are between 1.24℃ and 1.26℃, while the EMN error is 1.69℃. 3) There are seasonal differences:The results of all the models are relatively good for the summer, but poor in general for the winter. All the three post-processing models perform better than EMN and individual NWF models, with a smallest average RMSE of 2.15℃ for Ridge compared with 2.45℃ for EMN.
Keywords: 2-m above surface air temperature     Multi-model ensemble mean forecast     Ridge regression     Random forest     Deep learning    

1 引言

随着数值天气预报的发展,人们逐渐发现,改进单一的数值天气预报模式很困难,尤其对于较长时效的天气预报结果不理想(马清,2008)。导致数值天气预报不确定性的因素主要有3个方面(叶笃正等,2006):一是大气系统的混沌行为,即使两个系统的初始场差别极小,当积分一定时间以后,两个系统的状态会有很大不同;二是人们对天气气候系统的物理机制的认识还不够;三是人们对外强迫的不准确表述,比如人类活动会影响到全球气候变化,但是如何定量地描写人类活动这一“外强迫”,并无妥善的办法。因而,天气气候预报总是存在不确定性的。

为了减小数值预报的不确定性,Krishnamurti et al. (1999)最早提出了多模式集合预报思想,它是将多个不同的数值模式预报按照一定的统计方法获得最佳组合后进行集合预报;冯慧敏等(2016)使用欧洲中期天气预报中心(ECMWF)、日本气象厅(JMA)、中国气象局(CMA)、NCEP的4个数值模式,利用多模式集合平均、消除偏差集合平均、加权消除偏差集合以及多模式超级集合这4种方法,对郑州城区11个站点逐3 h气温进行多模式集成预报试验;李刚等(2016)使用日常预报业务应用的ECMWF、JMA和CMA所提供的地面最低气温预报资料,在贵州境内展开多模式集合预报研究,为使预报效果更优化,进一步将滑动系数应用于预报模型中,并将其结果与简单的多模式集合平均和各业务中心预报进行比较。

近年来有研究者使用机器学习方法来提高天气预报的准确性:利用单个数值预报模式的多个气象要素来构建天气预报模型(Hernández et al., 2016邢彩盈等,2016张禄和杨志军,2016Wang et al., 2017);还有采用基于机器学习的多模式集合预报方法比如多元回归方法和BP神经网络(马清, 2008),利用CMA、JMA、NCEP、加拿大气象局(MSC)和法国气象局—奥地利国家气象局(Meteo- Fr. & ZAMG)5个数值预报中心的中尺度集合预报结果,建立了多模式集合预报模型,并与EMN进行对比。牛金龙等(2016)采用平均差值和多元线性回归方法,利用3个高分辨率模式资料建立了成都市多模式资料应用平台。黄威和牛若芸(2017)采用支持向量机回归方法,利用ECMWF和NCEP这两家模式资料,建立了多模式集成的强降水预报模型。张恒德等(2018)采用BP神经网络方法,利用中国气象局雾—霾数值预报系统、北京区域环境气象数值预报系统和华东区域大气环境数值预报系统3个环境气象模式预报产品建立了污染物浓度多模式集成预报模型。

由于第24届冬季奥林匹克运动会(冬奥会)将于2022年在北京延庆和河北张家口举办,亟需一套专用的局部复杂地形条件下气象预报体系。本研究可为冬奥会赛事气象风险评估及风险预警技术提供基础,以期将考虑物理机制的数值模拟与基于数据驱动的机器学习(尤其是深度学习)二者进行融合应用,满足气象专业用户(冬奥组委会)的需求,具有重要的研究意义。同时为响应国家“一带一路倡议”,针对“一带一路”沿线国家的不同下垫面特征和环流特征,对数值预报结果进行针对性的订正也显得尤为重要。为提高局部气象要素预报体系探路本文运用华北地区近地面2 m气温数据,构建多模式集合温度预报模型。由于Ridge和RF可以有效地提高学习系统的泛化能力(熊国经等,2017王奕森和夏树涛,2018),深度学习可以使机器能够获得“抽象概念”能力(焦李成等,2016),而且在使用大数据集时效果极好,本文采用这3种机器学习方法,对数值预报模式的温度结果进行订正,并与EMN的效果做对比,结果有助于理解和探索多模式集合预报的新途径。

2 资料与方法 2.1 模式资料

模式资料来源于欧洲中期天气预报中心网站公开的数据,包含BABJ、ECMF、RJTD、KWBC这4个数值天气预报模式的近地面2 m气温历史预报资料,资料时期为2014年2月至2017年9月。4个模式起报时间均为00:00(协调世界时,下同),分辨率均为0.5°(纬度)×0.5°(经度)。本文研究取华北地区(38 °N~43°N,113°E~119°E)。选取各模式预报时效为24~264 h,时间间隔为24 h(模式数据来源详见http://apps.ecmwf.int/datasets/data/tigge/levtype=sfc/type=cf/[2017-12-20])。

2.2 标记资料

标记资料来源于欧洲中期天气预报中心网站,将ECMF模式的0场(分析场)的近地面2 m气温历史资料作为标记资料,资料长度为2014年2月至2017年9月,范围为(38°N~43°N,113°E~119°E),时间间隔为24 h。ECMF模式的分析场是由观测的气象资料通过资料同化得到的,有较强的参考价值,可以用来作为机器学习研究工作的标记资料(潘留杰等,2013陈博宇等,2015)。

2.3 资料处理

从原始数据中提取出所有格点的模式温度预报数据以及与模式温度对应的标记,将模式温度、模式集合平均温度以及标记数据整合为数据集,即数据集包含5个特征(BABJ、ECMF、RJTD、KWBC和模式集合平均温度EMN)和1个标记(与模式温度数据起报时间相对应的标记数据),再将资料(整体数据集)按模式数据起报时间分为训练期资料(训练集)和预报期资料(测试集),训练期选取32个月(2014年2月至2016年9月),预报期选取12个月(2016年10月至2017年9月)。

2.4 4种预报订正处理方法 2.4.1 多模式集合平均(EMN)

多模式集合平均(EMN,记为EMN)就是对BABJ、ECMF、RJTD和KWBC这4个模式的输出等权重做算数平均。具体算法如下(范苏丹等,2015):

$ {E_{{\rm{MN}}}} = \frac{1}{N}\mathop \sum \limits_{i = 1}^N {F_i} $ (1)

其中,Fi代表模式预报温度,模式的数量N=4。

2.4.2 岭回归(Ridge)

Ridge是对传统多元线性回归的改良,是对不适定问题进行回归分析时最经常使用的一种正则化方法,适用于存在共线性问题的数据研究(熊国经等,2017)。针对本文所研究的多模式集合预报问题,给定有5个特征的特征向量$ \mathit{\boldsymbol{x}} = \left({{x_1}, {x_2}, {x_3}, {x_4}, {x_5}} \right) $,其中$ {x_1} - {x_4}$分别为BABJ、ECMF、RJTD和KWBC这4个模式的输出,$ {x_5} $为4个模式的输出的平均值(EMN)。岭回归模型就是一个通过特征的线性组合来进行预测的函数,即

$ \begin{array}{l} f({x_1}, {x_2}, {x_3}, {x_4}, {x_5}) = \\ {w_1}{x_1} + {w_2}{x_2} + {w_3}{x_3} + {w_4}{x_4} + {w_5}{x_5} + b, \end{array} $ (2)

向量形式为

$ f\left(\mathit{\boldsymbol{x}} \right) = {\mathit{\boldsymbol{w}}^{\rm{T}}}\mathit{\boldsymbol{x}} + b, $ (3)

损失函数定义为

$ {\rm{1oss}}\left(\mathit{\boldsymbol{w}} \right) = ||f\left(\mathit{\boldsymbol{x}} \right) - y|{|^2} + \alpha ||\mathit{\boldsymbol{w}}|{|^2}, $ (4)

公式(2)中,$ {w_i} $为模式输出$ {x_i} $的权重系数,$ b $为偏置;公式(3)和(4)中的xw分别代表模式输出、模式输出对应的权重系数;公式(4)中的y为真值。通过梯度下降法,对loss进行最小化求解,模型学习获得wb,从而Ridge模型得以确定。

2.4.3 随机森林

随机森林(Random Forest,RF)是采用随机的方式创建一个森林,森林中的每一棵数都是一棵小决策树。随机森林既可以做分类,又可以做回归。RF在创建每一棵决策树时,主要有以下两个步骤:1)有放回的随机抽取样本数据,形成新的样本集,新的样本集的大小和原始样本集的大小是一样的。假设输入样本数据有N个,那么采样的样本也为N个,也就是在得到的样本集合中,可能会有重复的样本;2)无放回的随机抽取特征。假如总共有m个特征,从这m个特征中随机抽取无重复的n个特征。正是因为随机森林遵循这两点,才使得随机森林在不剪枝的情况下不容易出现过拟合现象。

针对本文所研究的多模式集合预报问题,将BABJ、ECMF、RJTD、KWBC这4个数值预报模式的输出和4个模式的输出的平均值作为随机森林回归模型的输入特征,即输入特征为5个。RF的特征选择标准为基尼指数,经多次实验发现,将RF的参数设置为以下值时模型的效果最好:决策树个数为200,最大特征数为0.6,决策树最大深度为8,将5个输入特征输入到RF模型,产生200棵CART树(基于基尼指数选择最优特征的决策树),每棵决策树最多选择60%的特征并且最大深度为8,每棵决策树都产生相似的预测结果,RF模型的输出就是所有决策树结果的平均值(李丽辉等,2017)。

2.4.4 基于深度学习的多模式集合

基于深度学习(Deep Learning,DL)的概念源于人工神经网络的研究,由Hinton et al. (2006)提出,含有多个隐层的深层神经网络就是典型的深度学习结构。

本文采用深层神经网络构建多模式集合温度预报模型。模型结构为5层:第1层为输入层,输入层神经元数目为m=5,输入数据分别为BABJ、ECMF、RJTD、KWBC这4个模式预报温度数据以及EMN的数据;第2~4层为隐藏层,隐层数目为f=3,因为数据量不大,故将每个隐藏层的神经元数目在20~200之间取值,经过试验发现,将隐藏层各层的神经元数目分别设为f1=174、f2=67、f3=43效果最好,但在调参过程中发现,实际上,各层神经元的数量在20以上的各种组合得到的结果差别不大,即本研究中选取的各层神经元数目为相对最优组合;第5层为输出层,输出层的神经元数目为1,即DL模型的预测温度。层与层之间都是全连接。其网络结构(张伟等,2010)如图 1所示(其中隐藏层的激活函数采用ReLU函数)。

图 1 深层神经网络构建的多模式集合温度预报模型 Fig. 1 Multi-model ensemble temperature prediction model constructed by deep neural network

由于本文构建的是回归模型,故输出层不设激活函数,即将第3个隐藏层的输出数据加权平均后直接输出。输出层的神经元的输出信号为

$ {\mathit{\boldsymbol{y}}_1} = {\mathit{\boldsymbol{w}}^{[1]}}\mathit{\boldsymbol{x}} + {\mathit{\boldsymbol{b}}^{[1]}}, $ (5)
$ {\mathit{\boldsymbol{y}}_2} = {\mathit{\boldsymbol{w}}^{[2]}}{f_1}\left({{y_1}} \right) + {\mathit{\boldsymbol{b}}^{[2]}}, $ (6)
$ {\mathit{\boldsymbol{y}}_3} = {\mathit{\boldsymbol{w}}^{[3]}}{f_2}\left({{y_2}} \right) + {\mathit{\boldsymbol{b}}^{[3]}}, $ (7)
$ {\mathit{\boldsymbol{y}}_{{\rm{predict}}}} = {\mathit{\boldsymbol{w}}^{[4]}}{f_3}\left({{y_3}} \right) + {\mathit{\boldsymbol{b}}^{[4]}}, $ (8)

其中,x是输入层的输入信号,即BABJ、ECMF、RJTD、KWBC这4个模式预报温度数据以及EMN的数据,y1y2y3分别为第1、2、3个隐藏层的输入信号,$ {\mathit{\boldsymbol{y}}_{{\rm{predict}}}} $为输出层的输出信号(预测的温度),w[1]w[2]w[3]b[1]b[2]b[3]分别为到第1、2、3个隐藏层的连接权重和偏置值,f1f2f3为第1、2、3个隐藏层的激活函数。优化算法采用Adam算法,该算法是随机梯度下降算法的扩展式,是对Momentum算法和RMSProp算法的结合,它对超参数的选择相当鲁棒。Adam算法的学习率默认是0.001,在本文中将其学习率设置为0.0008。

2.5 训练模型

使用训练期(2014年2月至2016年9月)的数据,对Ridge、RF和DL的模型进行训练。其中Ridge迭代数据集1000次,RF迭数据集1次,而且它们都是批量训练,即一次性将全部数据放入模型进行训练,深度学习方法采用mini-batch的方式进行训练,在本文中,数据集迭代次数设置为20,即数据集迭代使用20次,batch_size设置为1000,即一次使用1000个样本进行训练。

3 结果与分析 3.1 2 m温度的区域平均的时间序列

为了分析机器学习订正随着预报时效增加的整体效果和整体变化趋势,使用预报期(2016年10月至2017年9月)的数据对4个数值预报模式、EMN、Ridge、RF以及DL的预报结果进行评估。从均方根误差的分布(图 2)可以看出:Ridge、RF和DL的均方根误差几乎一致,差别很小,且比单模式和集合平均都要好,ECMF和EMN次之,其余单模式的均方根误差都较大。3种订正方法的均方根误差比EMN提高0.5 ℃左右。随着预报时效的增加,各模式的均方根误差均呈增加趋势,但随着预报时效的增加,3种订正方法与EMN的差异在缩小。Ridge、RF和DL的订正效果不相上下,但是在预报前期(第1~3天)DL的预报效果略好,预报中后期(第4~11天)Ridge的预报效果略好。总体效果而言,Ridge的预报效果略好,其平均均方根误差为2.36 ℃,RF的预报效果略差,其平均均方根误差为2.39 ℃。另外,通过计算4个数值模式、EMN和3种订正方法的预报误差随着预报时效的线性趋势(如表 1)可知,ECMF和KWBC的误差随预报时效增加的速率最大,分别为0.29 ℃ d−1和0.27 ℃ d−1;其他模式或订正方法的误差随预报时效增加的趋势相差不大,在0.20~0.23 ℃ d−1之间。

图 2 4个模式以及4种后处理模型的均方根误差(RMSE)随预报时长的变化 Fig. 2 Root-mean-square errors (RMSEs) in four models and four post-processing models as a function of forecast lead time

表 1 4个模式以及4种后处理模型的均方根误差随预报时长的线性趋势 Table 1 Trends of RMSEs in four models and four postrocessing models with the forecast lead time
3.2 2 m温度的空间差异

使用预报期(2016年10月至2017年9月)的数据对EMN、Ridge、RF以及DL的预报结果在空间上的均方根误差分布进行评估(图 3)。这4种预报方法的均方根误差都随着预报时长的增加而增大。Ridge、RF和DL这3种方法的均方根误差都明显低于EMN,平均而言DL的均方根误差最低,如24 h订正结果,EMN的均方根误差为1.69 ℃,DL为1.24 ℃,Ridge和RF分别为1.26 ℃和1.25 ℃。72 h订正结果中,EMN的均方根误差为2.02 ℃,DL为1.60 ℃,Ridge和RF分别为1.62 ℃和1.64 ℃。264 h订正结果中,EMN的均方根误差为3.61 ℃,DL为3.43 ℃,Ridge和RF分别为3.44 ℃和3.48 ℃。这4种方法均方根误差在空间中呈现出相同的分布,即在华北地区的东南部[大约位于(38°N~41°N,115.5°E~119°E)],均方根误差都较低,在其余的格点上,均方根误差都偏高,而且预报的时长越大,这种分布规律越明显,即平原地区订正效果好,山区订正效果要差一些。

图 3 4种预报订正处理模型的均方根误差空间分布 Fig. 3 RMSEs spatial distributions in four post-predictive processing models
3.3 2 m温度的季节差异

进一步地,为了了解机器学习订正的温度预报在季节上是否存在显著差异,这里使用预报期(2016年10月至2017年9月)的数据对EMN、Ridge、RF以及DL的订正结果在温度的均方根误差分布进行评估(图 4)。Ridge、RF和DL的均方根误差明显小于EMN,尤其是12月、次年1月、2月、3月最明显,即在3种方法对温度预报的改善最大。在夏季(6~8月),3种方法和EMN的均方根误差都很小,说明夏季模式预报误差较小,订正效果不明显。而在11月、12月、次年1月,这4种预报方法的的均方根误差都较高,冬季预报误差大,而订正效果较好。总体而言,3种方法都比EMN的效果好,EMN的均方根误差达2.45 ℃,Ridge的订正效果最好,其平均均方根误差为2.15 ℃,RF的预报效果略差,其平均均方根误差为2.18 ℃,DL的平均均方根误差为2.16 ℃。在夏季(6~8月),EMN、Ridge、RF和DL的平均均方根误差分别为1.80 ℃、1.72 ℃、1.74 ℃和1.75 ℃;在冬季(12月至次年1、2月),EMN、Ridge、RF和DL的平均均方根误差分别为2.95 ℃、2.45 ℃、2.46 ℃和2.44 ℃。

图 4 4种预报订正处理模型的均方根误差的时间序列(2016年10月至2017年9月) Fig. 4 Time series of RMSEs for four forecast correction processing models (Oct 2016−Sep 2017)
4 总结与讨论

本文利用BABJ、ECMF、RJTD和KWBC这4个数值天气预报模式的预报资料,发展了3种基于机器学习的多模式集合预报订正的后处理模型,应用于华北地区的地面气温预报,并将单模式预报、EMN以及机器学习方法的预报效果进行对比评估。结果表明:

(1)Ridge、RF和DL的订正效果相差不大,且都比单模式和EMN要好,但是在预报前期(第1~3天)DL的预报效果略好,预报中后期(第4~11天)Ridge的预报效果略好。

(2)在华北地区的西北部均方根误差较高,而在其余的格点上,均方根误差较低,即平原地区订正效果好,山区订正效果要差一些。本文所选区域的西北地区为蒙古高原,地形比较复杂,即使是一座山的迎风坡和背风坡,气温和降水量的差别也极大,昼夜温差大,最热的月份和最冷的月份平均气温相差也极大,而且常有突发性天气变化,各模式对复杂地形的预测相对平原地区的预测结果要差一些,相应地,机器学习模型在此地区的订正效果要差一些。而平原则与其相反,地形平坦,温度变化较稳定,所以对此地区的订正效果要好一些。

(3)机器学习方法的预报效果在夏季表现较好,而在冬季表现略差。主要是因为在冬季,由于数值模式的预报误差都比较大,尤其是BABJ的均方根误差异常的大(图 5),可能受到BABJ模式的影响,机器学习方法订正结果在冬季表现略差。

图 5 4个数值预报模式的均方根误差的时间序列(2016年10月至2017年9月) Fig. 5 Time series of RMSEs for four numerical weather prediction models (Oct 2016−Sep 2017)

在本文这样的小数据集上,传统机器学习方法(比如Ridge和RF)和DL的效果相差不大,甚至有的情况下传统机器学习方法效果还更好点。理论上讲,当采用大数据集海量数据时,深度学习方法的优势才能展现出来,我们将另文专门讨论。特别是,现有各数值天气预报模式及各种后处理方法所得到的144~264 h温度预报,均方根误差均超过2 ℃,只有通过大数据运用深度学习的方法才有望得以改进。此外,对华北地区的近地面2 m气温的订正预报处理方法进行研究,可以为2022年冬奥会发展专用的局部气象预报体系探路,为2022年冬奥会的举办尽绵薄之力。

参考文献
[] 陈博宇, 代刊, 郭云谦. 2015. 2013年汛期ECMWF集合统计量产品的降水预报检验与分析[J]. 暴雨灾害, 34(1): 64–73. Chen Boyu, Dai Kan, Guo Yunqian. 2015. Precipitation verification and analysis of ECMWF ensemble statistic products in 2013 flooding season[J]. Torrential Rain and Disasters (in Chinese), 34(1): 64–73. DOI:10.3969/j.issn.1004-9045.2015.01.009
[] 范苏丹, 盛春岩, 肖明静, 等. 2015. 多模式集合对山东省气象要素预报效果检验[J]. 气象与环境学报, 31(6): 68–77. Fan Sudan, Sheng Chunyan, Xiao Mingjing, et al. 2015. Forecast effect verification of multi-model ensemble for meteorological elements in Shandong Province[J]. Journal of Meteorology and Environment (in Chinese), 31(6): 68–77. DOI:10.3969/j.issn.1673-503X.2015.06.009
[] 冯慧敏, 智协飞, 崔慧慧, 等. 2016. 基于多模式集成技术的地面气温精细化预报[J]. 气象与环境科学, 39(4): 73–79. Feng Huimin, Zhi Xiefei, Cui Huihui, et al. 2016. Refined forecasting of surface temperature based on multi-model ensemble technology[J]. Meteorological and Environmental Sciences (in Chinese), 39(4): 73–79. DOI:10.16765/j.cnki.1673-7148.2016.04.012
[] Hernández E, Sanchez-Anguix V, Julian V, et al. 2016. Rainfall prediction: A deep learning approach[C]//Proceedings of the 11th International Conference on Hybrid Artificial Intelligence Systems. Seville: Springer, 151-162, doi: 10.1007/978-3-319-32034-2_13.
[] Hinton G E, Osindero S, Teh Y W. 2006. A fast learning algorithm for deep belief nets[J]. Neural Computation, 18(7): 1527–1554. DOI:10.1162/neco.2006.18.7.1527
[] 黄威, 牛若芸. 2017. 基于集合预报和支持向量机的中期强降雨集成预报试验[J]. 气象, 43(9): 1110–1116. Huang Wei, Niu Ruoyun. 2017. The medium-term multi-model integration forecast experimentation for heavy rain based on support vector machine[J]. Meteorological Monthly (in Chinese), 43(9): 1110–1116. DOI:10.7519/j.issn.1000-0526.2017.09.008
[] 焦李成, 杨淑媛, 刘芳, 等. 2016. 神经网络七十年:回顾与展望[J]. 计算机学报, 39(8): 1697–1716. Jiao Licheng, Yang Shuyuan, Liu Fang, et al. 2016. Seventy years beyond neural networks:Retrospect and prospect[J]. Chinese Journal of Computers (in Chinese), 39(8): 1697–1716.
[] Krishnamurti T N, Kishtawal C M, LaRow T E, et al. 1999. Improved weather and seasonal climate forecasts from multimodel super ensemble[J]. Science, 285(5433): 1548–1550. DOI:10.1126/science.285.5433.1548
[] 李刚, 谢清霞, 魏涛. 2016. 集合预报在贵州最低气温中的应用[J]. 安徽农业科学, 44(14): 229–231. Li Gang, Xie Qingxia, Wei Tao. 2016. Application of multi-model ensemble method for minimum temperature in Guizhou Province[J]. Journal of Anhui Agricultural Sciences (in Chinese), 44(14): 229–231. DOI:10.3969/j.issn.0517-6611.2016.14.078
[] 李丽辉, 朱建生, 强丽霞, 等. 2017. 基于随机森林回归算法的高速铁路短期客流预测研究[J]. 铁道运输与经济, 39(9): 12–16. Li Lihui, Zhu Jiansheng, Qiang Lixia, et al. 2017. Study on forecast of high-speed railway short-term passenger flow based on random forest regression[J]. Railway Transport and Economy (in Chinese), 39(9): 12–16. DOI:10.16668/j.cnki.issn.1003-1421.2017.09.03
[] 马清. 2008.中尺度集合预报的偏差订正与多模式集成研究[D].南京信息工程大学硕士学位论文, 78pp. Ma Qing. 2008. Study of the bias-correction and multi-model combine of mesoscale ensemble forecast[D]. M. S. thesis (in Chinese), Nanjing University of Information Science and Technology, 78pp. http://cdmd.cnki.com.cn/Article/CDMD-10300-2008092054.htm
[] 牛金龙, 张东方, 姚鹏, 等. 2016. 多模式资料在成都地区的温度预报研究应用[J]. 高原山地气象研究, 36(3): 66–70, 75. Niu Jinlong, Zhang Dongfang, Yao Peng, et al. 2016. Application study of multi-mode data in the forecast of temperaturein Chengdu[J]. Plateau and Mountain Meteorology Research (in Chinese), 36(3): 66–70, 75.
[] 潘留杰, 张宏芳, 朱伟军, 等. 2013. ECMWF模式对东北半球气象要素场预报能力的检验[J]. 气候与环境研究, 18(1): 111–123. Pan Liujie, Zhang Hongfang, Zhu Weijun, et al. 2013. Forecast performance verification of the ECMWF model over the Northeast Hemisphere[J]. Climatic andEnvironmental Research (in Chinese), 18(1): 111–123. DOI:10.3878/j.issn.1006-9585.2012.11097
[] Wang H Z, Li G Q, Wang G B, et al. 2017. Deep learning based ensemble approach for probabilistic wind power forecasting[J]. Applied Energy, 188: 56–70. DOI:10.1016/j.apenergy.2016.11.111
[] 王奕森, 夏树涛. 2018. 集成学习之随机森林算法综述[J]. 信息通信技术, 12(1): 49–55. Wang Yisen, Xia Shutao. 2018. A survey of random forests algorithms[J]. Information and Communications Technologies (in Chinese), 12(1): 49–55. DOI:10.3969/j.issn.1674-1285.2018.01.009
[] 邢彩盈, 张京红, 黄海静. 2016. 基于BP神经网络的海口住宅室内气温预测[J]. 贵州气象, 40(5): 38–42. Xing Caiying, Zhang Jinghong, Huang Haijing. 2016. Forecast of residential indoor temperature based on BP neural network in Haikou[J]. Journal of Guizhou Meteorology (in Chinese), 40(5): 38–42. DOI:10.3969/j.issn.1003-6598.2016.05.007
[] 熊国经, 董玉竹, 宗瑾. 2017. 基于岭回归法对"三废"排放影响因素的研究——以江西省为例[J]. 生态经济, 33(2): 103–107. Xiong Guojing, Dong Yuzhu, Zong Jin. 2017. Research on the discharge of "Three Wastes" factors based on ridge regression:Taking Jiangxi Province as an example[J]. Ecological Economy (in Chinese), 33(2): 103–107.
[] 叶笃正, 严中伟, 戴新刚, 等. 2006. 未来的天气气候预测体系[J]. 气象, 32(4): 3–8. Ye Duzheng, Yan Zhongwei, Dai Xingang, et al. 2006. A discussion of future system of weather and climate prediction[J]. Meteorological Monthly (in Chinese), 32(4): 3–8. DOI:10.3969/j.issn.1000-0526.2006.04.001
[] 张恒德, 张庭玉, 李涛, 等. 2018. 基于BP神经网络的污染物浓度多模式集成预报[J]. 中国环境科学, 38(4): 1243–1256. Zhang Hengde, Zhang Tingyu, Li Tao, et al. 2018. Forecast of air quality pollutants' concentrations based on BP neural network multi-model ensemble method[J]. China Environmental Science (in Chinese), 38(4): 1243–1256. DOI:10.19674/j.cnki.issn1000-6923.2018.0147
[] 张禄, 杨志军. 2016.基于神经网络和主分量的日极值气温预测方法[C]//第33届中国气象学会年会S20气象信息化——业务实践与技术应用.西安: 中国气象学会, 5pp. Zhang Lu, Yang Zhijun. 2016. BP neural network prediction model of the extreme temperature based on principal component analysis[C]//33rd Annual Meeting of China Meteorological Society. Xi'an: Chinese Meteorological Society, 5pp.
[] 张伟, 王自发, 安俊岭, 等. 2010. 利用BP神经网络提高奥运会空气质量实时预报系统预报效果[J]. 气候与环境研究, 15(5): 595–601. Zhang Wei, Wang Zifa, An Junling, et al. 2010. Update the ensemble air quality modeling system with BP model during Beijing Olympics[J]. Climatic and Environmental Research (in Chinese), 15(5): 595–601. DOI:10.3878/j.issn.1006-9585.2010.05.08