气候与环境研究  2019, Vol. 24 Issue (1): 50-60   PDF    
基于西南地区台站降雨资料空间插值方法的比较
李金洁1,2 , 王爱慧1     
1 中国科学院大气物理研究所竺可桢-南森国际研究中心, 北京 100029;
2 中国科学院大学, 北京 100049
摘要: 以西南地区1996~2000年93个气象台站观测的月均降雨量为基础,对各月降雨量进行空间自相关性,变异特征等空间分析后,采用反距离加权法(IDW)和以不同变异函数模型(指数模型、球面模型、高斯模型)为基础的普通克里金(O-Kriging)两种方法进行空间插值,通过交叉验证结果对两种方法进行分析比对。结果表明:(1)西南地区月均降雨量存在明显的空间集聚现象,并具有显著的空间自相关性和变异特征,可对该研究区域降雨量进行空间插值研究。(2)在O-Kriging插值时,变异函数选用指数模型的效果最好,球面模型次之,高斯模型最差。(3)两种方法对月均降雨量及其极大值和极小值插值时,O-Kriging的插值误差均小于IDW,插值误差整体上与降雨量呈正相关关系。在剔除各月降雨量极大值较为集中的两个站点后进行插值,插值结果的误差均明显降低。(4)对研究区域整体来说,O-Kriging的插值效果优于IDW,但就单个站点来看,结果并非如此。在降雨量的空间插值中,由于研究区域和时间尺度的不同,并不存在绝对的最优方法,应根据实际应用效果选择最适方法。
关键词: 降雨量      空间插值      空间自相关      交叉验证     
Comparison of Spatial Interpolation Methods Based on Monthly Precipitation Obsevation Data of Station in Southwest China
LI Jinjie1,2, WANG Aihui1     
1 Nansen-Zhu International Research Center, Institute of Atmospheric Physics, Chinese Academy of Sciences, Beijing 100029;
2 University of Chinese Academy of Sciences, Beijing 100049
Abstract: Based on monthly precipitation observations collected at 93 meteorological stations in Southwest China from 1996 to 2000, this study investigates the spatial interpolation results with the Inverse Distance Weighting (IDW) and O-Kriging interpolation methods. Firstly, we analyze the spatial autocorrelation and spatial variability character of monthly average precipitation data. Secondly, the IDW and O-Kriging based on three semi-variograms (exponential, spherical and, Gaussian model) are used to spatially interpolate monthly precipitation. Finally, the interpolation results are compared and discussed using the cross-validation method. The conclusions are:(1) Monthly precipitation distribution in Southwest China shows a spatial aggregation feature with high spatial autocorrelation and variation, which favors for the spatial interpolation. (2) Compared to the three semi-variograms used in the O-Kriging interpolation method, the best performance is from the exponential model, while the worst is from the Gaussian model. (3) When the O-Kriging and IDW are used in spatial interpolation of monthly average and maximum and minimum precipitation, the former one perform better than the latter one. The errors between interpolated data and observations overall increase with monthly precipitation magnitude, and the errors from both interpolation methods are obviously reduced after removing the maximum monthly precipitation points. (4) For the study area as a whole, the interpolation effect of the O-Kriging is better than that of IDW, however, this is not true at single sites. There is no absolute optimal method in the spatial interpolation of precipitation for every study area and on all time scales. The optimal interpolation method depends on the actual demands and applications.
Keywords: Precipitation     Spatial interpolation     Spatial autocorrelation     Cross validation    

1 引言

气象要素的空间插值是获取变量空间分布及其数量特征的有效方法,其核心思想是通过有限的观测资料来估算其它未采样点的值,进一步得出变量在区域范围内的连续变化(封志明等,2004何红艳等,2005)。降雨是与人类生活关系最为密切的气象要素之一,空间化的降雨信息对于旱涝灾害治理、经济发展规划、以及生态环境研究等都非常重要(吴昌广等,2010曾红伟等,2011)。当前,全球气候变暖已是毋庸置疑的事实,1880~2012年全球平均温度平均升高了0.85 ℃(IPCC,2013),受到全球气候变暖的影响,水循环以及降水格局发生明显变化(孔峰等,2017)。观测资料表明,我国一些地区的河流蒸散发量显著增加,河流的径流量减少。在过去的50年中,我国的极端降雨量,极端降雨事件的频率和强度均有升高趋势(Wang and Fu, 2013高涛和谢立安,2014),对水资源、生态系统和社会经济发展等产生了深远影响。因此,研究降雨量的空间信息具有重要意义。通常情况下,降雨观测资料是气象台站收集的离散数据,其空间代表性依赖于站点分布的密度,数量以及观测时间间隔,受到这些因素的影响(冯锦明等,2004),用观测数据代表站点所在区域的变量特征时会存在较大误差。尽管气象站点数量较过去增加很多,很大程度上丰富了地面降雨观测资料,但在大多数地区,尤其是地形复杂的区域(如我国西南地区),地面降雨观测仍不能反映降雨量在空间的连续变化。因此,可选择适当的插值方法,利用空间插值的结果来填补无站点区域的降雨数据(Li and Heap, 2014)。空间插值方法多种多样且各有优缺点,在实际应用中,并不存在一种普适性的插值方法(林忠辉等,2002)。反距离加权法(Inverse Distance Weighting,IDW)是气象要素插值最为常用的方法之一,它简单易行,插值效率高,但站点分布不均匀会使结果产生“牛眼”现象(蔡福等,2006);样条函数法(Spline)插值稳健,不依赖潜在的统计模型,但研究区域不规则会给结果带来较大误差;趋势面法(Trend)的计算过程简单,但是精度较低(何红艳等,2005);最优插值方法(Optimal Interpalation,OI)和Gressman客观分析法是进行资料同化的主要方法,多用于站点资料的格点化中(乔方利和Zhang,2002冯锦明等,2004);协同克里金法(CO-Kriging)充分考虑了数据的空间构型,但需要引入影响变量分布的协同变量,插值难度较大;普通克里金法(O-Kriging)插值准确,相比于CO-Kriging简单易行(朱会义和贾绍凤,2004刘爱利等,2012)。其中,普通克里金法和协同克里金法属于地统计学范畴(Abzalov,2016)。我们参考各个方法的优劣,选用常规方法中的IDW和地统计方法中的O-Kriging进行分析比较。已经有许多学者对这两种插值方法进行了分析。吴昌广等(2010)从站点疏密程度的视角,得出在站点稀释区域,地统计法优于常规插值方法,而在地形起伏变化较大而且密集的区域,常规方法要优于地统计法的结论。卢燕宇等(2011)对淮河流域170个站点降雨资料进行O-Kriging插值,分析了降雨量年际变化时空分布特征。也可对除去气候态的距平序列进行插值,有效降低地形的影响(Zhao and Yatagai, 2014)。曾红伟等(2011)在对大样本数据空间插值的研究中,对样本数据等间距逐步抽稀后,采用O-Kriging插值的结果优于IDW。段平等(2014)利用IDW方法,在采样过程中结合自然临近关系构建自然三角网,以一阶邻近点作为插值参考点来解决了IDW中参考点分布不均匀的问题,插值结果比改进前的IDW结果更优。

前人的研究,在对两种空间插值方法的比较和改进方面都得出了许多有价值的结论。但综合来看,在进行插值模拟之前,缺少对数据的空间分析。降雨具有时空连续性差、间隙性等的特点,其空间插值建立在站点数据自相关的假设之上,如果数据之间空间相关不显著,插值则缺乏物理意义。朱会义和贾绍凤(2004)强调在进行空间插值时,只有对已知样本进行相关性和变异性的分析后,才能选出适当的方法。在使用O-Kriging进行插值时,变异函数的选取通常根据经验选定(冯锦明等,2004叶小岭等,2016),但不同研究区域和气象要素具有不同结构特点,前人的方法不一定适用于本文的研究区域。在用O-Kriging对特定区域插值时,需要从数据的特征和实际应用效果出发来选出适用的模型。因此,本研究利用多年月均降雨数据,在对月均降雨量进行空间分析的前提下,通过对IDW和O-Kriging两种方法插值结果的分析比对,选出满足实际需求的空间降雨量插值方法。旨在为整个区域降雨数据的获取提供有效途径,同时,也让气象资源得以优化配置。

2 资料与方法

本研究以气象地理区划中包含了云南省、四川省、贵州省、重庆市的西南地区为研究区域(中国气象局,2006),以研究区域内93个气象台站(图 1)1996~2000年的月均降雨量并作为基础数据。用IDW和O-Kriging进行插值并通过交叉验证结果评价插值方法的优劣,交叉验证法首先假设某个站点值未知,通过空间插值来估算该点,并轮流改变站点,如此反复后,得出与实测值一一对应的实测值,使每个站点都被取到而且仅此一次。该研究区域各个站点分布相对均匀,数据完整无缺失值,不需要对站点进行剔除(图 1)。在进行空间插值之前,首先对各月降雨数据进行空间自相关性,变异特征等空间分析。在此基础上,利用交叉验证的结果,分析以指数模型、球面模型、高斯模型为变异函数模型的O-Kriging插值结果的差异。比较IDW和O-Kriging对各月降雨量及其极端值的插值结果,并对其适用性进行讨论。最后,对剔除降雨量极大值后的数据(1月、7月)的IDW和O-Kriging插值结果并进行对比分析。

图 1 中国西南地区气象站点分布 Fig. 1 Distribution of meteorological stations in Southwest China
2.1 数据的空间自相关性

空间自相关性指同一个变量在不同空间位置上的相关性,是空间单元属性值聚集程度的一种度量(Sokal and Thomson, 1987)。全局Moran's I指数是表示整个区域空间自相关程度的指标,用于验证研究区域的整体空间模式(Ord and Getis, 2001),其取值在−1与+1之间。正值表示数据存在空间正相关,其值的越大单元间的关系越密切,性质越相似,当其正相关关系显著时,表示变量存在明显的空间集聚现象。负值表示数据空间异常,越接近−1说明单元间的差异越大或分布越不集中。空间自相关性系数计算公式为

$ I = \frac{n}{{{s_0}}}\frac{{\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {{w_{i, j}}{z_i}{z_j}} } }}{{\sum\limits_{i = 1}^n {z_i^2} }}, $ (1)
$ {s_0} = \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {{w_{i, j}}} }, $ (2)

其中,n是要素总个数;zi是第i个的空间单元观测值与平均值的偏差,本文将每个站点月均降水量作为空间单元观测值,zj同理;wi, j是空间单元ij的权重。

2.2 反距离加权法(IDW)

IDW是根据地理学第一定律—相似相近原理提出的,即空间分布的事物之间相互联系,距离近的实物之间的相似性大于距离远的事物之间的相似性(Bartier and Keller, 1996)。其原理是待测点的属性值是邻域内样本属性值的加权平均,权的大小与待测点和样本的距离有关。IDW方法计算公式如下:

$ z'\left({{x_0}} \right) = \sum\limits_{i = 1}^n {\frac{{z\left({{x_i}} \right)}}{{{{\left({{d_{i0}}} \right)}^p}}}} /\sum\limits_{i = 1}^n {\frac{1}{{{{\left({{d_{i0}}} \right)}^p}}}}, $ (2)

其中,$z'\left({{x_0}} \right)$是待预测点x0的插值结果;z(xi)为研究区域内的样本点xii=1, 2, …, n)的实测值;n为参与插值点的数量;di0为预测点x0与各已知样点xi之间的距离;p是距离的幂,本文插值p=2,也称为距离平方反比法。

2.3 普通克里金法插值原理(O-Kriging)

O-Kriging首先考虑的是数据空间属性在空间上的变异分布,是根据数据变异特征,利用变异函数进行无偏最优线性估计,然后由已知样点加权平均求出待测点的一种方法(Rathbun,2000;靳国栋等,2003)。O-Kriging方法计算公式如下:

$ z'\left({{x_0}} \right) = \sum\limits_{i = 1}^n {{\lambda _i}z\left({{x_i}} \right)}, $ (4)

其中,$z'\left({{x_0}} \right)$待测点x0的插值结果;z(xi)为研究区域内的样本点xi的实测值;n为已知样本个数;${\lambda _i}$为克里金权重系数,${\lambda _i}$由变异函数求得,而不是直接取决于样本点和待测点之间的距离。变异函数是克里金插值方法的基础,所研究区域的区域化变量的变异函数定义如下:

$ \gamma \left({{x_i}, {x_j}} \right) = \gamma \left({{x_i} - {x_j}} \right) = \frac{1}{2}E{\left[ {z\left({{x_i}} \right) - z\left({{x_j}} \right)} \right]^2}, $ (5)

根据O-Kriging无偏性和最优性条件,整理得到方程组:

$ \left\{ \begin{array}{l} \sum\limits_{i = 1}^n {{\lambda _i} = 1} ,\\ \sum\limits_{j = 1}^n {{\lambda _j}\gamma \left( {{x_i},{x_j}} \right) - \mu } = \gamma \left( {{x_i},{x_0}} \right), \end{array} \right. $ (6)

其中,$\gamma \left({{x_i}, {x_j}} \right)$为样本点之间的变异函数,xixj分别为第i个、第j个样本点,$\gamma \left({{x_i}, {x_0}} \right)$为样本点与待测点x0的变异函数,$\lambda $为克里金权重系数,$\mu $为拉格朗日乘子

2.4 变异函数模型

为了解变量的在研究区域的变异性,需要选择一个综合的函数模型对变量空间特征作定量化表征,即变异函数模型(Rathbun,2000),常见的变异函数理论模型有指数模型、球面模型和高斯模型,表达式如下:

$ \gamma \left(h \right) = \left\{ \begin{array}{l} 0\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;h = 0 \hfill \\ {C_0} + C\left({1 - {{\text{e}}^{\frac{{ - h}}{a}}}} \right)\;\;\;h > 0 \hfill \\ \end{array} \right.\;\left({指数模型} \right), $ (7)
$ \gamma \left(h \right) = \left\{ \begin{array}{l} 0\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;h = 0 \hfill \\ {C_0} + C\left({\frac{{3h}}{{3a}} - \frac{{{h^3}}}{{2{a^3}}}} \right)\;\;\;0 < h \leqslant a \hfill \\ {C_0} + C\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;h > a \hfill \\ \end{array} \right.\left({球面模型} \right), $ (8)
$ \gamma \left(h \right) = \left\{ \begin{array}{l} 0\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;h = 0 \hfill \\ {C_0} + C\left({1 - {{\text{e}}^{\frac{{ - {h^3}}}{{{a^3}}}}}} \right)\;\;h > 0 \hfill \\ \end{array} \right.\left({高斯模型} \right), $ (9)

其中,C0为块金常数,a为变程,C为拱高,C0+C为基台值,h为任意两点间的距离。变异函数通常情况下是一个单调递增函数,但h超过某一值a后不再继续单调增大,往往稳定在一个极限值附近,将a称为变程,极限值称为基台值,表示为C0+C,将C为称为拱高。当距离h趋近于0时,函数值趋近一个常数C0,称为块金常数。

2.5 检验方法

本研究采用交叉验证方法来评价插值结果的优劣。该方法首先假设某个站点值未知,用周围的站点实测数据通过空间插值来估算该点,并轮流改变站点,如此反复后,得出与实测值一一对应的实测值,保证了研究区域每个站点都会取到而且仅此一次。将实测值和预测值的均方根误差(RMSE)、平均绝对误差(MAE)和相关系数(r)作为结果的检验标准。r可以反应实测值和预测值之间的相关程度,MAE可以估算预测值可能的误差范围,RMSE可以反映利用样点数据的估值灵敏度和极值效应,计算公式如下:

$ {R_{{\text{MSE}}}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{\left({{x_i} - {x_0}} \right)}^2}} }, $ (10)
$ {M_{{\text{AE}}}} = \frac{1}{n}\sum\limits_{i = 1}^n {\sqrt {{{\left({{x_i} - {x_0}} \right)}^2}} }, $ (11)
$ r = \frac{{\sum\limits_{i = 1}^n {\left({{x_i} - \overline {{x_i}} } \right)\left({{x_0} - \overline {{x_0}} } \right)} }}{{\sqrt {{{\left({{x_i} - \overline {{x_i}} } \right)}^2}{{\left({{x_0} - \overline {{x_0}} } \right)}^2}} }}, $ (12)

其中,RMSE表示均方根误差,MAE表示平均绝对误差,x0为第i个站点的实测值,$\overline {{x_0}} $为实测值的平均值,xi为第i个站点的预测值,$\overline {{x_i}} $为预测值的平均值,n为检验站点的个数。

3 结果分析 3.1 降雨量的空间分析

表 1是1996~2000年月均降雨量的全局Moran's I指数和对应的标准化统计量Z指数,通过标准化统计量Z指数来判定数据是否具有显著的自相关关系,当Z>1.96时(通过0.05的置信度检验)说明数据有显著的正相关性,可对其进行空间插值。反之,如果站点数据不存在显著的正相关关系,进行空间插值没有意义。由表 1可知,西南地区降雨量空间自相关性最大在4月,最小在12月。各月降雨量的全局Moran's I指数的范围是0.29~0.60,对应的Z指数的范围是4.45~8.84,均通过0.05的置信度检验。说明西南地区降雨量有明显的空间集聚现象,各月降雨量之间存在显著的空间自相关关系,可对该区域台站降雨资料进行空间插值研究。

表 1 1996~2000年中国西南地区月均降雨量数据全局Moran's I指数和Z指数 Table 1 Global Moran's I index and Z index values for monthly precipitation in Southwest China during 1996−2000

为研究降雨量的空间趋势和变异特征,选取具有季节代表性的1月和7月降雨量进行分析。图 2是1月和7月降雨量在空间变化趋势,其中,垂直的黑线高度表示数据的大小,侧面两条曲线是数据投影点的拟合曲线。1月的降雨量从西北到东南,数据呈现倒“U”形的变化趋势,从西南到东北数据有先平缓再逐渐增大的趋势。对于7月降雨量,从西北到东南数据有先平缓再逐渐增大的趋势,从西南到东北数据平缓变化很小。其变异函数值随着样点距离的增大而逐渐增加,1月和7月降雨量均体现出了明显的空间变异性,1月降雨量的空间变异性较7月弱(图 3),数据的变异函数之间存在较强的规律,可拟合变异函数模型,使用O-Kriging插值(孔云峰和孔仝文,2008)。同时,图 3也反映出在空间上距离近的台站间降雨量差异性小而相似性大的自相关特征。1月和7月降雨量的全局Moran 's I指数为0.56和3.05,由变异函数所体现的自相关特征和定量计算出的全局Moran's I指数的大小关系相吻合。

图 2 1996~2000年中国西南地区(a)1月、(b)7月降雨量空间分布趋势(x轴为东方,y轴为北方,z轴为数据值;垂直的黑线高度表示数据的大小,侧面两条曲线是数据投影点的拟合曲线) Fig. 2 Spatial trends of precipitation for (a) January and (b) July in Southwest China during 1996−2000. The x-axis is east, the y-axis is north, and the z-axis is data value. Vertical black line means the precipitation magnitude, the green and blue curves are the fitting curves of precipitation projection points, respectively

图 3 1996~2000年(a)1月和(b)7月中国西南地区降雨量的变异函数 Fig. 3 The semivariogram model for precipitation in (a) January and (b) July in Southwest China during 1996−2000
3.2 月均降雨量插值结果比较

在使用O-Kriging方法时,变异函数是进行插值的关键(靳国栋等,2003叶小岭等,2016)。为给西南地区月均降雨量选择合适的变异函数模型,分别采用高斯模型,指数模型,球状模型为变异函数模型进行O-Kriging插值,计算得出插值误差(表 2)。从整体来看,高斯模型的误差最大,球面模型次之,指数模型最小。其中,1月、6月和7月球面模型和指数模型之间没有明显的差异,对西南地区降雨量进O-kriging方法插值时,优先选用指数模型。值得注意的是,当基础数据的时空范围发生变化时,函数应做出适量调整。图 4a4b4d是IDW和O-Kriging插值结果与观测值之间的MAE、MRSE、和rr的范围分别是0.82~0.52和0.87~0.56,各月r均为后者大于前者。从插值误差来看,各月降雨O-kriging方法插值结果的MAE和MRSE均小于IDW方法,整体上有逐渐增多之后逐渐降低的趋势。该研究区域全部站点的月均降雨总量在50~704 mm,1月到7月的降雨量逐渐增多,在7月达到最大降雨量之后,开始逐渐降低(图 4c)。各月插值误差与降雨量的大小体现出了相同的变化趋势,即:降雨量越大的月份,插值误差也越大。结果表明:对于月均降雨量,不论降雨量的多少,O-kriging方法插值效果优于均IDW方法,两种方法的插值误差总体上随着降雨量的升高而升高。

表 2 1996~2000年中国西南地区月均降雨量O-Kriging插值结果(高斯模型、球面模型、指数模型)的误差比较 Table 2 Monthly precipitation RMSE (Root Mean square Error) and MAE (Mean Absolute Error) between observations and O-Kriging interpolation results based on exponential, spherical, and Gaussian models in Southwest China during 1996−2000

图 4 1996~2000年中国西南地区月均降雨量IDW和O-Kriging插值结果的(a)MAE、(b)RMSE、(c)月均降水量实测值以及(d)插值结果和实测值的相关系数r Fig. 4 Monthly precipitation (a) MAE and (b) RMSE from two interpolation methods IDW (Inverse Distance Weighting) and O-Kriging, (c) monthly observed precipitation and (d) correlation coefficients r between interpolation and observation results in Southwest China during 1996−2000

为判断两种插值方法对单个站点和整体站点是否有相同的适用性,得出两种插值方法在1月和7月降雨量的空间分布(图 5)和各个站点降雨量的插值结果(图 6)。图 5直观的反映了将雨量在空间的连续变化,可以看出西南地区降雨量由东西,南北向的变化差异,西南部和东部降水较为丰沛, 北部的降水量偏少,由东南往西北降雨量明显的递减。对于所有站点的降雨量变化(图 6)O-Kriging的插值结果比IDW更加接近实测值,两种方法的插值模拟值均在实测值附近波动,模拟值变化的幅度比实测值平缓。但就各个站点来看,也存IDW插值效果优于O-Kriging的现象。例如:在1月,19号站点和64号站点实测值分别为0.40和0.47 mm/d,对应IDW预测值均为0.41 mm/d,O-Kriging预测值为0.44和0.37 mm/d。对于7月降雨量,60号站点和68号站点对应的两组实测值为8.4和8.91mm/d,两种方法对应的预测值分别是9.08和7.9 mm/d,7.82和8.31 mm/d。可以看出,对整体插值效果较好的O-Kriging并非对每个站点的插值效果都好。对于某个特定的站点,需从两种方法对该站点的实际插值效果出发选择插值方法。

图 5 1996~2000年中国西南地区(a、c)1月和(b、d)7月降雨量(a,b)IDW和(c,d)O-Kring插值结果的空间分布 Fig. 5 Spatial distributions of precipitation from two interpolation methods (a, b) IDW and (c, d) O-Kriging in (a, c) January and (b, d) July in Southwest China during 1996−2000

图 6 1996~2000年中国西南地区各个站点(a)1月和(b)7月降雨量实测值与IDW和O-Kriging插值结果的比较 Fig. 6 Mean precipitation from observations and two interpolation methods IDW and O-Kriging at individual stations in (a) January and (b) July respectively in Southwest China during 1996−2000
3.3 降雨量极端值插值结果的比较

为比较IDW和O-Kriging对研究区域降雨量的极端值的插值模拟情况,来进一步的评价两种插值法的优劣。提取出各月降雨量极大值和极小值的插值模拟值(图 7),对于两种极端值,O-Kriging的插值结果均比IDW更加靠近实测值,但是,两种方法均存在较大的误差。本研究区域93个站点各月月均降雨量总和在18.81~75.32 mm(图省略),其中,1月至4月降雨量极大值在27号站,11月在65号站,其他各月在56号站,大部分月份的降雨量极大值集中在了27号和56号站点。考虑到在降雨量的插值研究中极大值会对结果产生较大影响,以1月和7月的降雨量数据为例,在剔除降雨量极大值较为集中的两个站后进行插值后(表 3),两种方法插值结果的MAE和MRAE均有明显降低,1月误差下降的幅度比7月更大。同时,O- Kriging插值结果的误差均小于IDW,O-Kriging仍体现出更优的插值效果。结果表明,在剔除降雨量较大的两个站点后进行插值,能有效的提高降雨量的插值精度。

图 7 1996~2000年中国西南地区各月降雨量(a)极大值和(b)极小值的实测值与IDW和O-Kriging插值结果的比较 Fig. 7 Comparison of monthly (a) maximum and (b) minimum precipitation between observations and two interpolation methods in Southwest China during 1996−2000

表 3 1996~2000年中国西南地区1月、7月降雨量两种插值方法插值误差的比较 Table 3 Precipitation MAE and RMSE from two interpolation methods in January and July in Southwest China during 1996−2000
4 结论

本研究基于西南地区月均降雨数据,在对其进行空间分析的基础之上,采用IDW和O-Kriging两种插值方法分别对月均降雨量,各月降雨极端值和剔除了各月极大值后的月均降雨量插值进行插值,然后对两种方法的插值结果进行分析比较,得出以下结论:

(1)西南地区降雨量的全局Moran's I指数的范围是0.29~0.60,其最大值在4月,最小在12月,各月降雨量存在明显的空间集聚现象,并且具有显著的自相关性和变异特征,可对该研究区域降雨资料进行空间插值研究。获得定量的降雨量空间信息,有利于整个插值过程的合理性和正确性。

(2)在使用O-Kriging对各月降雨量插值时,整体上选用指数模型的插值效果最优,球面模型次之,高斯模型最差。因此,对于西南地区的月尺度降雨数据,优选指数模型,当基础数据的时空范围发生变化时,应做出适当调整。

(3)对于研究区域整体来说,不论降雨量的多少,O-Kriging对各月降雨量的插值效果均优于IDW。插值误差的变化趋势与降雨量变化趋势一致,即:降雨量越大的月份,插值误差越大。从研究区域各个站点来看,O-Kriging的插值模拟值总体上更加靠近实测值,两种方法的模拟值在空间上的变化幅度比实测值小,但是O-Kriging并非对每个站点的插值精度都高,也存在个别站点O-Kriging插值误差大于IDW的现象。

(4)对各月降雨量极大值和极小值的插值模拟中,O-Kriging结果均比IDW更接近实测值。在剔除了各月降雨量极大值较为集中的两个站点后,两种方法的插值误差均有明显减小,1月降低的幅度更大,O-Kriging的插值效果仍优于IDW。剔除降雨量较大的两个站点后进行插值,有效的提高了插值的精度。

(5)插值方法的选取具有相对性,对于降雨量的空间插值,并不存在一种普适性的最优插值方法。前人的结论,对于不同的研究区域不一定适用。例如:在本研究中,对于各月数据,O-Kriging的插值效果均优于IDW。也有研究表明这两种方法因降雨量丰沛程度的不同表现出了不同的适用性(邬伦等,2010)。在选取O-Kriging变异函数模型时,本研究得出指数模型最优,球面模型次之,高斯模型最差的结论,而在对江苏省降雨量使用O-Kriging插值时,高斯模型效果最优,球面模型次之,指数模型最差(秦伟良和刘悦,2010)。

一般情况下,插值方法在观测点密集的情况下可提供相似的降雨空间分布,稀疏地区差异较大(de Amorim Borges et al., 2016)。降雨量易受到海拔、地形地势等客观因素的影响(蔡福等,2006孔云峰和仝文伟,2008吴昌广等,2010)如果通过地形订正或将各因子对降雨量的综合影响引入到插值过程中,能使插值结果更吻合实际降雨量的空间分布。在插值方法的选取上,本研究仅对选择的两种方法进行针对性的分析比较,可增加Optimal插值法、Cressman客观分析法和CO-Kriging等多种在气象要素插值中广泛使用的方法。在数据选用方面,可增加年、季、日等多种时间尺度的资料来进行插值模拟研究,以此构建多时间尺度的空间化降雨数据集,更好满足不同的数据需求。

致谢 感谢中国气象局信息中心提供降水观测数据。
参考文献
[] Abzalov M. 2016. Introduction to geostatistics[M]//Abzalov M. Applied Mining Geology. Cham: Springer International Publishing, doi: 10.1007/978-3-319-39264-6_17.
[] Bartier P M, Keller C P. 1996. Multivariate interpolation to incorporate thematic surface data using inverse distance weighting (IDW)[J]. Computers & Geosciences, 22(7): 795–799. DOI:10.1016/0098-3004(96)00021-0
[] 蔡福, 于慧波, 矫玲玲, 等. 2006. 降水要素空间插值精度的比较——以东北地区为例[J]. 资源科学, 28(6): 73–79. Cai Fu, Yu Huibo, Jiao Lingling, et al. 2006. Comparison of precision of spatial interpolation of precipitation factors:A case study in northeastern China[J]. Resources Science (in Chinese), 28(6): 73–79. DOI:10.3321/j.issn:1007-7588.2006.06.011
[] de Amorim Borges P, Franke J, da Anunciação Y M T, et al. 2016. Comparison of spatial interpolation methods for the estimation of precipitation distribution in Distrito Federal, Brazil[J]. Theor. Appl. Climatol., 123(1-2): 335–348. DOI:10.1007/s00704-014-1359-9
[] 段平, 盛业华, 李佳, 等. 2014. 自适应的IDW插值方法及其在气温场中的应用[J]. 地理研究, 33(8): 1417–1426. Duan Ping, Sheng Yehua, Li Jia, et al. 2014. Adaptive IDW interpolation method and its application in the temperature field[J]. Geographical Research (in Chinese), 33(8): 1417–1426. DOI:10.11821/dlyj201408003
[] 冯锦明, 赵天保, 张英娟. 2004. 基于台站降水资料对不同空间内插方法的比较[J]. 气候与环境研究, 9(2): 261–277. Feng Jinming, Zhao Tianbao, Zhang Yingjuan. 2004. Intercomparison of spatial interpolation based on observed precipitation data[J]. Climatic and Environmental Research (in Chinese), 9(2): 261–277. DOI:10.3878/j.issn.1006-9585.2004.02.04
[] 封志明, 杨艳昭, 丁晓强, 等. 2004. 气象要素空间插值方法优化[J]. 地理研究, 23(3): 357–364. Feng Zhiming, Yang Yanzhao, Ding Xiaoqiang, et al. 2004. Optimization of the spatial interpolation methods for climate resources[J]. Geographical Research (in Chinese), 23(3): 357–364. DOI:10.3321/j.issn:1000-0585.2004.03.009
[] 高涛, 谢立安. 2014. 近50年来中国极端降水趋势与物理成因研究综述[J]. 地球科学进展, 29(5): 577–589. Gao Tao, Xie Li'an. 2014. Study on progress of the trends and physical causes of extreme precipitation in China during the last 50 years[J]. Advances in Earth Science (in Chinese), 29(5): 577–589. DOI:10.11867/j.issn.1001-8166.2014.05.0577
[] 何红艳, 郭志华, 肖文发. 2005. 降水空间插值技术的研究进展[J]. 生态学杂志, 24(10): 1187–1191. He Hongyan, Guo Zhihua, Xiao Wenfa. 2005. Review on spatial interpolation techniques of rainfall[J]. Chinese Journal of Ecology (in Chinese), 24(10): 1187–1191. DOI:10.13292/j.1000-4890.2005.0125
[] IPCC. 2013. Climate Change 2013:The Physical Science Basis:Working Group Ⅰ Contribution to the IPCC Fifth Assessment Report of the Intergovernmental Panel on Climate Change[M]. Cambridge: Cambridge University Press.
[] 靳国栋, 刘衍聪, 牛文杰. 2003. 距离加权反比插值法和克里金插值法的比较[J]. 长春工业大学学报, 24(3): 53–57. Jin Guodong, Liu Yancong, Niu Wenjie. 2003. Comparison between inverse distance weighting method and Kriging[J]. Journal of Changchun University of Technology (in Chinese), 24(3): 53–57. DOI:10.3969/j.issn.1674-1374-B.2003.03.017
[] 孔峰, 史培军, 方建, 等. 2017. 全球变化背景下极端降水时空格局变化及其影响因素研究进展和展望[J]. 灾害学, 32(2): 165–174. Kong Feng, Shi Peijun, Fang Jian, et al. 2017. Advances and prospects of spatiotemporal pattern variation of extreme precipitation and its affecting factors under the background of global climate change[J]. Journal of Catastrophology (in Chinese), 32(2): 165–174. DOI:10.3969/j.issn.1000-811X.2017.02.029
[] 孔云峰, 仝文. 2008. 降雨量地面观测数据空间探索与插值方法探讨[J]. 地理研究, 27(5): 127–138. Kong Yunfeng, Tong wen. 2008. Spatial exploration and interpolation of the surface precipitation data[J]. Geographical Research (in Chinese), 27(5): 127–138. DOI:10.1016/j.envsoft.2013.12.008
[] 林忠辉, 莫兴国, 李宏轩, 等. 2002. 中国陆地区域气象要素的空间插值[J]. 地理学报, 57(1): 47–56. Lin Zhonghui, Mo Xingguo, Li Hongxuan, et al. 2002. Comparison of three spatial interpolation methods for climate variables in China[J]. Acta Geographica Sinica (in Chinese), 57(1): 47–56. DOI:10.11821/xb200201006
[] 刘爱利, 王培法, 丁园圆. 2012. 地统计学概论[M]. 北京: 科学出版社: 144-160. Liu Aili, Wang Peifa, Ding Yuanyuan. 2012. Introduction to Geostatistics (in Chinese)[M]. Beijing: Science Press: 144-160.
[] 卢燕宇, 吴必文, 田红, 等. 2011. 基于Kriging插值的1961~2005年淮河流域降水时空演变特征分析[J]. 长江流域资源与环境, 20(5): 567–573. Lu Yanyu, Wu Biwen, Tian Hong, et al. 2011. Spatial and temporal variability characteristics of precipitation in Huai River Basin during 1961-2005[J]. Resources and Environment in the Yangtze Basin (in Chinese), 20(5): 567–573.
[] Ord J K, Getis A. 2001. Testing for local spatial autocorrelation in the presence of global autocorrelation[J]. Journal of Regional Science, 41(3): 411–432. DOI:10.1111/0022-4146.00224
[] 乔方利, Zhang S Q. 2002. 现代海洋/大气资料同化方法的统一性及其应用进展[J]. 海洋科学进展, 20(4): 79–93. Qiao Fangli, Zhang Shaoqing. 2002. The unification and application reviews of modern oceanic/atmospheric data assimilation algorithms[J]. Advances in Marine Science (in Chinese), 20(4): 79–93. DOI:10.3969/j.issn.1671-6647.2002.04.013
[] 秦伟良, 刘悦. 2010. 空间插值法在降水分布中的应用[J]. 南京信息工程大学学报(自然科学版), 2(2): 162–165. Qin Weiliang, Liu Yue. 2010. Application of spatial interpolation in rainfall distribution analysis[J]. Journal of Nanjing University of Information Science and Technology (Natural Science Edition) (in Chinese), 2(2): 162–165. DOI:10.3969/j.issn.1674-7070.2010.02.013
[] Sokal R R, Thomson J D. 1987. Applications of spatial autocorrelation in ecology[M]//Legendre P, Legendre L. Develoments in Numerical Ecology. Berlin, Heidelberg: Springer, 431-466, doi: 10.1007/978-3-642-70880-0_12.
[] Wang A H, Fu J J. 2013. Changes in daily climate extremes of observed temperature and precipitation in China[J]. Atmospheric and Oceanic Science Letters, 6(5): 312–319. DOI:10.3878/j.issn.1674-2834.12.0106
[] Worthington R. 2000. Reviewed Work:Interpolation of spatial data:Some theory for Kriging by Michael L. Stein[J]. Technometrics, 42(4): 436–437.
[] 吴昌广, 林德生, 周志翔, 等. 2010. 三峡库区降水量的空间插值方法及时空分布[J]. 长江流域资源与环境, 19(7): 752–758. Wu Changguang, Lin Desheng, Zhou Zhixiang, et al. 2010. Spatial interpolation methods and temporal-spatial distribution of precipitation in the Three Gorges Reservoir area[J]. Resources and Environment in the Yangtze Basin (in Chinese), 19(7): 752–758.
[] 邬伦, 吴小娟, 肖晨超, 等. 2010. 五种常用降水量插值方法误差时空分布特征研究——以深圳市为例[J]. 地理与地理信息科学, 26(3): 19–24. Wu Lun, Wu Xiaojuan, Xiao Chenchao, et al. 2010. On temporal and spatial error distributions of five precipitation interpolation models:A case of Shenzhen[J]. Geography and Geo-Information Science (in Chinese), 26(3): 19–24.
[] 叶小岭, 沈云培, 熊雄. 2016. 一种基于改进克里金法的地面气温质量控制算法[J]. 气候与环境研究, 21(5): 614–620. Ye Xiaoling, Shen Yunpei, Xiong Xiong. 2016. A quality control algorithm for surface temperature observations based on improved Kriging method[J]. Climatic and Environmental Research (in Chinese), 21(5): 614–620. DOI:10.3878/j.issn.1006-9585.2016.15264
[] 曾红伟, 李丽娟, 张永萱, 等. 2011. 大样本降水空间插值研究——以2009年中国年降水为例[J]. 地理科学进展, 30(7): 811–818. Zeng Hongwei, Li Lijuan, Zhang Yongxuan, et al. 2011. Study on spatial interpolation of precipitation with large scale samples:A case study on 2009's precipitation of China[J]. Progress in Geography (in Chinese), 30(7): 811–818. DOI:10.11820/dlkxjz.2011.07.005
[] Zhao T B, Yatagai A. 2014. Evaluation of TRMM 3B42 product using a new gauge-based analysis of daily precipitation over China[J]. International Journal of Climatology, 34(8): 2749–2762. DOI:10.1002/joc.3872
[] 中国气象局. 2006. 中国气象地理区划手册[M]. 北京: 气象出版社: 1. China Meteorological Administration. 2006. Handbook of Meteorological and Geographical Regionalization of China (in Chinese)[M]. Beijing: China Meteorological Press: 1.
[] 朱会义, 贾绍凤. 2004. 降雨信息空间插值的不确定性分析[J]. 地理科学进展, 23(2): 34–42. Zhu Huiyi, Jia Shaofeng. 2004. Uncertainty in the spatial interpolation of rainfall data[J]. Progress in Geography (in Chinese), 23(2): 34–42. DOI:10.11820/dlkxjz.2004.02.005