2. 山东省气象数据中心, 山东 济南 250031
2. Shandong Meteorological Data Center, Jinan 250031, China
随着我国气象观测网建设的快速发展,自动气象站观测数据时空密度大大提高,利用雷达、卫星等获取的观测数据越来越多,多种数值模式模拟数据质量也在不断提高。利用数据融合与数据同化技术,综合多种来源观测资料及多模式模拟数据,获得高精度、高质量、时空连续的多源数据融合气象格点产品是当前发展趋势[1-3]。目前,我国多源融合降水实况分析产品的研究已取得了一定的进展[4-6]。国家气象信息中心利用美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)气候预测中心(Climate Prediction Center,CPC)提出的“概率密度函数+最优插值”两步融合,研制了逐时、10 km地面和卫星二源融合降水实况产品[7]。2018年,潘旸等[8]提出“概率密度函数+贝叶斯模型平均+最优插值”方法,引入中国气象局气象探测中心的雷达定量降水估测产品,研制了逐时5 km的地面、卫星、雷达三源融合降水实况产品。2021年,中国区域多源融合实况分析1 km分辨率产品投入业务应用,该产品综合利用地面自动站观测、天气雷达、风云卫星、数值模式等多源资料和数据,采用了概率密度匹配、贝叶斯模型平均、多重网格变分、最优插值等核心多源融合分析技术。
融合降水实况分析产品在不同地区的准确性有很大差别。张狄[9]在评估融合降水实况分析产品在太行山区的适用性时指出,降水产品在夏季质量较好,且与地形存在密切关系;吴薇等[10]发现,在四川区域融合降水实况分析产品存在低估,且随降水量增大误差也越大。同时,不同空间分辨率的融合降水实况分析产品的准确性也存在差异。龙柯吉等[11]对比分析了4种降水融合实况分析产品对四川一次强降水过程的适用性,指出1 km降水产品的准确性较高;邓悦等[12]评估了台风“海高斯”期间3种融合降水实况分析产品的误差,指出1 km逐小时降水融合实况分析产品效果最优。
山东地处华东沿海,中部为地势较高的鲁中山区,东部为与黄海、渤海毗邻的山东半岛,特殊地形和海陆分布特征使得山东降水空间分布不均匀。在山东特殊地理环境背景下,评估融合降水实况分析产品在山东的适用性对本地强天气过程的预报、监测和防灾减灾具有重要意义。本文将通过评估2021年山东汛期5—9月两种融合降水实况分析产品的数据质量,揭示融合降水实况分析产品在山东地区的适用情况,为下一步融合降水数据的应用提供科学依据。
1 数据与方法 1.1 融合降水实况分析产品本文对比分析了2021年降水集中且降水形势复杂的5—9月两种融合降水实况分析产品在山东地区的适用性,这两种数据分别为国家气象信息中心研制的5 km逐小时降水实时三源融合实况分析产品(简称“FRT_05”)和1 km逐小时降水实时多源融合实况分析产品(简称“RT_01”)。RT_01产品在FRT_05产品的研发基础上,将融合数据源由“地面、卫星、雷达”三源资料扩展至“地面、卫星、雷达和数值模式”等多源资料,同时RT_01产品融合技术增加了多源协同质量控制,优化了地面观测背景场质量,产品生成时效也由滞后10 min提升至5 min。本文通过气象大数据云平台“天擎”接口获取融合降水实况分析产品,评估时段内应获取产品数和实际获取数均为3 672个时次。
1.2 地面观测资料观测资料为同时段的山东省123个国家级地面气象观测站(以下简称“国家站”)和1 788个区域气象观测站(以下简称“区域站”)的逐小时降水量数据。降水量数据经过气象资料业务系统(Meteorological Data Operational System 2.0,MDOS 2.0)中的气候学界限值、时间一致性、内部一致性和空间一致性等质量控制。质量控制后,国家站降水量数据可用率为100%;区域站降水量数据可用率为99.76%,缺测率为0.23%,错误率为0.01%。由数据可用率分布(图 1)来看,可用率较低的站主要为半岛沿海一带的台站和海岛上的台站,其中长岛北隍城站、长岛跎矶站和董家口站3个台站错误率较高,分别为8.09%、2.61%和0.32%,其余台站均为缺测率较高。
采取非独立检验的方式,对已参与融合的1 911个国家站和区域站采用非独立样本检验。将质量控制后的观测降水量数据作为“真值”,采用自然邻近插值方法将融合降水格点数据插值到观测点[10-11],对评估时段的平均绝对误差(mean absolute error,MAE)、均方根误差(root mean square error,RMSE)、相对偏差(relative deviation,RD)和相关系数(correlation coefficient,CC)4个指标[13-15]进行分析,公式如下:
$ V_{\mathrm{MAE}}=\frac{1}{N} \sum\limits_{i=1}^N\left|G_i-O_i\right|, $ | (1) |
$ V_{\mathrm{RMSE}}=\sqrt{\frac{1}{N} \sum\limits_{i=1}^N\left(G_i-O_i\right)^2}, $ | (2) |
$ V_{\mathrm{RD}}=\frac{\sum\limits_{i=1}^N\left(G_i-O_i\right) \times \frac{1}{N}}{\sum\limits_{i=1}^N O_i \times \frac{1}{N}} \times 100 $ | (3) |
$ V_{\mathrm{CC}}=\frac{\sum\limits_{i=1}^N\left(G_i-\bar{G}\right)\left(O_i-\bar{O}\right)}{\sqrt{\sum\limits_{i=1}^N\left(G_i-\bar{G}\right)^2} \sqrt{\sum\limits_{i=1}^N\left(O_i-\bar{O}\right)^2}}, $ | (4) |
其中:VMAE为平均绝对误差值,VRMSE为均方根误差值,VRD为相对偏差值,VCC为相关系数值,Oi为台站观测值,Gi为融合降水实况分析产品插值到检验台站得到的数值,O为台站观测的平均值,G为参与检验降水产品的平均值,N为参与检验的总样本数。
因小时降水量为0 mm的概率较高,因此在本文中,为了更加客观地评估产品质量,统计时去除了观测降水量、融合降水产品均为0 mm的情况。同时,若观测降水量或融合降水产品任意一方缺测,那么将该台站该时次对应的观测值和融合降水产品值均剔除,不参与检验评估。根据统计,FRT_05、RT_01两种产品参与评估的总样本数分别为797 647、842 668,样本分布情况如图 2所示,可见大部分台站的样本数大于350(FRT_05台站占比93.9%,RT_01为97.8%),5—9月各月参与评估的样本数如表 1所示。
统计汇总了山东2021年5—9月1 911个自动气象观测站各台站两种融合降水实况产品与地面观测降水量的MAE、RMSE、RD和CC等4种检验指标的分布情况(图 3)。结果表明,FRT_05的MAE值集中分布于0.4~0.6 mm,平均值为0.6 mm,而RT_01的MAE值集中分布于0.2~0.4 mm,平均值为0.3 mm;FRT_05的RMSE值集中分布于0.9~1.8 mm,平均值为1.5 mm,RT_01的RMSE值集中于0.3~1.2 mm,平均值为0.95 mm;两种数据的RD分布相似,FRT_05的RD平均值为6.9%,RT_01为3.4%,其中FRT_05的RD集中在-5%~5%的台站占比为52%,而RT_01高达75%;FRT_05、RT_01的CC平均值分别为0.91、0.96,FRT_05的CC大于0.9的台站约占84%,RT_01为94%。由此可见,两种降水产品的数据质量均较高,但RT_01产品的检验结果要优于FRT_05。
本文将2021年5—9月每月具有观测记录的所有台站作为一个大样本,分月统计了两种融合降水实况分析产品与观测降水量的MAE、RMSE、RD和CC。结合5—9月山东地区观测平均降水量与4个检验指标的统计结果(表 2)来看:5—8月RT_01的MAE、RMSE和RD均比FRT_05产品小,相关性更高,9月RT_01的RD值略大于FRT_05,但其他检验指标优于FRT_05;5—8月MAE、RMSE与降水量成正比,在降水量最大的7月,MAE、RMSE最大,但在降水量次多的9月,MAE、RMSE反而较小;两种降水产品的RD呈现一致的变化特征,在降水量递增的5—7月,RD逐渐减小,8月增大,9月RD最小;两种降水产品的CC均在降水量最少的5月表现较差,其中FRT_05仅为0.61,RT_01为0.91,而9月相关性最好,FRT_05、RT_01的相关系数分别为0.93、0.97。根据以上分析得出,9月降水产品的适用性要优于其他月份。
图 4给出了两种降水产品检验指标的空间分布,可以看到两者在空间分布上略有不同:MAE和RMSE的分布特征基本一致,FRT_05误差较大的区域主要集中于鲁中山区西部、半岛北部和东南部沿海及附近海岛,部分台站MAE值大于1.2 mm,RMSE大于3.2 mm;而RT_01误差较大的区域相对集中于鲁中山区西部、威海东部和青岛沿海一带,同时全省大部分海岛站的误差也较大,部分台站MAE值大于0.9 mm,RMSE大于3.0 mm。从RD分布来看,两种数据正负RD分布相对均匀,部分台站的RD在30%以上,其中FRT_05产品中RD大于30%的台站占比为5%,而RT_01占比为2%,RD误差较大的区域与MAE、RMSE的大误差区基本吻合。从CC分布来看,大部分台站的相关性较好,其中FRT_05产品93%的台站相关系数大于0.8,RT_01产品为97%,但FRT_05在半岛北部和东南部沿海及附近海岛的相关性较差,部分台站CC小于0.5,RT_01在威海东部、青岛沿海一带以及大部分海岛的相关性较差,部分台站CC在0.8左右。
由此可见,RT_01产品的误差在山东区域有效减小,但鲁中山区西部、威海东部和青岛沿海一带的台站以及大部分海岛站的误差仍相对较大。由图 1可知,鲁中西部为海拔较高的泰山山脉,而青岛东北部为崂山山脉,威海东部濒临黄海,特殊地形和海陆边界可能对产品质量存在一定影响。同时由降水量数据可用率可知,青岛沿海一带的台站和海岛站的数据可用率较低,这些台站的数据可信度和台站代表性需要进一步探究。
2.4 降水量分级检验根据降水量强度,将小时降水量分为[0.1 mm, 2.0 mm)、[2.0 mm, 5.0 mm)、[5.0 mm, 10.0 mm)、[10.0 mm, 20.0 mm)、≥20.0 mm这5个等级,基本对应小雨、中雨、大雨、暴雨和大暴雨级别,计算这5个级别下两种融合降水实况分析产品与观测降水量的MAE、RMSE和RD。由降水量级的检验评估(表 3)来看:随着降水量增加,两种降水产品的MAE由不足1 mm增加到3 mm以上,RMSE由不足1 mm增加到5 mm以上,同时RD由正值变为负值。两种降水产品高估了中雨及以下量级的实际降水强度,低估了大雨及以上量级的实际降水强度,中雨量级的RD表现最好。
以台风“烟花”过程为例,对强降水过程降水产品的监测和再现能力进行评估分析。受台风“烟花”影响,2021年7月27日18时—30日11时,山东普遍出现强降水,平均降水量达92.8 mm。如图 5所示,鲁南、鲁西北西部和鲁中部分地区降水强度较大,降水量达100.0 mm,局部降水量超过250.0 mm;鲁西北的东部和鲁中大部分区域出现50.0 mm以上降水;鲁中东部和半岛内陆地区出现25.0 mm以上降水,局部地区超过50.0 mm;其他地区降水量不足25.0 mm。
两种融合降水实况分析产品均可以准确地反映出降水量分布特征,但RT_01能够刻画出鲁南地区累计降水量大于250.0 mm的局部强降水(图 5、图 6b红框区域)。两种产品的降水强度存在一定误差(图 7),降水较强的鲁南、鲁中西部对应的降水量误差较大,此外半岛东南部沿海地区也存在较大的误差,但RT_01误差大值分布区域范围明显小于FRT_05。
进一步统计了整个降水过程两种降水实况分析产品与地面观测降水量的MAE、RMSE、RD和CC(表 4),可见RT_01的检验结果优于FRT_05,但两种融合降水实况分析产品均低估了本次降水过程。为了探究两种融合降水实况分析产品低估实际降水量的原因,对台风“烟花”期间逐小时的地面观测降水量和两种降水产品的平均降水量进行了对比。由图 8可见,两种产品降水趋势与观测相吻合,均可以准确地刻画出降水峰值。在降水初期,两种降水产品与观测降水量的误差较小,大致稳定在0 mm附近;随着降水量增加,降水产品的误差也随之增加,28日18时—29日04时,FRT_05数据明显高估了降水强度,而RT_01低估了实际降水量;在29日05时—09时,FRT_05反而要优于RT_01;降水后期,RT_01降水量误差又再次稳定在0 mm附近,而FRT_05质量较差,对降水量存在明显的低估(图 9)。总得来看,无论是降水落区还是降水量级,RT_01产品对台风“烟花”降水过程的监测和再现能力优于FRT_05。
高时空分辨率的融合降水实况分析产品对局地、短时强降水等天气过程的预报、监测和防灾减灾具有重要作用,因此评估融合降水实况分析产品的质量十分必要。本文对比了2021年汛期5—9月逐小时的5 km三源融合降水实况分析产品和1 km多源融合降水实况分析产品两种降水产品在山东地区的适用性,从产品误差的时空分布特征、不同降水量级检验和强降水过程评估等方面分析了两种融合实况产品的适用性,结果表明:
(1) 两种融合降水实况分析产品数据质量均较高,但通过对比分析平均绝对误差(MAE)、均方根误差(RMSE)、相对偏差(RD)和相关系数(CC)的总体分布特征,可以得到RT_01的MAE、RMSE和RD误差相比FRT_05小,相关性更高;同时对比分析4个检验指标的空间分布特征,RT_01产品的误差在山东区域有效减小。RT_01产品的精细化实况监测能力优于FRT_05。
(2) 两种融合降水实况分析产品的MAE、RMSE、RD和CC呈一致的月变化特征,其中5—8月MAE、RMSE误差与降水量成正比,即从5月开始增大,7月达到峰值,但在降水量次多的9月,MAE、RMSE反而较小;RD在5—7月逐渐减小,8月增大,9月最小;降水量最少的5月降水产品与观测降水量的相关性最差,而9月相关性最好。整体来看,降水产品在9月的适用性最优。
(3) 结合各个检验指标空间分布特征来看,两种降水产品在鲁中山区西部、威海东部和青岛沿海一带以及大部分海岛上的质量均相对较差,这些地区地理环境复杂,多为高山丘陵、海陆交界一带,特殊地形和海陆边界可能对产品质量存在一定影响;同时,青岛沿海一带的台站和海岛站降水量数据可用率相对较低,站点的代表性有待考证。
(4) 由不同降水量级的检验评估来看,降水越强,MAE和RMSE误差对应越大;RD在中雨量级最优,两种降水产品均高估了中雨及以下量级的实际降水强度,低估了大雨及以上量级的实际降水强度。
(5) 对于台风“烟花”过程,两种融合降水实况分析产品都可以准确地反映出降水分布特征和降水趋势,但均低估了本次降水强度。
[1] |
HUFFMAN G J, BOLVIN D T, NELKIN E J, et al. The TRMM Multisatellite Precipitation Analysis (TMPA): quasi-global, multiyear, combined-sensor precipitation estimates at fine scales[J]. J Hydrometeorol, 2007, 8(1): 38-55. DOI:10.1175/JHM560.1 |
[2] |
宇婧婧, 沈艳, 潘旸, 等. 中国区域逐日融合降水数据集与国际降水产品的对比评估[J]. 气象学报, 2015, 73(2): 394-410. |
[3] |
师春香, 潘旸, 谷军霞, 等. 多源气象数据融合格点实况产品研制进展[J]. 气象学报, 2019, 77(4): 774-783. |
[4] |
LU N M, YOU R, ZHANG W J. A fusing technique with satellite precipitation estimate and raingauge data[J]. Acta Meteor Sinica, 2004, 18(2): 141-146. |
[5] |
XIE P P, XIONG A Y. A conceptual model for constrcting high-resolution gauge-satellite merged precipitation analyses[J]. J Geophys Res: Atmos, 2011, 116(D21): D21106. |
[6] |
宇婧婧, 沈艳, 潘旸, 等. 概率密度匹配法对中国区域卫星降水资料的改进[J]. 应用气象学报, 2013, 24(5): 544-553. DOI:10.3969/j.issn.1001-7313.2013.05.004 |
[7] |
潘旸, 沈艳, 宇婧婧, 等. 基于最优插值方法分析的中国区域地面观测与卫星反演逐时降水融合试验[J]. 气象学报, 2012, 70(6): 1381-1389. |
[8] |
潘旸, 谷军霞, 宇婧婧, 等. 中国区域高分辨率多源降水观测产品的融合方法试验[J]. 气象学报, 2018, 76(5): 755-766. |
[9] |
张狄. 融合多源数据的太行山区月降水精细化空间估算研究[D]. 南京: 南京信息工程大学, 2016.
|
[10] |
吴薇, 杜冰, 黄晓龙, 等. 四川区域融合降水产品的质量评估[J]. 高原山地气象研究, 2019, 39(2): 76-81. |
[11] |
龙柯吉, 谷军霞, 师春香, 等. 多种降水实况融合产品在四川一次强降水过程中的评估[J]. 高原山地气象研究, 2020, 40(2): 31-37. |
[12] |
邓悦, 任晓炜, 丘平珠, 等. 台风"海高斯"(2007)期间多种降水融合实况产品的误差评估[J]. 气象研究与应用, 2021, 42(3): 62-68. |
[13] |
陈艳春, 王娜, 顾伟宗, 等. 环渤海区域再分析资料地面风速场的适用性对比分析[J]. 海洋气象学报, 2017, 37(1): 67-72. |
[14] |
孟宪贵, 郭俊建, 韩永清. ERA5再分析数据适用性初步评估[J]. 海洋气象学报, 2018, 38(1): 91-99. |
[15] |
朱文刚, 李昌义, 车军辉. 基于统一高度Cressman方法的地面2 m气温客观分析[J]. 海洋气象学报, 2021, 41(2): 138-148. |