海洋气象学报  2021, Vol. 41 Issue (1): 138-146  DOI: 10.19513/j.cnki.issn2096-3599.2021.01.014
0

引用本文  

李芸, 李长军, 周笑天, 等. 山东国家级气象观测站综合判识观测项目评估分析[J]. 海洋气象学报, 2021, 41(1): 138-146. DOI: 10.19513/j.cnki.issn2096-3599.2021.01.014.
LI Yun, LI Changjun, ZHOU Xiaotian, et al. Assessment analysis of comprehensive judgement items in records of national meteorological observation stations in Shandong[J]. Journal of Marine Meteorology, 2021, 41(1): 138-146. DOI: 10.19513/j.cnki.issn2096-3599.2021.01.014. (in Chinese)

基金项目

山东省气象局科研项目(2018sdqxm19)

作者简介

李芸, 女, 高级工程师, 主要从事气象数据质控分析与研究等工作, 2806738524@qq.com.

通信作者

李长军, 男, 正高级工程师, 主要从事气象数据质控分析与研究等工作, 759024710@qq.com.

文章历史

收稿日期:2020-11-25
修订日期:2021-01-24
山东国家级气象观测站综合判识观测项目评估分析
李芸 , 李长军 , 周笑天 , 崔雅琴 , 张平     
山东省气象信息中心, 山东 济南 250031
摘要:基于全国综合气象信息共享系统(CIMISS)数据库, 以一致率(冻土深度用误差绝对值)作为检验指标。对山东国家级气象观测站15项自动综合判识数据, 与同期台站观测结果做对比检验, 并进行评估分析。结果表明: 1)总云量判识一致率为65.8%, 云量偏差绝对值为1的占比51.1%;大部分不一致的情况出现在实况为阴天到满云时, 判识结果为无云或少云。云高分类后与人工观测的总体一致率为85.0%。各站云高一致率均高于云量。2)雾凇、雨凇、雾、轻雾、浮尘、扬沙、沙尘暴、积雪和结冰等9种现象综合判识结果与台站观测一致率达92.0%以上; 霜、霾、露的一致率为75.0%以上。结冰、轻雾、雾与霜命中率较高; 积雪、雨凇与扬沙漏判率较高; 沙尘暴、雨凇、扬沙和雾凇空判率较高。3)雨凇、雾凇判识效果受单站样本大小的影响; 评估期内国家级气象观测站无草温观测任务, 是造成积雪现象漏判率高的主要原因。有降水天气现象时, 同时出现的视程障碍类天气现象不判识, 是其漏判率增大的原因之一。4)评估时段冻土数据绝对误差平均值为1.6 cm, 判识与实测误差绝对值在1~10 cm之间的占82.8%, 判识效果较好。通过评估分析可见, 基于卫星、探空、自动气象站、雷达、闪电定位等多源数据, 结合模式再分析产品, 实现综合判识结果与台站观测数据一致性较好, 能够更好地满足气象预报服务需求。
关键词全国综合气象信息共享系统    综合判识    台站观测    评估分析    
Assessment analysis of comprehensive judgement items in records of national meteorological observation stations in Shandong
LI Yun , LI Changjun , ZHOU Xiaotian , CUI Yaqin , ZHANG Ping     
Shandong Meteorological Information Center, Jinan 250031, China
Abstract: Based on the CIMISS (China Integrated Meteorological Information Service System) database and using consistency ratio (in depth test of frozen soil using absolute value of error) as the inspection index, the data of 15 automatic comprehensive judgement items in records of national meteorological stations in Shandong are compared with the synchronous observation results of the stations, and assessment analysis is carried out. The results are shown below. 1) The consistency ratio of the judgement of total cloud cover is 65.8% and the absolute value of cloud cover deviation being 1 accounts for 51.1%. Most of the inconsistency occurs when the observation is between overcast sky and full clouds but the judgement results are cloudless or partly cloudy. The overall consistency ratio of cloud height after classification is 85.0% compared with observations. The consistency ratio of cloud height is higher than that of cloud cover at each station. 2) The consistency ratio is above 92.0% between observations and comprehensive judgement results of 9 weather phenomena, including rime, glaze, fog, mist, suspended dust, blowing sand, sand and dust storm, snow cover, and icing; the consistency ratio of frost, haze, and dew is above 75.0%. The hit rate of judging icing, mist, fog, and frost is high; the omission rate of judging snow cover, glaze, and blowing sand is high; the vacancy rate of judging sand and dust storm, glaze, blowing sand, and rime is high. 3) The judgement effect of glaze and rime is affected by the sample size of a single station; there is no observation task of grass temperature for the national meteorological observation stations during the assessment period, which is the main reason for the high omission rate of judging snow cover. When there is precipitation, the concurrent phenomena of visual range obstruction cannot be judged, and this explains the high omission rate. 4) The average absolute error of frozen soil data during the assessment period is 1.6 cm, the absolute value of error between judgement and observation from 1 cm to 10 cm accounts for 82.8%, and the judgement performs well. Through the assessment analysis, it can be seen the consistency is higher between comprehensive judgement results and observations based on multi-source data of satellite, sounding, automatic meteorological station, radar, and lightning location system combined with reanalysis products of models, which can better meet the needs of weather forecast.
Key words: China Integrated Meteorological Information Service System (CIMISS)    comprehensive judgement    observation of station    assessment analysis    
引言

气象观测是天气预报、气候分析、科学研究和气象服务等工作的基础[1]。从20世纪90年代后期开始, 地面气象自动观测业务得到快速发展, 气压、气温、湿度、风、降水等基本气象要素已实现自动观测, 而云量、云高、凝结类天气现象等要素则为人工观测。由于人工观测频次较少, 不能完整、连续记录天气现象, 故所测得的数据与客观事实存在一定偏差[2-8], 不能很好地满足气象业务服务需求。2014年起随着能见度要素自动观测的发展, 视程障碍类天气现象由台站业务软件自动判别[9-12]

近年来, 随着气象现代化建设和改革的不断推进, 中国气象局开展了多源数据自动综合判识项目建设, 以地面气象自动观测数据为基础, 综合利用探空雷达、天气雷达、气象卫星、闪电定位等观测数据, 判识输出总云量、云高、凝结类天气现象(露、霜、雨凇、雾凇)、视程障碍类天气现象(雾、轻雾、霾、浮尘、扬沙、沙尘暴)、其他天气现象(积雪、结冰)和冻土等数据。黄小玉等[13]通过在湖南南岳高山观测站及怀化基准气候站设立的外场试验, 采用卷积神经网络技术对南岳站积雪试验图片进行建模训练和检验, 探讨了基于深度学习的积雪天气现象图像识别的采集环境布局要求, 结果显示, 其建立的人工智能判识模型能较好地提取积雪不同发展阶段的关键特征, 且取得了满意的识别效果。朱华亮等[14]利用安徽23个典型气象站2003—2017年观测数据, 根据无霜日的气象要素阈值条件进行质量控制, 构建各气象站基于Logistic回归的霜自动判识模型, 通过独立样本检验表明, 基于Logistic回归的霜自动判识模型对安徽地区霜的平均判识准确率、命中率、漏判率、空判率和TS评分分别为89.0%、91.6%、8.4%、15.8%和78.2%, 与Bayes判别模型对比发现, 基于Logistic回归的霜判识模型在准确率、空判率和TS评分方面表现更优。郭彩莲等[15]在全国综合气象信息共享系统(China Integrated Meteorological Information Service System, CIMISS)数据库中利用SQL语句实现小时数据和自动判识数据的对比, 完成自动综合判识观测项目与人工观测结果的对比检验。华连生等[16]针对凝结类天气现象, 设计了一套基于CIMISS数据环境的霜自动分析判识系统, 该系统将形成全国2 400个霜预测模型方程参数文件以及准确率等评估报告, 为全面开展霜的自动化观测提供参考。本文基于CIMISS数据环境, 对山东国家级气象观测站(简称“国家站”)15项通过综合判识技术观测的项目进行评估分析, 以验证自动综合判识数据的准确性, 为气象预报服务提供参考。

1 评估内容

对总云量、云高、冻土、露、霜、雾凇、雨凇、雾、轻雾、霾、浮尘、扬沙、沙尘暴、积雪、结冰等15项综合判识项目结果与台站观测结果进行对比检验, 分析产生误差的原因以及各项目观测数据的完整性。

评估时段: 2018年11月15日—2019年8月31日。

2 评估资料

指定时段总云量、云高、冻土和地面凝结现象(露、霜、雾凇、雨凇4种)、视程障碍现象(雾、轻雾、霾、沙尘暴、扬沙、浮尘6种)、其他现象(积雪、结冰2种)等15项综合判识结果数据。

对应时段国家基准气候站、国家基本气象站和国家气象观测站中的原国家一般气象站的观测数据, 以CIMISS中国地面逐小时资料、中国地面日值资料为准。

综合判识产品由中国气象局国家气象信息中心实时运行。

3 评估方法

除冻土深度以误差绝对值为检验指标外, 其余14项要素均采用一致率作为检验指标。

3.1 总云量判识效果评估

将总云量判识产品与同时段的人工观测云量资料进行对比, 总云量以成为单位, 地面云量观测数据取值范围为[0, 10], 代表观测时站点上空云所占天空的成数(总云量10-时, 按10计算)。总云量的总体一致率P和具体某一站点一致率Ps可表示为:

$ P=\frac{\sum\limits_{i=1}^{n} N_{\text {corr }}}{\sum\limits_{i=1}^{n} N_{\text {total }}} \times 100 \% $ (1)
$ P_{\text {s }}=\frac{N_{\text {ceurr }}}{N_{\text {total }}} \times 100 \% $ (2)

式(1)和式(2)[17]中, n表示区域内站点数; Ntotal表示一个站点在检验时段内参与检验的总时次数, 即样本总数; Ncorr表示参与检验的所有时次中总云量判识与实况一致的时次数。因为地面云观测为人工观测, 存在一定的主观性, 且地面观测和卫星观测相比, 在观测时间方面存在10 min左右的偏差, 同时考虑到云量在应用时允许有一定的跨度区间, 所以检验中认为两者之差绝对值小于或等于2为准确。

3.2 云底高度判识效果评估

根据修改后的云底高度电码表(表 1)对云底高度进行分类[18], 与同时段人工观测云底高度处理后的电码比对, 通过计算不同时段或时间点的云高判识产品相对实况的一致率和分站点一致率检验云底高度判识效果。总体一致率P和站点一致率Ps分别用式(1)和式(2)表示。

表 1 修改后的云底高度电码表 Table 1 Code table of revised cloud base height

n表示区域内站点数; Ntotal表示一个站点在检验时段内参与检验的总样本数, 即单站样本总数; Ncorr表示参与检验的所有时次云高判识产品与人工观测云高一致的样本数。由于人工观测云底高度主观性强, 测值不可避免存在偏差, 因此, 当人工观测云底高度编码小于3时, 云底高度判识结果与人工观测结果一致或上下浮动不超过二级时, 认为判识结果正确; 大于或等于3, 云底高度判识结果与人工观测结果一致或上下浮动不超过一级时, 认为判识结果正确。

判识的云高分类参照《地面气象电码手册》中规定的人工观测编报云底高度电码表, 补充了编码9、10, 详见表 1

3.3 其他项目判识效果评估

对整个检验时段, 以一致率为检验指标, 对某次过程或发生时段, 以命中率、漏判率、空判率为检验指标, 评估露、霜、雨凇、雾凇、轻雾、雾、霾、浮尘、扬沙、沙尘暴、积雪、结冰的判识能力。以误差绝对值为检验指标, 评估冻土深度的判识能力。

$ \text { 一致率 }: P_{\mathrm{C}}=\frac{N_{\mathrm{A}}+N_{\mathrm{D}}}{N_{\mathrm{A}}+N_{\mathrm{B}}+N_{\mathrm{C}}+N_{\mathrm{D}}} \times 100 \% $ (3)
$ \text { 命中率 }: P_{\text {OH }}=\frac{N_{A}}{N_{A}+N_{B}} \times 100 \% $ (4)
$ \text { 漏判率: } P_{\mathrm{O}}=\frac{N_{\mathrm{C}}}{N_{\mathrm{A}}+N_{\mathrm{C}}} \times 100 \% $ (5)
$ \text { 空判率 }: R_{\mathrm{FA}}=\frac{N_{\mathrm{B}}}{N_{\mathrm{A}}+N_{\mathrm{B}}} \times 100 \% $ (6)
$ \text { 绝对误差平均值: } P = \frac{{\sum\nolimits_i^N {\left| {{H_{i1}} - {H_{i2}}} \right|} }}{N} $ (7)

式(3)—(7)[17]中, NANBNCND的评估认定方法如表 2, 其中NA为正确次数, 即实况有、判识有的总次数; NB为空判次数, 即实况无、判识有的总次数; NC为漏判次数, 即实况有、判识无的总次数; ND为实况无、判识无的次数。Hi1为实测冻土深度, Hi2为判识冻土深度, N为有效样本总数。

表 2 综合判识产品检验分类表 Table 2 Inspection classification of comprehensive judgement products

若判识一致率和命中率越高, 空判率和漏判率越小, 则判识效果越好; 反之则判识效果越差。

认定当日值资料某日有露、霜或结冰出现时, 当日有该现象, 综合判识数据当日任一时次出现该现象, 即判识正确。

现行的雨凇、雾凇人工观测只在白天时段(08—20时)进行, 且观测项目除包含有、无的信息外, 还包括起止时间。目前综合判识的雨凇、雾凇产品时间分辨率为逐小时, 因此在检验评估前, 首先将取自CIMISS中国地面日值资料中雨凇、雾凇数据处理成逐小时的雨凇、雾凇实况数据集, 在该小时内若有雨凇、雾凇记录, 即认为出现, 反之则未出现。雨凇、雾凇检验评估时段为每天08—20时, 逐小时检验, 因夜间只有天气现象记录, 无具体的起止时间, 因而不对夜间进行检验。

对视程障碍类天气现象雾、浮尘、扬沙、沙尘暴判识结果检验评估前, 先将取自CIMISS中国地面日值资料连续天气现象记录中的雾、浮尘、扬沙、沙尘暴数据处理成每日08—20时逐小时的实况数据集, 在某小时内若有对应记录, 即认为出现, 反之则未出现。然后将实况数据集与判识结果比对进行检验。对每日20时—次日08时, 由于日值资料中无具体发生时间, 检验时如当日20时—次日08时任何一时次判识有, 且日值表中对应时段有记录, 则认为该12 h判识结果全部正确, 否则全部错误。

视程障碍类天气现象轻雾、霾在日值资料中无出现时间记录, 如某日记录有轻雾或霾, 且对应时段判识结果中任意一时次判识有轻雾或霾, 则认为当日判识正确, 反之错误。

对于积雪, 当CIMISS中国地面日值资料天气现象记录中存在积雪时, 认为当日存在积雪现象, 如果当日任一时次判识有积雪, 则认为当日判识正确, 反之错误。

对于冻土, 评估时对比CIMISS小时资料表中的冻土深度值, 检验冻土深度的判识产品绝对误差平均值。

评估前已对台站观测天气现象数据进行质量控制, 剔除明显错误的观测数据记录, 以确保评估参考值的准确性和评估结果的可信度。

4 评估结果分析

2018年11月15日—2019年8月31日, 各类综合判识项目全省总体一致率分布情况见表 34, 判识项目与台站观测评估详情见表 5。天气现象判识结果见图 1

表 3 各类判识项目与台站观测一致率 Table 3 Consistency ratio between various types of judgement items and observations
表 4 冻土观测数据评估结果 Table 4 Assessment result of frozen soil observation data
表 5 判识项目与台站观测评估详情 Table 5 Assessment details of judgement items and observations
图 1 天气现象判识检验 Fig.1 Judgement result of weather phenomenon
4.1 总云量

总云量判识产品由中国气象局国家气象信息中心实时运行, 湖南省气象局负责产品算法维护和更新。因目前中国气象局国家气象信息中心运行的算法为2019年4月更新的版本, 湖南省气象局已在此基础上做了改进, 故此次云量判识结果由中国气象局国家气象信息中心使用新算法回算所得, 因资料限制, 回算时间段为2019年1月1日00时—8月31日12时(UTC)。

4.1.1 总体情况

利用定时观测数据的有效数据样本记录, 对总云量判识结果进行检验, 分别计算总体一致率和站点一致率。山东有总云量观测任务的基本、基准站样本总数为27 362, 自动判识数据与人工观测值一致的有18 012次, 一致率为65.8%, 站点一致率最低为53.0%, 最高为74.0%。

4.1.2 偏差分布

由云量偏差分布(图 2)可见, 山东省的云量偏差占比为双峰型, 综合判识与观测实况偏差为-1成的占比最高, 为26.1%;其次偏差为1成的占比为25.0%;偏差为-10~-3成的占比为28.3%, 而偏差为3~10成的占比为3.4%, 表明总云量判识值相对人工观测云量值总体偏低。判识不一致时, -9、-8成的偏差占比相对较高, 因此大部分不一致的情况出现在实况为阴天到满云时, 判识结果为无云或少云(0~2成)。站点空间分布显示, 鲁东南的费县与郯城站云量一致率较低, 分别为53%、54%。

图 2 云量偏差(判识-实况)百分比 Fig.2 Percentage of cloud cover deviation (judgement minus observation)

云量判识产品基于卫星接收的地表辐射[4], 辐射值越高表示云量越少, 反之则越多。当天空多小尺度积云或天空布满高云云量但云层较薄时, 实况记录云量较多, 但卫星可接收到的地表辐射较高, 因此会识别为较少的云量。云量卫星观测与人工观测原理、人工观测方式之间的差异是导致云量判识结果与人工观测值一致率偏低的主要原因[4]

4.2 云高

对比每日08、11、14、17、20时基准气候站和基本气象站云底高度判识产品与台站观测数据, 结果显示, 云高分类后与人工观测相比的总体一致率为85.0%, 一致率高于90.0%的站有6个, 低于80%台站数为8个, 站点一致率最低为75.4%, 最高为97.9%。总体看, 沿海站点云高低于内陆, 提示与沿海地区云层较厚相关。

2019年2月13日08时—14日20时, 山东全省范围内出现降雪天气, 最大降雪量为10.8 mm, 全省平均为2.5 mm, 总云量与云高一致率分别为82.2%、85.0%。

由云量、云高一致率分布(图 3)可见, 各站云高一致率均高于云量。

图 3 云量、云高判识一致率 Fig.3 Consistency ratio of cloud cover and cloud height
4.3 雨凇与雾凇

对比2018年11月15日—2019年8月31日雨凇、雾凇自动判识产品与人工观测数据, 雨凇总样本数为139 451, 判识正确1次, 空判499次, 漏判15次, 总体一致率为99.6%, 命中率为0.2%, 空判率为99.8%, 漏判率为93.8%;评估时段内, 人工记录雨凇16次, 均出现在2019年4月泰山站, 综合判识只有1次。空判499次, 空判时段内的台站大部分有降雪天气过程。以2019年2月13日08时—14日20时全省范围内出现降雪天气为例, 期间人工观测未记录雨凇, 而自动判识数据出现323个时次的雨凇。

雾凇总样本数为139 451, 判识正确33次, 均出现在泰山站; 空判479次, 漏判76次, 其中泰山站漏判40次, 占52.6%;判无测无138 862次, 总体一致率为99.6%, 命中率为29.5%, 空判率为70.5%, 漏判率为57.5%。2019年2月13日08时—14日20时, 山东全省范围内出现降雪天气, 期间仅有泰山站出现雾凇, 在13日08时—14日20时期间雾凇判识的一致率达到100%。

因雨凇、雾凇是小样本事件, 多数站点判识命中率偏低,空判率和漏判率偏高, 有待进一步改进。雾凇的一致率高于雨凇, 空判率与漏判率低于雨凇。综合气象要素的个例检验中, 由于部分站点人工观测规范与雨凇、雾凇判识模型物理过程差异引起的偏差, 在过程消散阶段, 气象条件已明显不符合雨凇雾凇出现的阈值条件, 但观测场目光所及的区域内前期已形成雨凇雾凇仍然处在维持状态。雨凇、雾凇基于历史样本下的“一站一模型”[13], 单站样本大小是影响判识效果的原因之一。

4.4 冻土 4.4.1 总体情况

冻土总样本数15 658, 冻土误差绝对值为0的10 553次, 其中10 043个数据为判识与实况均未出现冻土, 510个冻土深度值为一致; 在已出现冻土数据的5 615个样本中, 判识与实测误差绝对值在1~10 cm之内者占82.8%, 误差绝对值在11~20 cm之内者占7.5%;平均误差绝对值在0.1~0.9 cm的站占43.0%, 1.0~1.9 cm的站占39.0%(表 6图 4图 5), 评估时段冻土数据绝对误差平均值为1.6 cm, 判识效果较好。

表 6 冻土误差分类 Table 6 Error classification of frozen soil
图 4 冻土绝对误差平均值分类站点数 Fig.4 Number of classified stations of average absolute error of frozen soil data
图 5 冻土判识绝对误差分类占比 Fig.5 Percentage of absolute error classification of frozen soil judgement
4.4.2 个例分析

2019年2月13日08时—14日20时, 山东全省范围内出现降雪天气, 最大降雪量为10.8 mm, 全省平均2.5 mm, 第一层冻土误差绝对值平均为2.9 cm, 误差绝对值最大为12.0 cm, 出现差别的原因可能是当地温降至0 ℃以下时, 人工站冻土器内外管间存有空间, 导致冻土管内的水并未立即结冰, 观测场中的植被各站存在差异, 有草皮的台站, 地温与冻土场地的植被不同, 地温不能真实反映冻土器安装区域的地中温度, 因而造成判识误差。

4.5 积雪

积雪总样本数35 793, 判识正确与空判均未出现, 漏判928次, 总体一致率为97.4%, 漏判率为100%。2019年2月13日08时—14日20时, 全省范围内出现降雪天气, 因积雪现象的自动判识数据各站均未出现, 2月13—14日实况有110个站出现积雪现象, 综合判识整个过程漏判, 漏判率为100%。

积雪现象判识误差主要来自于草面或雪面温度的观测误差。由于草面或雪面温度传感器周围的积雪常易融化, 如果未能及时放回雪面上, 可出现较大误差, 造成判识错误; 部分台站长期浅雪覆盖, 甚至草面表下面已经没有积雪, 草面(雪面)与地面温度变化趋于一致, 此时也会造成判识错误, 造成漏判。由于山东省国家站草温观测任务始于2019年11月1日, 评估期内无观测数据, 在一定程度上影响了积雪判识数据的准确性, 是造成漏判的主要原因。

4.6 露

露的总样本数为35 793, 判识正确1 737次, 空判6 652次, 漏判2 134次, 一致率为75.5%, 命中率为20.7%, 空判率为79.3%, 漏判率为55.1%。露的空判率较高, 命中偏少, 其原因是国家站夜间不守班会造成漏测, 冬季如果夜间先出现露, 之后露冻结形成霜, 清晨记录观测到的霜而未观测到露的现象导致露的空判; 地面气象观测规范中规定霜化为露后不记露, 秋冬季节经常出现霜露混合的现象, 霜化为露时也有露水形成的现象, 导致露的空判。

4.7 霜

霜的总样本数为35 793, 判识正确6 035次, 空判3 888次, 漏判746次, 一致率为87.1%, 命中率为60.8%, 空判率为39.2%, 漏判率为11.0%, 判识效果较好。霜多形成于夜间, 夜间有霜形成由于国家站夜间不守班, 因而人工会出现漏测, 经分析, 风向为偏南风或风速较大时出现空判较多。

4.8 结冰

结冰的总样本数为35 793, 判识正确8 521次, 空判176次, 漏判1 836次, 结冰的判识总体一致率为94.4%, 判识命中率高达98.0%, 空判率为2.0%, 漏判率为17.7%。全省结冰综合判识具有命中高, 漏判、空判低的特点, 综合判识效果较好。

选取2019年2月13—14日全省范围内出现降雪天气过程进行检验, 结冰样本总数246, 无缺测数据, 一致率为95.1%, 命中率为99.1%, 漏判率为4.3%, 空判率为0.9%。结冰命中率较高, 漏判和空判较低。漏判的台站气温低于-5 ℃, 但综合判识却未识别, 空判的基本为当日气温低于0 ℃, 但持续时间不长实况未出现结冰, 而综合判识有结冰。

4.9 视程障碍类天气现象 4.9.1 雾、轻雾、霾

雾的总样本数为855 867。判识正确8 473次, 空判3 083次, 漏判11 989次, 总体一致率为98.2%, 命中率为73.3%, 漏判率为58.6%, 空判率为26.7%。2019年2月5—6日, 山东出现大雾天气过程, 综合判识正确162次, 空判、漏判均为0, 判识一致率达100%,命中率达100%, 过程雾判识效果较好。

轻雾的总样本数为35 793。判识正确19 242次, 空判649次, 漏判2 157次, 一致率和命中率均较高, 分别为92.2%和96.7%;漏判率和空判率均较低, 分别为10.1%和3.3%, 判识效果较好。2019年2月22—23日, 山东出现雾霾天气过程, 轻雾综合判识总体一致率为93.7%, 命中率为87.1%, 漏判率为5.5%, 空判率为12.9%, 过程轻雾判识效果较好。

分析2019年7月出现雾、轻雾和降水天气较多的泰山站数据, 雾、轻雾与降水同时出现, 则综合判识出现漏判。

霾的总样本数为35 793。判识正确3 905次, 空判8 028次, 漏判66次, 一致率为77.4%, 命中率为32.7%, 漏判率为1.7%, 空判率为67.3%, 判识命中率较低, 空判率较高, 主要原因是将轻雾和浮尘天气判识为霾。由全省站点霾判识数据一致率分布图(图 6)可见, 有98个站判识一致率大于70.0%, 其中37个站一致率在80.0%~89.0%之间, 15个站一致率在90.0%~99.0%之间。

图 6 霾判识数据一致率分布图 Fig.6 Consistency ratio of judgement data of haze

2019年2月22—23日, 山东出现雾霾天气过程, 霾判识正确2 477站次, 总体一致率达93.6%, 命中率为94.9%, 漏判率为11.8%。霾过程判识效果较好。

4.9.2 浮尘、扬沙、沙尘暴

浮尘、扬沙、沙尘暴的总样本数均为855 867, 在评估时段浮尘天气共出现了33次, 判识正确0次, 漏判33次, 空判0次, 总体一致率为100%, 漏判率为100%。扬沙天气共出现了122次, 判识正确37次, 漏判85次, 空判275次, 总体一致率为99.9%, 空判率为88.14%, 漏判率为69.7%, 命中率为11.9%。沙尘暴天气没有出现, 空判5次, 总体一致率为100%, 空判率为100%, 5个时次全部空判, 均出现在高山站泰山, 实际天气实况记录为雾、轻雾。

5 结论

1) 总云量判识一致率为65.8%, 云量偏差绝对值为1的占比51.1%;大部分不一致的情况出现在实况为阴天到满云时, 判识结果为无云或少云。云高分类后与人工观测的总体一致率为85%。各站云高一致率均高于云量。

2) 雾凇、雨凇、雾、轻雾、浮尘、扬沙、沙尘暴、积雪和结冰等9种现象判识与台站观测一致率为92.0%以上; 霜、霾、露的一致率为75.0%以上。结冰、轻雾、雾与霜命中率较高; 积雪、雨凇与扬沙漏判率较高; 沙尘暴、雨凇、扬沙和雾凇空判率较高。

3) 雨凇、雾凇判识效果受单站样本大小影响; 评估期内国家站无草温观测任务, 是造成积雪现象漏判率高的主要原因。有降水天气现象时, 同时出现的视程障碍类天气现象不判识, 是其漏判率增大的原因之一。

4) 评估时段冻土数据绝对误差平均值为1.6 cm, 判识与实测误差绝对值在1~10 cm之间的占82.8%, 判识效果较好。

通过评估分析, 多源观测数据综合判识与台站观测数据一致性较好, 综合判识数据频次为逐小时, 能够实现观测项目的客观化、定量化。但雨凇与浮尘现象漏判率较高, 沙尘暴、雨凇、扬沙和雾凇现象空判率较高, 可能与项目的样本数较少以及评估时间较短有关。今后, 有待积累更多资料, 根据各站的历史气候特征及气象条件做进一步研究, 从而更好地满足气象业务及服务需求。

参考文献
[1]
中国气象局. 地面气象观测规范[M]. 北京: 气象出版社, 2003.
[2]
王国复, 许艳, 朱燕君, 等. 近50年我国霜期的时空分布及变化趋势分析[J]. 气象, 2009, 35(7): 61-67.
[3]
宁晓菊, 张丽君, 杨群涛, 等. 1951年以来中国无霜期的变化趋势[J]. 地理学报, 2015, 70(11): 1811-1822. DOI:10.11821/dlxb201511010
[4]
李娅, 郭建侠, 曹云昌, 等. FY-2G云量产品与地面观测云量对比分析[J]. 高原气象, 2018, 37(2): 514-523.
[5]
徐兴奎. 中国区域总云量和低云量分布变化[J]. 气象, 2012, 38(1): 90-95.
[6]
汪卫平, 杨修群, 张东海. 中国雨凇的时空变化[J]. 气象, 2020, 46(5): 666-674.
[7]
李文静, 孙倩倩, 黄蔚薇, 等. 1981—2010年我国雾凇时空分布特征[J]. 气象灾害防御, 2019, 26(4): 39-43.
[8]
孔锋. 中国灾害性沙尘天气日数的时空演变特征(1961—2017)[J]. 干旱区资源与环境, 2020, 34(8): 116-123.
[9]
焦春霞, 陈梦娇, 宋良娈, 等. 新型站视程障碍类天气现象判识规定的思考[J]. 贵州气象, 2017, 41(3): 82-84.
[10]
黄晓云, 杨召琼, 李翔. 视程障碍现象自动判别分析与应用[J]. 气象水文海洋仪器, 2018, 35(4): 37-40.
[11]
司鹏, 高润祥. 天津雾和霾自动观测与人工观测的对比评估[J]. 应用气象学报, 2015, 26(2): 240-246.
[12]
任芝花, 余予, 韩瑞, 等. 自动与人工观测霾日、雾日序列连续性分析[J]. 高原气象, 2018, 37(3): 863-871.
[13]
黄小玉, 张垚, 叶成志, 等. 地面积雪天气现象人工智能观测识别研究[J]. 气象, 2019, 45(9): 1189-1198.
[14]
朱华亮, 温华洋, 华连生, 等. 基于Logistic回归建立霜自动判识模型[J]. 中国农业气象, 2019, 40(8): 534-542.
[15]
郭彩莲, 赵冰燕, 来志云. SQL语句在自动综合判识观测项目准确性评估中的应用[J]. 青海科技, 2019, 26(6): 103-106.
[16]
华连生, 朱华亮, 温华洋, 等. 霜自动分析判识系统的设计与实现[J]. 气象水文海洋仪器, 2020, 37(1): 53-58.
[17]
中国气象局观测司. 地面气象观测自动化自评估方案[R]//中国气象局观测司. 观测司关于开展地面气象观测自动化改革试运行评估工作的通知. (2019-06-14)[2020-11-01].
[18]
中国气象局. 陆地测站地面天气报告电码(GD-01Ⅲ)[M]. 北京: 气象出版社, 1991.