海洋气象学报  2025, Vol. 45 Issue (3): 117-128  DOI: 10.19513/j.cnki.hyqxxb.20241019001
0

引用本文  

冯冬含, 李峰, 秦泉, 等. 基于GEE多特征优选的设施农业类型信息提取[J]. 海洋气象学报, 2025, 45(3): 117-128. DOI: 10.19513/j.cnki.hyqxxb.20241019001.
FENG Donghan, LI Feng, QIN Quan, et al. Extraction of facility agriculture types by multi-feature selection based on GEE[J]. Journal of Marine Meteorology, 2025, 45(3): 117-128. DOI: 10.19513/j.cnki.hyqxxb.20241019001. (in Chinese)

基金项目

山东省自然科学基金项目(ZR2020MF130,ZR202211260263);山东省气象局科研项目(2023sdqxz12,2021sdqxz03);山东省气候中心创新项目(2023QHCX04)

作者简介

冯冬含,dorisfdh@163.com.

通信作者

秦泉,qquan0303@163.com.

文章历史

收稿日期:2024-10-19
修订日期:2025-02-22
基于GEE多特征优选的设施农业类型信息提取
冯冬含1,2 , 李峰1,2 , 秦泉1,2 , 张继波1,2 , 韩东枫1,2 , 王晗1,2 , 段金馈1,2 , 迪力努尔·热依木3     
1. 山东省气象防灾减灾重点实验室,山东 济南 250031;
2. 山东省气候中心,山东 济南 250031;
3. 喀什地区气象局,新疆 喀什 844000
摘要:为对不同设施农业类型信息进行识别分类和精细化提取,以潍坊日光温室和塑料大棚为研究对象,基于Google Earth Engine(GEE)云计算平台,利用Sentinel-1雷达卫星数据、Sentinel-2光学卫星数据和SRTM DEM数据,提取光谱特征、指数特征、雷达特征、纹理特征和地形特征共41个特征变量并进行特征优选,其中,通过累计差法对比14种不同尺寸窗口,计算得到Sentinel-2影像最佳纹理特征。采用随机森林分类算法,根据不同特征设计6种组合方案开展实验,得到潍坊2023年10 m分辨率设施农业空间分布情况,探讨不同特征组合对设施农业信息提取精度的影响。结果表明:(1)Sentinel-2提取设施农业的最佳纹理特征窗口是27×27,最佳纹理特征组合为均值、熵、方差、相异性和对比度。(2)在光谱特征、指数特征的基础上加入纹理特征、雷达特征和地形特征对设施农业进行分类,不同类型特征对设施农业提取的有利程度由大到小依次为纹理特征、地形特征、雷达特征,与单一光谱和指数特征相比,分类精度分别提升4.08%、1.40%、0.80%。(3)特征优选后的方案提取精度最高,设施农业的总体精度为91.03%,Kappa系数为0.86。其中,塑料大棚的生产者精度和用户精度分别为92.21%和91.83%;日光温室的生产者精度和用户精度分别为88.54%和89.47%。(4)利用Sentinel系列影像和SRTM DEM地形数据,构建的潍坊多种设施农业类型遥感提取方法,可为设施农业灾害风险管理提供决策支撑。
关键词设施农业    Sentinel卫星    GEE    随机森林    
Extraction of facility agriculture types by multi-feature selection based on GEE
FENG Donghan1,2 , LI Feng1,2 , QIN Quan1,2 , ZHANG Jibo1,2 , HAN Dongfeng1,2 , WANG Han1,2 , DUAN Jinkui1,2 , Dilinuer Reyimu3     
1. Key Laboratory for Meteorological Disaster Prevention and Mitigation of Shandong, Jinan 250031, China;
2. Shandong Climate Center, Jinan 250031, China;
3. Kashgar Meteorological Service, Kashgar 844000, China
Abstract: To distinguish and precisely extract the information of different types of facility agriculture, this study takes the solar greenhouses and polyhouses in Weifang as the research objects using the Google Earth Engine (GEE) platform. By integrating Sentinel-1 radar data, Sentinel-2 optical data and SRTM DEM data, 41 feature variables are extracted, including the features of spectrum, index, radar, texture and topography, and the optimal selection of features is conducted. By comparing 14 window scales with the cumulative difference method, the optimal texture features for Sentinel-2 imagery are identified. The experiments with 6 combinations of features are designed using the random forest classification algorithm to generate a distribution map of facility agriculture in Weifang with the resolution of 10 m in 2023, and the impacts of different combinations on the accuracy of extraction are explored. The results are outlined below. (1) The optimal window scale of the texture feature for extracting facility agriculture using Sentinel-2 is 27×27, and the best combination of texture features includes Mean, Entropy, Variance, Dissimilarity and Contrast. (2) Besides the features of spectrum and index, the features of texture, radar and topography are used to classify facility agriculture. The order of different features beneficial to extract facility agriculture from high to low is texture, topography and radar, and compared to the classification using only spectrum and index, the accuracy increases by 4.08%, 1.40% and 0.80%, respectively. (3) The optimal selection of features yields the highest classification accuracy, with an overall accuracy of 91.03% and a Kappa coefficient of 0.86. The producer's accuracy and user's accuracy for polyhouses are 92.21% and 91.83%, respectively, while those for solar greenhouses are 88.54% and 89.47%, respectively. (4) The remote sensing extraction method for various facility agriculture types in Weifang using Sentinel imagery and SRTM DEM topography data offers decision-making support for disaster risk management of facility agriculture.
Key words: facility agriculture    Sentinel satellite    GEE (Google Earth Engine)    random forest    
0 引言

设施农业是现代农业的重要组成部分,作为一种显著延长作物生长季节和提高作物产量的新型生产方式,能够有效提高资源利用率并增强农业系统的防灾减灾能力,是保障“菜篮子工程”顺利开展的重要技术措施[1]。近年来气候变化导致极端天气事件频发[2-3],涝灾、风灾等气象灾害风险的加剧直接威胁设施农业生产[4-5]。由于建筑结构、材料的差异,不同类型的设施农业对灾害的防御能力完全不同。因此,及时准确地获取设施农业分布情况,可为防灾减灾提供决策支持,并且在促进农业产业结构调整和提高城乡居民的生活水平等方面具有十分重要的现实意义。

随着农业经济、信息技术的迅速发展,设施农业的占地面积逐年攀升。依靠人工实地调查设施农业不仅费时费力,而且很难及时更新大范围设施农业的空间分布数据。与传统地面调查方法相比,遥感技术提供了更高效的手段,并具有成本低、效率高、大范围同步观测的优势[6-7],在设施农业的信息提取方面提供了新的思路。目前已有研究尝试使用遥感数据获取设施农业信息,并取得良好进展。提取设施农业通常有2类方法:一是基于像元的支持向量机(support vector machines,SVM)[8]、随机森林(random forest,RF)和神经网络(neural network,NN)[9]等机器学习分类方法,其优点是计算效率高且适用性广泛,冯权泷等[10]利用随机森林模型获取全国塑料大棚分布数据,平均精度为87.45%;二是基于影像分割的面向对象分类方法,例如多尺度分割、灰度分割、知识分割等,可以保证地物在空间上的连续性,但参数依赖性强,仅适合小区域提取,例如吴锦玉等[11]、Hasituya等[12]均选择县级区域作为研究区。

现有的研究主要集中在设施农业的整体提取上,但在大范围内针对不同设施农业类型信息提取的方法研究较少。随着遥感技术不断发展,中高分辨率卫星逐步发射,可为地物分类提供更多细节信息。欧洲航天局(European Space Agency,ESA)发布的Sentinel-2光学影像数据空间分辨率达10 m,满足设施农业类型提取需求[13]。然而影像的空间分辨率越高,同一地物内的异质性越强,从而影响分类精度[14]。因此除Sentinel-2的光谱特征外,还需考虑其他特征参与精细化分类研究。Sentinel-1搭载的合成孔径雷达(synthetic aperture radar,SAR)可以全天候获取地表信息,提供的后向散射系数能够帮助识别设施农业的纹理特征。融合光学影像和SAR影像,能够实现多源遥感数据互补[15-16],进一步提升识别和分类精度。但长时间序列、大空间尺度的遥感数据存储和计算等处理对软硬件环境提出了更高的要求。谷歌于2015年发布了专门用于处理遥感影像的Google Earth Engine(GEE)云计算平台,能够高效管理和处理海量遥感影像,为提取设施农业信息提供了强有力的技术支撑。相比于ERDAS、ENVI等传统遥感图像处理软件,云端处理影像能减少过程数据的生成,用户可以快速实现遥感影像批量处理和结果可视化等功能[17],极大地提高了数据处理效率。基于此,国内外学者开展的一系列研究[18-20]都表明GEE云计算平台在遥感数据分析方面有着巨大的应用潜力。

以山东潍坊为研究区,利用GEE云计算平台,将Sentinel-1雷达影像和Sentinel-2光学影像作为数据源,构建光谱、指数、雷达、纹理和地形特征集合,设计6种设施农业(日光温室、塑料大棚)提取方案,采用随机森林算法分类并进行精度评价,筛选出最佳特征组合,实现大范围提取设施农业类型信息,为设施农业精细化分类提供新思路。此研究可对潍坊设施农业的产业发展和防灾减灾提供重要的决策支持。

1 数据与方法 1.1 研究区概况

潍坊位于山东半岛的西部(35.70°~37.29°N,118.17°~120.01°E;图 1),属暖温带半湿润大陆性季风气候,降水、光照资源丰富[21],适合多种农作物生长。地形以平原为主,兼有丘陵和山地,地势自南向北逐渐降低。南依泰沂山脉,中部为潍北冲积平原,北临渤海莱州湾,地势平坦、土地肥沃。潍坊是中国北方地区最大的蔬菜生产和集散地,设施农业面积位居全省第一。在平原地区聚集不同类型设施农业,分布最为广泛的是日光温室和塑料大棚,设施主要用于种植高附加值的经济作物,如番茄、黄瓜、辣椒、西瓜、草莓等。

图 1 研究区地理位置及局部设施农业示意图 Fig.1 Geographical location of the study area and sketch map of facility agriculture in local areas
1.2 数据 1.2.1 遥感数据获取与预处理

研究使用高空间分辨率的Sentinel-1和Sentinel-2卫星影像,数据源自哥白尼数据空间生态系统(Copernicus Data Space Ecosystem,https://dataspace.copernicus.eu)。Sentinel-1选用干涉宽幅(interferometric wide-swath,IW)模式的地面分辨距离(ground resolving distance,GRD)数据,极化方式选择适用于地表植被特征监测的VV+VH[22]。Sentinel-2影像数据涵盖从可见光、近红外到短波红外共13个光谱波段,各波段具有不同的空间分辨率(10 m、20 m和60 m),为提高数据一致性,对所有波段重采样至10 m分辨率。实验收集成像时间范围为2023年1—12月的卫星影像(表 1)。为减少云层遮挡对提取结果的影响,优先筛选云量小于10%的Sentinel-2影像数据,并利用QA60波段进行云掩膜。其中,8月和10月云量过多,无法直接使用单景或多景拼接影像,因此采用中值合成法得到月尺度无云合成影像。

表 1 影像数据采集日期 Table 1 Acquisition date of imagery data
1.2.2 地形数据

研究区地形包括平原、丘陵和山地,加入地形数据的目的是拟提高分类精度。实验基于GEE平台调用美国地质调查局(United States Geological Survey,USGS)提供的30 m空间分辨率的数字高程模型(digital elevation model,DEM)数据产品(USGS/SRTMGL1_003),重采样至10 m后按研究区边界裁剪,使其与Sentinel数据分辨率匹配,便于多源数据集成与对比分析。

1.2.3 样本采集

在设施农业信息提取过程中,样本类别的划分和选取至关重要。结合实地调查和山东省地理信息公共服务平台天地图2 m历史影像(下载地址为 https://shandong.tianditu.gov.cn)进行目视解译,建立研究区内日光温室、塑料大棚、耕地、道路、水体、森林、建设用地、裸地等主要地物类型的遥感解译标志(表 2)。基于潍坊矢量边界,根据解译标志分散随机绘制2 800个样本,包括日光温室和塑料大棚各580个,其他地物1 640个。按7 ∶3比例划分为训练样本和验证样本,即1 960个训练样本和840个验证样本(图 2)。

表 2 地物类型解译标志 Table 2 Explanation of symbols of land cover types
图 2 潍坊不同地物类型验证样本的分布 Fig.2 Distribution of test samples for different land cover types in Weifang
1.3 研究方法 1.3.1 技术路线

研究技术路线如图 3所示。使用GEE云计算平台,快速获取覆盖潍坊的Sentinel遥感影像和DEM数据,并进行重采样、去云、裁剪等处理。在此基础上,提取光谱特征、指数特征、地形特征、雷达特征和纹理特征构建特征集。基于不同特征组合,设计6种设施农业提取方案:1.使用光谱特征和指数特征作为基础方案,用以评估其独立的分类性能;2.加入地形特征,提供额外的空间位置信息,有助于提高分类模型的判别能力;3.在基础方案中加入雷达特征用于反映地物表面粗糙度、电磁波散射特性等属性,是对光学影像的重要补充;4.引入基于Sentinel-2影像计算的纹理特征,捕捉地物结构的细微差异,从而提升设施农业精细化分类能力;5.综合全部特征,全面利用多源数据的优势最大化提升分类精度;6.在全部特征组合的基础上,通过特征优选方法筛选贡献度高的变量,剔除冗余信息,进一步提升分类效率和精度。所有方案均采用随机森林监督分类方法进行提取,并对分类结果进行精度评价,选择精度最高的特征组合方案,获取潍坊设施农业空间分布信息。

图 3 技术路线 Fig.3 Technical route diagram
1.3.2 特征选取

(1) 光谱特征。在Sentinel-2光学影像的13个原始波段中,剔除B1、B10这2个无关波段,选取其他11个光谱波段作为原始波段特征,并计算19个常用遥感指数(表 3),如归一化植被指数(NDVI)、归一化水体指数(NDWI)、红边位置指数(REPI)、土壤调节植被指数(SAVI)等。计算结果在实验中作为独立的指数特征波段,与原始波段并列参与分类任务。

表 3 参与分类的特征 Table 3 Features involved in classification

(2) 雷达特征。Sentinel-1有4种成像模式(干涉宽幅模式IW、扩展宽幅模式EW、波束模式WV、条带模式SM)和2类极化方式,分为单极化方式(HH或VV)和双极化方式(HH+HV或VV+VH)。其中,IW模式广泛应用于陆地表面的遥感研究[23],特别是VV和VH偏振组合,在地表特征提取和分析中表现出优异的效果。本研究选用VV+VH作为独立的雷达特征波段参与特征构建。

(3) 纹理特征。纹理特征是地物提取和识别中的重要参数,用来描述图像中像素灰度值的空间分布,这种局部的统计信息能够帮助提取复杂地物的特征。常用的纹理分析方法是灰度共生矩阵(GLCM)[24],因其计算过程简单、结构信息丰富,故在遥感提取研究中得到广泛应用。GLCM算法需要8位灰度图像作为输入,因此此实验通过原始影像的红(RED)、绿(GREEN)、蓝(BLUE)波段的线性组合生成所需灰度图像(gray),计算公式如下。

$ \text { gray }=(0.3 \times \text { RED })+(0.59 \times \text { GREEN })+(0.11 \times \text { BLUE }) $ (1)

实验选取8种主要的纹理特征,包括角二阶矩(ASM)、相关性(Correlation)、对比度(Contrast)、熵(Entropy)、均值(Mean)、方差(Variance)、相异性(Dissimilarity)、同质性(Homogeneity)。

(4) 地形特征。日光温室和塑料大棚的建造受地形限制,加入地形特征尝试提高分类精度。除海拔高度(Elevation)外,增加3种常用的地形特征,即坡度(Slope)、坡向(Aspect)、山体阴影(Hillshade),这4种特征将作为独立波段参与特征构建。

1.3.3 Jeffries-Matusita距离

Jeffries-Matusita(JM)距离[25]常用于遥感影像分类中评估不同类别之间的可分性。将全年不同月份的JM距离进行比较,JM距离越大,表明设施农业与其他地物类别的可分性越好,在此研究中JM距离最大的月份被认为是提取的最佳时相。

μiμj分别为类别ij的均值向量,Σi和Σj分别为对应的协方差矩阵。JM距离的定义如下。

$ \mathrm{JM}_{i j}=\sqrt{2\left\{1-\exp \left[-\frac{1}{8}\left(\boldsymbol{\mu}_i-\boldsymbol{\mu}_j\right)^{\mathrm{T}}\left(\frac{\sum i+\sum j}{2}\right)^{-1}\left(\boldsymbol{\mu}_i-\boldsymbol{\mu}_j\right)-\frac{1}{2} \ln \left(\frac{\frac{\sum i+\sum j}{2}}{\sqrt{\left|\sum i\right|\left|\sum j\right|}}\right)\right]\right\}} $ (2)

其中:μiμj表示类别均值向量的差异,$\frac{\sum i+\sum j}{2}$表示类别协方差矩阵的均值。

1.3.4 累计差

在计算纹理特征时,滑动窗口大小(邻域的尺寸)对分类结果有显著影响。较小窗口容易引入过多噪声,导致分类结果不稳定。而较大窗口会模糊图像中的细节特征,降低分类精度。因此,选择合适的窗口大小是获取纹理特征的第一步。此研究采用累计差(Δf)[26]衡量地物区分度以确定窗口大小,累计差越大,表明地物在当前窗口下的区分度越高,其计算公式如下。

$ \Delta f=\sum\limits_{i=1}^k\left(\left|u_i-u_{i+1}\right|+\left|u_i-u_{i+2}\right|+\cdots \cdots+\left|u_i-u_{i+k-1}\right|\right) $ (3)

其中:Δf代表某一纹理特征变量的累计差,此研究共有8个纹理特征,因此f=1,2,……,8;k为地物类别总数;ui表示第i类地物在某特征变量上的均值。

1.3.5 分类方法

RF算法[27]是一种基于集成学习的监督分类算法,其核心思想是通过构建大量相互独立的决策树来提高分类的准确性和稳定性,具有良好防止过拟合能力。相比其他分类器,RF在处理高维遥感影像数据时表现出更好的性能,对噪声和缺失数据具有较强的鲁棒性,适用于多类别和多特征的遥感分类[28]

在GEE云计算平台中,使用RF分类算法时需要设置关键参数,此研究设置决策树的数量为100个,每个决策节点使用的变量数为特征总数的平方根。

1.3.6 精度评价

在遥感图像分类中,混淆矩阵是评估分类模型性能的常用工具,用于表示实际类别与模型分类结果的对比情况。此研究通过计算分类结果的混淆矩阵对6种特征组合方案进行精度评价,评价指标包括总体精度(overall accuracy,OA)、Kappa系数、用户精度(user’s accuracy,UA)和生产者精度(producer’s accuracy,PA)。

2 结果与分析 2.1 最佳时像选取

根据目视解译的样本,使用GEE云计算平台,对Sentinel-2影像不同月份下设施农业与其他地物的JM距离进行计算,确定提取的最佳时相。如图 4所示,2023年Sentinel-2影像塑料大棚与其他地物的JM距离均大于日光温室与其他地物的JM距离,且二者在全年变化趋势相似,夏季JM距离小,冬季JM距离大,2月20日均达到最大。这表明设施农业在2月的光谱差异性最大,更容易与其他地物区分。因此,选取2月20日的Sentinel影像进行设施农业提取。

图 4 不同日期下设施农业与其他地物JM距离 Fig.4 JM distance between facility agriculture and other land cover types on different dates
2.2 纹理特征提取

GEE云计算平台提供的GLCM算法中可定义计算窗口大小。研究选取3×3、7×7、11×11、15×15、19×19、23×23、27×27、31×31、35×35、39×39、43×43、47×47、51×51、55×55共14种尺寸的滑动窗口,在最佳提取时相的Sentinel-2灰度图像上计算不同窗口大小下各地物(日光温室、塑料大棚及其他地物)的纹理特征累计差。如图 5a所示,累计差随着窗口的增大,先增加后减小,在27×27窗口下累计差达最大,此时设施农业与其他地物的纹理特征区分度最高,选择27×27窗口为最佳提取窗口。图 5b展示了最佳提取窗口下各纹理特征的累计差,其中方差特征的累计差最高,熵、相异性、对比度、均值依次降低,同质性、角二阶矩、相关性的累计差最低且与前5个纹理变量相差过大,累计差均小于0.5。因此选择方差、熵、相异性、对比度、均值作为纹理特征参与模型训练。

图 5 不同窗口下累计差与最佳窗口下各纹理变量的累计差 Fig.5 Cumulative difference under different windows and cumulative difference of texture variables under the optimal window
2.3 特征对分类的贡献分析

为了筛选出对分类精度贡献较大的特征,避免不重要的噪声特征干扰,使用基于基尼不纯度的特征重要性评估,实验共获取特征变量41个。由图 6可以直观看出,地形特征中的Elevation重要性最高,这反映出设施农业的分布可能与地形起伏密切相关,日光温室和塑料大棚多修建于平坦的地理条件下,与潍坊的实际情况相符合。后面依次是均值、方差、相异性、熵,表明纹理特征对此次分类重要性很高,这对于捕捉设施农业的空间结构具有重要作用。此外,雷达波段VV、VH和光谱波段B9、B12也具有较高的重要性。光谱特征尤其是与近红外和可见光相关的波段常用于植被监测,在提取与设施农业相关的植被信息时起到了关键作用。特征重要性排序依次为:纹理特征、光谱特征、雷达特征、指数特征、地形特征。

图 6 特征重要性排序 Fig.6 Ranking of feature importance

特征冗余不仅会增加计算复杂度,还会出现过拟合的风险,导致分类精度降低,因此需要对特征进行筛选。根据重要性顺序依次增加特征训练RF模型,计算每个模型分类结果的OA。由图 6可以看到,添加NDVI后,整体分类精度趋于平稳且无显著提升,因此保留包括NDVI在内的前26个特征构成最优特征集。

2.4 精度评价

使用固定种子的RF算法对6种特征组合方案进行分类,结果如表 4所示。方案1仅包括光谱和指数特征,分类精度在各方案中最低。尽管光谱信息和植被指数是常用的遥感特征,但对于复杂的设施农业,并不足以完全反映其特征差异。在方案1基础上分别加入地形特征、雷达特征、纹理特征后,分类精度均有提高。其中,雷达特征对分类精度的提升最少,塑料大棚的UA提高2.28%,而日光温室仅提高0.54%,说明雷达特征对日光温室提取精度的贡献有限。在方案1中增加纹理特征后,OA提升至88.78%,且日光温室和塑料大棚的分类精度均有大幅提升。对比方案2和方案3,纹理特征对分类精度的提高最显著,表明纹理特征能够捕捉影像中局部空间关系和细节,对于区分形态复杂的设施农业尤其有效。方案5融合所有特征,OA达89.38%,经过优选特征后,方案6的OA相较方案1提高了6.33%,Kappa系数达0.86,有效减少特征冗余,进一步提高了模型的鲁棒性和分类精度,在所有方案中取得最好的分类效果。根据OA和Kappa系数,不同特征对设施农业提取的有利程度排序为:纹理特征、地形特征、雷达特征、光谱特征。

表 4 不同方案下设施农业分类精度 Table 4 Classification accuracy of facility agriculture under different schemes

基于GEE云计算平台和随机森林算法,提取出潍坊2023年设施农业的分布区域。图 7展示了日光温室和塑料大棚集中分布区域、交错分布区域、复杂背景区域等4个典型区域的提取情况。对于单一类型且大面积分布的设施农业,所有方案的分类结果差异较小。然而,在交错分布和复杂背景区域,6种方案表现出较大差异。方案1—3均可识别设施农业的基本轮廓,但在边缘处出现明显的分类错误和噪点,导致边界不清晰、误分类现象较多。方案4纹理特征的加入显著提高了分类精度,特别是在细节处,混合像元更多的被分为其他地物,使道路、农田的边界更加清晰,但会使设施农业统计面积减少。方案5综合了所有特征,包括光谱特征、指数特征、地形特征、雷达特征和纹理特征。虽然该方案理论上应达到最优效果,但实际分类结果并未明显优于方案4。这可能是特征过多导致信息冗余,引入了额外的噪声。而特征优选后的方案6在不同区域下均能够较好地捕捉设施农业的完整性和边界特征。

图 7 不同方案设施农业提取细节 Fig.7 Details of facility agriculture extraction under different schemes

图 8展示了特征优选方案的设施农业提取结果。可以看出,潍坊的设施农业主要集中在寿光和青州,总面积占全市设施农业面积的66%(表 5),但日光温室和塑料大棚的空间分布存在明显差异。日光温室主要集中分布在寿光、青州、临朐等区域,其中寿光面积达40.36万亩,占全市日光温室总面积的51.45%,是日光温室设施农业发展的核心区域。其次为青州,面积为17.09万亩,占21.79%。与日光温室相比,塑料大棚的分布更分散。青州和昌乐的塑料大棚面积较大,分别为16.89万亩和8.79万亩,合计占全市塑料大棚总面积的57.52%。

图 8 潍坊设施农业分布 Fig.8 Distribution of facility agriculture in Weifang
表 5 潍坊各县(市、区)日光温室与塑料大棚面积统计 Table 5 Statistics of areas of solar greenhouses and polyhouses in different regions of Weifang 单位: 万亩

① 1亩≈0.066 7 hm2

与地形图叠加发现,设施农业主要建在地势平坦的平原地区,极少建立在山地和丘陵地区。从地形地貌的角度来看,寿光南部和青州东北部地势相对平坦,主要为冲积平原,土地开阔平整,减少了建设温室大棚基础设施的成本,有利于大规模设施农业的布局和管理[29]。在人文因素方面,寿光作为“中国蔬菜之乡”,拥有丰富的设施农业经验和完善的产业链条。青州北部和昌乐北部由于与寿光接壤,很大程度上受其技术和市场的辐射和影响,形成了设施农业集聚区。

3 讨论

借助GEE云计算平台,基于Sentinel-1/2和DEM数据,利用RF算法,设计6种特征组合方案,实现对潍坊设施农业信息的提取。与单一数据源研究[10]相比,此研究充分利用了多源遥感数据的融合优势。朱德海等[30]、汤紫霞等[31]仅基于光学卫星影像结合纹理特征对大棚进行提取,而此研究在此基础上加入雷达数据,使平均分类精度显著提高。目前关于设施农业分类提取的研究较少,且均采用面向对象的分类方法。例如王乌云等[32]利用面向对象多尺度分割方法对内蒙古河套灌区大棚信息进行提取。但面向对象的分类高度依赖于影像的分割质量,对空间分辨率、研究区范围较为敏感。识别精度受设施类型、分布情况和面积占比不同的影响[33]。此研究采用RF算法结合特征优选,在减少计算复杂度的同时,提高泛化能力,保证高分类精度。这些改进为设施农业的遥感提取提供了高效、可靠的技术方案,并为设施农业灾害风险管理提供决策支撑。

日光温室与塑料大棚的分类精度易受“同物异谱”和“异物同谱”现象干扰。两者通常采用聚乙烯薄膜作为覆盖材料,在Sentinel-2影像的可见光-近红外波段反射率差异较小,尤其在薄膜老化或污损后可分性进一步降低。光谱特征的局限性促使研究引入其他特征以增强分类能力。加入纹理特征后,日光温室和塑料大棚的PA和UA与基础方案1相比分别提升7.32%和7.02%、5.29%和5.81%,与塑料大棚相比,日光温室提取效果受纹理特征影响更大,主要考虑2方面原因:(1)日光温室的建筑结构较为复杂,包含厚实的背墙和两侧墙体、透明材料的屋顶斜面、多层的保温棉被等[34-35],这些具有不同光照反射和吸收的地物都会在遥感影像中形成明显的纹理特征。而塑料大棚结构相对简单,表面有较为均匀的塑料薄膜覆盖[35],纹理变化较少。因此,纹理特征对日光温室的捕捉能力更强,能够更清晰地区分日光温室与其他地物,使得分类精度提高。(2)在建造日光温室时,通常在温室之间留出室外作业通道和灌排水渠道[36],在遥感影像上呈现出较复杂的背景,纹理特征更加明显。而塑料大棚通常成片布局,表面有相对统一的光滑程度,受周围背景的干扰较小,因此纹理特征对塑料大棚的识别贡献较小。

此外,混合像元效应也是影响分类精度的重要因素。当地物边界与像元网格未对齐时,其边缘像元将包含设施农业与背景地物(如裸土、道路)的混合光谱信号,导致模型无法有效分离地物特征(图 7)。这一现象可能导致尺寸较小的单体大棚不能被准确提取或漏提。未来研究可以考虑融合亚米级卫星数据提高空间分辨率,或构建多尺度特征学习模型以抑制混合光谱干扰。

尽管特征优选方法在设施农业类型的提取中取得了较高的精度,但研究中仍有不足的地方。首先,此研究主要集中在单一时相影像的提取,未充分考虑多时相数据对提取精度的影响,进一步的研究可以结合设施农业内部种植作物的种类,加入多时相数据,更好地捕捉季节性变化和设施农业使用状态。其次,随着人工智能的不断发展,深度学习技术在许多领域表现出优异的性能,未来研究可以探索利用深度学习算法,实现大面积、更加精细的设施农业信息提取。

4 小结

(1) 根据样本计算不同设施农业类型与其他地物的JM距离,得出日光温室和塑料大棚的最佳提取时相均为2月。

(2) 使用累计差法从14种窗口大小中确定提取设施农业的最佳纹理特征窗口是27×27,最佳纹理特征组合为均值、熵、方差、相异性和对比度。

(3) 不同的特征组合方案对提取结果影响不同。分类特征对设施农业的重要性排序依次为:纹理特征、地形特征、雷达特征。3个特征的加入使得分类精度分别提升4.81%、1.66%、0.94%。

(4) 6个方案中特征优选方案提取不同设施农业类型信息效果最佳,OA为91.03%,Kappa系数为0.86。其中,塑料大棚的PA和UA分别为92.21%和91.84%;日光温室的PA和UA分别为88.54%和89.47%。这表明该方法能够有效获取不同设施农业类型的空间分布和面积信息。

参考文献
[1]
杨婧暄. 我国农业大棚现状及未来发展趋势[J]. 种子科技, 2023, 41(14): 142-144.
[2]
刁秀广. 强冰雹和强降水超级单体风暴双偏振特征差异性[J]. 海洋气象学报, 2024, 44(3): 23-36. DOI:10.19513/j.cnki.hyqxxb.20220807001
[3]
侯淑梅, 唐巧玲, 史茜, 等. 2020年5月山东强对流天气特点及成因[J]. 海洋气象学报, 2023, 43(4): 47-61. DOI:10.19513/j.cnki.issn2096-3599.2023.04.006
[4]
谭方颖, 王建林, 张蕾, 等. 山东省设施农业风灾风险评估研究[J]. 中国生态农业学报(中英文), 2024, 32(1): 174-182.
[5]
魏瑞江, 王鑫. 国内设施种植气象灾害研究进展[J]. 海洋气象学报, 2021, 41(4): 73-81. DOI:10.19513/j.cnki.issn2096-3599.2021.04.007
[6]
李莉, 刘志红, 韩晨琛, 等. 基于卫星遥感的临沂市冬小麦种植时空变化特征分析[J]. 海洋气象学报, 2020, 40(3): 126-135. DOI:10.19513/j.cnki.issn2096-3599.2020.03.014
[7]
段金馈, 李峰, 秦泉, 等. 高分六号红边波段对夏玉米种植区识别的影响[J]. 海洋气象学报, 2023, 43(3): 104-112. DOI:10.19513/j.cnki.issn2096-3599.2023.03.010
[8]
KOC-SAN D. Evaluation of different classification techniques for the detection of glass and plastic greenhouses from WorldView-2 satellite imagery[J]. J Appl Remote Sens, 2013, 7(1): 073553. DOI:10.1117/1.JRS.7.073553
[9]
付利钊, 杨青岗, 陈永立, 等. 基于SFNet-F地物识别技术的农业大棚信息提取[J]. 测绘通报, 2024(7): 65-70.
[10]
冯权泷, 牛博文, 朱德海, 等. 2019年全国农业塑料大棚遥感分类数据集[J]. 中国科学数据(中英文网络版), 2021, 6(4): 153-170.
[11]
吴锦玉, 刘晓龙, 柏延臣, 等. 基于GF-2数据结合多纹理特征的塑料大棚识别[J]. 农业工程学报, 2019, 35(12): 173-183. DOI:10.11975/j.issn.1002-6819.2019.12.021
[12]
HASITUYA, CHEN Z X, WANG L M, et al. Monitoring plastic-mulched farmland by Landsat-8 OLI imagery using spectral and textural features[J]. Remote Sens, 2016, 8(4): 353. DOI:10.3390/rs8040353
[13]
刘天宇, 赵展, 史同广. 一种基于Sentinel-2的塑料大棚提取方法[J]. 农业工程, 2021, 11(10): 91-98.
[14]
TANG G, WANG X Y, ZHAO H W, et al. Attention in attention for hyperspectral with high spatial resolution (H) image classification[J]. IEEE Trans Geosci Remote Sens, 2023, 62: 5501113.
[15]
乔树亭, 叶回春, 黄文江, 等. 基于Sentinel-1/2影像的水稻种植面积提取方法研究: 以三江平原为例[J]. 遥感技术与应用, 2023, 38(1): 78-89.
[16]
HAFNER S, NASCETTI A, AZIZPOUR H, et al. Sentinel-1 and Sentinel-2 data fusion for urban change detection using a dual stream U-Net[J]. IEEE Geosci Remote Sens Lett, 2022, 19: 4019805.
[17]
王小娜, 田金炎, 李小娟, 等. Google Earth Engine云平台对遥感发展的改变[J]. 遥感学报, 2022, 26(2): 299-309.
[18]
GANJIRAD M, BAGHERI H. Google Earth Engine-based mapping of land use and land cover for weather forecast models using Landsat 8 imagery[J]. Ecol Inform, 2024, 80: 102498. DOI:10.1016/j.ecoinf.2024.102498
[19]
KAZEMI GARAJEH M, HAJI F, TOHIDFAR M, et al. Spatiotemporal monitoring of climate change impacts on water resources using an integrated approach of remote sensing and Google Earth Engine[J]. Sci Rep, 2024, 14(1): 5469. DOI:10.1038/s41598-024-56160-9
[20]
韩东枫, 李峰, 秦泉, 等. 基于GEE和Sentinel-1/2数据的夏玉米种植面积精细化识别方法[J]. 海洋气象学报, 2024, 44(3): 122-132. DOI:10.19513/j.cnki.hyqxxb.20240128001
[21]
LI C M, DAI Z X, YANG L N, et al. Spatiotemporal characteristics of air quality across Weifang from 2014-2018[J]. Int J Environ Res Public Health, 2019, 16(17): 3122. DOI:10.3390/ijerph16173122
[22]
孙政, 周清波, 杨鹏, 等. 基于星载极化SAR数据的农作物分类识别进展评述[J]. 中国农业资源与区划, 2019, 40(11): 63-71.
[23]
MA Y Y, WANG Z M, ZHANG B J, et al. The spatiotemporal surface velocity variations and analysis of the Amery Ice Shelf from 2000 to 2022, East Antarctica[J]. Remote Sens, 2024, 16(17): 3255. DOI:10.3390/rs16173255
[24]
HARALICK R M, SHANMUGAM K, DINSTEIN I. Textural features for image classification[J]. IEEE Trans Syst Man Cybern, 1973, SMC-3(6): 610-621. DOI:10.1109/TSMC.1973.4309314
[25]
BRUZZONE L, ROLI F, SERPICO S B. An extension of the Jeffreys-Matusita distance to multiclass cases for feature selection[J]. IEEE Trans Geosci Remote Sens, 1995, 33(6): 1318-1321. DOI:10.1109/36.477187
[26]
姚新华, 金佳, 徐飞飞, 等. 太湖流域果树提取的光谱和纹理特征选择研究[J]. 中国生态农业学报(中英文), 2019, 27(10): 1596-1606.
[27]
ZHAO Y F, ZHU W W, WEI P P, et al. Classification of Zambian grasslands using random forest feature importance selection during the optimal phenological period[J]. Ecol Indic, 2022, 135: 108529.
[28]
侯蒙京, 殷建鹏, 葛静, 等. 基于随机森林的高寒湿地地区土地覆盖遥感分类方法[J]. 农业机械学报, 2020, 51(7): 220-227.
[29]
GUO B, ZHOU B, ZHANG Z M, et al. A critical review of the status of current greenhouse technology in China and development prospects[J]. Appl Sci, 2024, 14(13): 5952.
[30]
朱德海, 刘逸铭, 冯权泷, 等. 基于GEE的山东省近30年农业大棚时空动态变化研究[J]. 农业机械学报, 2020, 51(1): 168-175.
[31]
汤紫霞, 李蒙蒙, 汪小钦, 等. 基于GF-2遥感影像的葡萄大棚信息提取[J]. 中国农业科技导报, 2020, 22(11): 95-105.
[32]
王乌云, 李斐, 哈斯图亚, 等. 面向对象多层次多尺度分割的农用大棚类型信息提取[J]. 中国农业大学学报, 2024, 29(8): 223-236.
[33]
丁蕾. 基于高分辨率遥感影像的设施农用地识别技术研究[D]. 连云港: 江苏海洋大学, 2022.
[34]
兰立波, 王志冉, 张栋, 等. 新型柔性墙体日光温室冬季温度场分布规律研究[J]. 中国农业文摘·农业工程, 2023, 35(6): 36-41.
[35]
周长吉, 童根树, 闫俊月, 等. 农业温室结构设计标准: GB/T 51424—2022[S]. 北京: 中国计划出版社, 2022.
[36]
韩太利, 魏家鹏. 寿光新型日光温室的结构特点与推广应用[J]. 中国蔬菜, 2010(13): 7-9.