海洋气象学报  2024, Vol. 44 Issue (3): 152-161  DOI: 10.19513/j.cnki.hyqxxb.20230720001
0

引用本文  

王语浠, 曹青, SHAO Quanxi. 耦合人工神经网络模型在径流预测中的应用综述[J]. 海洋气象学报, 2024, 44(3): 152-161. DOI: 10.19513/j.cnki.hyqxxb.20230720001.
WANG Yuxi, CAO Qing, SHAO Quanxi. Review of coupled artificial neural network models applied in runoff prediction[J]. Journal of Marine Meteorology, 2024, 44(3): 152-161. DOI: 10.19513/j.cnki.hyqxxb.20230720001. (in Chinese)

基金项目

国家自然科学基金青年科学基金项目(42201025);高端外国专家引进计划项目(G2023014051L);宁夏回族自治区重点研发计划项目(2023BEG02054);水利部水文气象灾害机理与预警重点实验室开放基金项目(HYMED202210,HYMED202301)

作者简介

王语浠,女,本科生,主要从事水文气象研究工作,202283300450@nuist.edu.cn.

通信作者

曹青,女,博士,副教授,主要从事水文气象研究工作,qingcao@nuist.edu.cn.

文章历史

收稿日期:2023-07-20
修订日期:2024-02-02
耦合人工神经网络模型在径流预测中的应用综述
王语浠1,2,3 , 曹青2,3 , SHAO Quanxi4     
1. 南京信息工程大学龙山书院,江苏 南京 210044;
2. 南京信息工程大学水文与水资源工程学院,江苏 南京 210044;
3. 南京信息工程大学水利部水文气象灾害机理与预警重点实验室,江苏 南京 210044;
4. 联邦科学与工业研究组织,澳大利亚 珀斯 WA 6151
摘要:人工神经网络(artificial neural network,ANN)模型耦合其他模型或优化算法在径流预测中的应用逐渐增多。从人工神经网络模型与物理模型的耦合、多人工神经网络模型的耦合、分解技术与机器学习方法的耦合、人工神经网络模型与智能优化算法的耦合4个方面进行系统梳理和总结,阐述提高预测精度的原因及各方法的优势。同时,提出当前研究中存在的问题并进行展望,可为径流预测和水资源管理提供支持。
关键词径流预测    反向传播(BP)神经网络模型    循环神经网络(RNN)模型    长短期记忆(LSTM)神经网络模型    门控循环单元(GRU)神经网络模型    卷积神经网络(CNN)模型    
Review of coupled artificial neural network models applied in runoff prediction
WANG Yuxi1,2,3 , CAO Qing2,3 , SHAO Quanxi4     
1. Longshan College, Nanjing University of Information Science & Technology, Nanjing 210044, China;
2. School of Hydrology and Water Resources, Nanjing University of Information Science & Technology, Nanjing 210044, China;
3. Key Laboratory of Hydrometeorological Disaster Mechanism and Warning of Ministry of Water Resources, Nanjing University of Information Science & Technology, Nanjing 210044, China;
4. Commonwealth Scientific and Industrial Research Organization (CSIRO), Perth WA 6151, Australia
Abstract: The application of artificial neural network (ANN) coupled with other models or optimization algorithms in runoff prediction is gradually increasing. The systematic review and summary are given from 4 aspects: the coupling of ANN models with physical models, the combination of multiple ANN models, the integration of decomposition techniques with machine learning methods and the incorporation of ANN models with intelligent optimization algorithms. The reasons for the improvement in the prediction accuracy and the advantages of each method are analyzed. Furthermore, the present research challenges and future prospects are discussed, which can provide support for runoff prediction and water resources management.
Key words: runoff prediction    back propagation (BP) neural network model    recurrent neural network (RNN) model    long-short term memory (LSTM) neural network model    gated recurrent unit (GRU) neural network model    convolutional neural network (CNN) model    
引言

径流变化对水文水资源系统和社会经济发展至关重要,相关人员一般根据径流变化的特征规律指导资源环境管理和流域水量调度,并且径流变化也能对相关水利工程有一定参考作用。全球变化和城镇化导致暴雨洪涝灾害频发。入夏后的暴雨洪水易造成严重的人员和经济损失[1]。通过越来越精确的径流预测,可以提前预警洪涝等水文气象灾害,提前安排防灾减灾工作,尽力减少各种损失。因此,进一步延长径流预见期,提高径流预测精度,是可持续发展的重要支撑和必然要求,具有理论和实际的双重意义。

传统径流预测方法通常基于过程的物理模型和数据的统计模型,通过考虑流域的地形、土地利用、降水量、蒸散发量等因素预测未来径流量。Vogel等[2]用流量持续时间曲线作为统计工具分析并预测径流。张洪刚等[3]采用统计模型中的Mann-Kendall法和线性回归分析对汉江上游的径流变化进行预测。然而,传统方法很难考虑到所有复杂因素和交互作用,因此预测精度和实时性受限。相比之下,机器学习模型可以通过学习数据的模式和规律进行预测。数据的模式是指数据中可识别的重复性结构、规律或特征。这些模式包含趋势模式、季节性模式、循环模式和随机模式,通常与非系统性的外部因素相关[4]。相比传统的物理模型,机器学习模型可以更准确地捕捉和模拟非线性、非平稳的水文过程。这些模型还能快速处理和预测大量数据并从中提取更多有用的特征和信息,提高模型的实时性和应用效率,增加预测准确性[5]。因此,机器学习模型不仅能适应不同类型的流域和水文条件,还能在预测新数据时显示出卓越的性能,在径流预测方面非常优秀。

在水文领域,多种人工神经网络(artificial neural network,ANN)模型已被应用到不同时空尺度的径流预测中,包括反向传播(back propagation,BP)神经网络模型、径向基函数(radial basis function,RBF)神经网络和广义回归神经网络(generalized regression neural network,GRNN)模型、循环神经网络(recurrent neural network,RNN)模型、Elman神经网络模型、长短期记忆(long-short term memory,LSTM)神经网络模型、卷积神经网络(convolutional neural network,CNN)模型、门控循环单元(gated recurrent unit,GRU)神经网络模型等。

传统方法通常只考虑某一种模型,难以适应复杂多变的水文条件,而机器学习耦合预测模型可以通过将多种预测方法有机结合,提高模型的泛化能力,适应更多流域和水文条件。机器学习耦合预测模型能利用多种预测方法的优势,将预测结果进行整合和优化,从而提高预测的实时性,满足应急响应和水资源管理的需要。目前常见的机器学习耦合预测模型主要包括人工神经网络模型与物理模型的耦合、多人工神经网络模型的耦合、分解技术与机器学习方法的耦合、人工神经网络模型与智能优化算法的耦合。以往研究大多集中在物理模型与机器学习模型的耦合分析和应用上,但对多模型集成方法等方面缺乏凝练。基于此,本研究总结了多模型集成方法以及分解技术等方法在径流预测中的应用。

1 耦合人工神经网络模型在径流预测中的应用

人工神经网络模型在径流预测中的主要发展方向涵盖了物理模型与机器学习模型的耦合、多机器学习模型集成、分解技术与机器学习方法的耦合以及智能优化算法与预测模型的耦合。将物理模型与机器学习模型结合,充分利用两者的优势,提高预测精度。多机器学习模型集成通过整合多种模型的预测结果,增强模型的稳健性和泛化能力。将分解技术与机器学习方法耦合,可以有效处理复杂的径流预测问题,提高模型的拟合能力和效率。人工神经网络模型与智能优化算法的耦合,可以自动调整模型参数,进一步优化预测性能,提高径流预测的准确性和可靠性。这些发展共同推动着人工神经网络在径流预测领域的持续进步与应用。

1.1 人工神经网络模型与物理模型的耦合

在径流预测领域,将物理模型中所蕴含的先验知识与机器学习的学习能力相融合,约束网络的收敛方向,形成一种灵活的数据融合范式,可提高泛化能力并有效降低由不确定性引发的模拟误差。在径流预测方面,物理模型与BP网络及LSTM神经网络的结合被广泛采用。

由于BP网络在缺少实测前期流量的情况下不能连续模拟,并且其阶数及隐含层神经元数目难以确定,阚光远等[6]构建了BP汇流模型,并与K最近邻(K-nearest neighbor,KNN)误差修正模型组成BK(BP-KNN)汇流模型。BK模型又与新安江产流模型耦合,融合了概念性与黑箱模型的优势,使模拟效果更为优异。针对城市降雨径流和内涝预测问题,刘媛媛等[7]将BP网络与水文水动力学模型相耦合,研究表明该模型的误差较小且计算速度快,有效解决了此类时效性问题。李鑫等[8]采用非等权重的参数率定法对新安江模型进行参数率定并将其与BP网络的计算结果进行耦合,从而提高了预测精度。

LSTM模型与物理模型结合能充分融合LSTM模型的时间序列建模特性与物理模型的系统动态性,从而提升径流预测的精度和可靠性。Singh等[9]介绍了物理融合长短期记忆网络(physics-infused long short-term memory network,PI-LSTM),该模型有助于对稀缺数据集进行泛化,证明了物理融合神经网络的有效性。由于城市河道径流预测与水质分析难以有效完成,李易凡[10]采用物理机制驱动的水文模型SOBEK、自适应模糊神经网络以及LSTM神经网络进行建模,研究表明LSTM模型在稳定性及预测洪峰方面优于其他模型,结合3种模型的优势可以在一定程度上提高城市流域的降水径流预测能力。陈剑飞等[11]将CSSPv2(conjunctive surface-subsurface process model version 2)陆面水文模型与LSTM模型相耦合,先用CSSPv2模型来计算区间径流量,再用LSTM模型来预测入库径流量,从而显著提高了预测精度与适用性。徐嘉远等[12]构建了基于时变增益水文模型(time variant gain model,TVGM)和LSTM神经网络的TVGM-LSTM耦合模型,并应用于2011—2018年白河流域径流模拟,结果表明该模型能较好地模拟洪峰且有效规避过拟合问题,研究时限内模型稳定性较强。

神经网络耦合物理模型在不同地理环境下应用的案例见表 1。BP模型与物理水文模型的耦合方法在不同流域中展现了广泛的适用性,提高了流域径流预测的准确性和可靠性。不同流域的气候特征和地理条件(季风气候、地形等),在耦合方法的选择上产生了差异。这种方法能够更好地适应流域特点,提高预测精度,并为不同气候条件下的水文过程提供深入理解。新安江模型对于湿润条件较好的地区有很好的模拟效果,大多与BP网络相耦合,适用于不同的季风区域及不同的地形,流域内的年降水会随地形或季节变化,且该耦合模型可以及时预测降雨径流从而有效避免洪涝灾害,减少损失,有较高的普适性。针对城市下垫面硬化及较为复杂的情况,一般将BP网络与水文水动力模型相耦合,更加精确地预测城市降雨径流,更好地解决内涝问题。综上所述,BP神经网络模型与物理水文模型的耦合方法为流域水文预测提供了一种灵活且有效的模拟工具。

表 1 神经网络与物理模型的耦合在不同地理环境下的应用 Table 1 Coupling of ANN with physical models in different geographical environment

不同流域中,将LSTM神经网络与物理水文模型耦合,以提升水文预测的准确性和适用性。该方法主要适用于以山地为主、降水较丰富、湿润条件较好及属于季风气候的区域,将LSTM神经网络对序列数据的建模能力与各种物理水文模型对流域水文过程的物理描述相结合,更好地模拟复杂地形和气候条件下的水文响应。例如:LSTM神经网络分别与SOBEK、CSSPv2和TVGM耦合应用于茅洲河流域、红水河中游河段和白河流域,能更好地考虑季节性水文变化和时变影响,提高对流域水文过程的理解和预测能力。综上所述,不同流域中LSTM神经网络与物理水文模型的耦合方法,充分结合了数据驱动和物理机制,以适应各流域的地理特征和气候条件。此方法为水文预测提供了一种灵活且高效的模拟工具,提高了径流预测准确性。

1.2 多人工神经网络模型的耦合

在径流预测领域,多人工神经网络模型的耦合相较于单一模型展现出显著优势。通过将多个ANN模型耦合,能充分融合各自优点,有效处理径流预测中的复杂影响因素和相互作用,增强模型对不同流域和不同时段的适应性,同时有效避免单一模型的过拟合问题,从而提高预测的准确性和稳健性。机器学习模型多与BP网络、LSTM神经网络、CNN和GRU神经网络等相耦合进行径流预测,以提高预测性能与泛化能力。

近年来,多位研究者将支持向量机(support vector machine,SVM)与BP网络相耦合进行径流预测。SVM能够有效处理高维、非线性的数据,而BP网络的非线性映射能力较强,因此两者耦合可以更好地捕捉径流预测中的数据特征。以往的研究引入不同SVM模型,如改进支持向量机(郭俊等[13])、最小二乘支持向量机(陶凤玲等[14])、回归支持向量机(魏胜[15])耦合BP网络,提高预测结果的泛化能力和鲁棒性,减少过拟合现象,增强模型对异常数据的处理能力,为径流预测问题提供了有效的解决方案,有望在实际应用中提高预测精度和效率。同时也发展了各种衍生模型与BP网络相结合,使预测精度更为准确。武夏宁等[16]建立了非线性混合回归模型, 把年径流作为自回归因子,降水和气温作为多元回归因子,并利用BP网络进行模型求解,结果大大提高了预测精度。王治林[17]利用机器学习领域广泛使用的集成学习方法将BP网络、新安江模型和支持向量回归(support vector regression,SVR)耦合,综合了三者的优点从而提升了模型预测的精度和稳定性。

在径流预测中,将LSTM神经网络与其他机器学习模型相耦合呈现出明显的优势。耦合机器学习模型,能够充分利用这些模型的特点和优势,从而显著提升径流预测的整体精度。Xiang等[18]将LSTM神经网络和序列到序列(sequence to sequence, seq2seq)模型相耦合来估计小时降雨径流,该模型适用于不同地形下的不同流域,适用性大大增加。唐鑫[19]提出一种基于堆叠(Stacking)思路,以LSTM、先知(Prophet)算法、岭回归模型为基类学习器,再以岭回归模型为二层学习器的集成学习方法对西部某流域进行径流预测,有效提高了预测精度。胡鹤轩等[20]引入图神经网络并建立了基于LSTM神经网络的双阶注意力机制(Graph Attention neTwork and Dual-stage Attention mechanism-based Long Short-Term Memory network,GAT-DALSTM)模型,提高了信息的捕捉能力,从而提高了预测准确性。田烨等[21]和Yao等[22]均构建了CNN-LSTM模型,研究表明CNN-LSTM模型在月径流预测及对峰值和谷值的拟合方面更加精确。

为了同时保留历史信息和未来信息,双向门控循环单元神经网络(Bi-GRU)被提出。该模型能够有效将这两种信息融合,从而更加准确地进行时间预测。Bi等[23]提出了一种深度神经网络模型——CAGANet,由卷积层、注意力机制、GRU神经网络和自回归模型组成。该模型在不使用数据增强方法的情况下,在数据集预测方面展现出更高的预测精度,因此对日径流预测的准确性有积极影响。He等[24]提出了一种基于Bi-GRU-BP神经网络的短期径流预测优化方法,并应用于安徽阳楼水文站。研究表明,采用双向传播有利于提高模型的学习能力,从而使其具有更高的精度、更好的稳定性以及更强的泛化能力。

1.3 分解技术与机器学习方法的耦合

将分解技术与ANN相结合在径流预测中显示出明显优势。分解技术如小波变换、经验模态分解(empirical mode decomposition,EMD)法、变分模态分解(variational mode decomposition,VMD)法、周期趋势分解法等能够降维并提取数据的特征信息,使神经网络更集中地学习和表示径流数据中的重要信息,从而提高模型的效率和预测性能。此外,分解技术将数据分解成不同的时频域成分和不同尺度或频率成分,可以更好地捕捉时间序列中的动态变化规律及多尺度学习,结合人工神经网络模型将这些时间序列作为输入,并将不同尺度的特征信息相融合,使模型更准确地建模时间序列的演变规律,提高预测的准确性、稳定性、全局性和综合性。同时,分解技术的引入使ANN更鲁棒地适应不同径流数据特点和复杂环境变化,提高模型的泛化能力,使预测结果在不同时段和地区都能表现出较好的适应性。

小波变换作为一种信号处理技术,将其应用于数据预处理阶段,可以使神经网络更加集中地学习和表示径流数据中的重要特征,从而减少不必要的冗余信息,提高模型的效率和预测性能。结合ANN,可以将小波变换分解后的时间序列作为网络的输入,使模型更准确地理解和建模时间序列的演变规律,从而提高预测的精度和稳定性;此外,还能将不同尺度的特征信息融合起来,使模型在学习过程中能够同时考虑到不同尺度的影响,从而增强模型的全局性和综合性。凌旋等[25]采用马勒特(Mallat)算法对年径流序列进行小波分解,将分解所得的不同尺度下的低频成分和高频成分分别进行Mallat算法重构,重构后用BP网络预测,结果表明预测效果较好。杜拉等[26]将小波分析、贝叶斯概率及BP网络相结合构成混合模型,此模型以分布函数的形式量化了水文预测的不确定性,可针对径流时间序列的非线性和随机性更好地解决径流预测精确度的相关问题。莫崇勋等[27]引入经验小波变换(empirical wavelet transform,EWT)分解和粒子群优化(particle swarm optimization,PSO)算法,建立一种基于Elman神经网络的月径流预测模型(EWT-PSO-Elman),PSO优化Elman网络的权重和阈值,EWT有效地将非平稳性和非线性特征相融合,提高Elman网络预测的准确度,因此该模型显然可大力应用于径流预测。综上所述,小波变换与人工神经网络模型的结合在径流预测中能够充分发挥各自优势,特征提取和学习能力均得到增强,时间序列建模和多尺度学习的能力显著提高,为径流预测的准确性和可靠性带来了新的可能性和潜力。

EMD作为一种数据分解方法,能够将径流数据分解成一系列本征模态函数(intrinsic mode function,IMF),每个IMF表示不同频率成分的振荡特征。EMD将数据分解成不同的IMF成分,并结合ANN,可以将这些不同尺度的特征信息融合起来,使得模型能够更全面地考虑不同尺度影响因素的作用,增强模型的综合性。席东洁等[28]借助EMD处理非线性复杂信号,再结合Elman网络进行预测,结果表明这种方法适用于长期径流预测且精度高。王栋等[29]引入完备的集合经验模态分解(complete ensemble empirical mode decomposition,CEEMD)方法,构建CEEMD-BP模型,研究表明此模型可以更好保存月径流原来的数据信息,使预测精度更高。Zhang等[30]将集合经验模态分解(ensemble empirical mode decomposition,EEMD)与Elman神经网络结合,建立EEMD-Elman模型,EEMD可以很好地解决EMD中的模态混叠现象,且此模型分解-预测-重构的特点提高了精度。胡斯曼[31]针对径流序列非平稳、非线性难预测的问题,结合基于自适应噪声的完备经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)重构精度高、能够有效克服模态混叠的特点,构建CEEMDAN-LSTM预测模型,对年径流与月径流进行预测,得到了较好的结果。王文川等[32]将基于时变滤波器的经验模态分解(time varying filter based empirical mode decomposition,TVF-EMD)法与LSTM神经网络相耦合,构成TVF-EMD-LSTM模型,研究表明这种分解可以更好地缓解模态混叠问题,从而使月径流预测精度有效提高。Wang等[33]将TVF-EMD与PSO和GRU结合构成混合模型TVF-EMD-PSO-GRU,TVF-EMD分解原始数据,PSO-GRU对已分解的进行预测,最后对各个预测结果进行叠加,获得最终预测结果,结果表明此模型在月径流预测方面有一定的优势。

VMD也是一种数据分解方法,将径流数据分解成一系列模态函数,其中每个模态函数代表不同频率成分的振荡特征。特别地,VMD方法具有自适应性,无需对数据做出特定假设,适用于不同类型和复杂度的数据,增强了模型对不同数据的适应性和鲁棒性。Sibtain等[34]将VMD与BP网络相结合,构建VMD-BP月径流模型并用于汾塘水库,研究表明此模型的各种误差都有显著降低。孙望良等[35]引入VMD与去趋势波动分析(detrended fluctuation analysis,DFA),构建DFA-VMD-LSTM日径流模型,研究表明此模型能够充分发掘径流序列的构成特征,有效提高径流预测精度。罗灿坤等[36]引入VMD、自回归移动平均(AutoRegressive Moving Average,ARMA)建立VMD-LSTM-ARMA模型,其中VMD用于降低入库流量的复杂度,ARMA用于处理高频序列,实验表明此模型可有效提高预测精度。

周期趋势分解(Seasonal-Trend decomposition using LOESS,STL)法能够将径流数据分解为周期性成分和趋势成分,从中提取出数据的周期性规律和长期趋势信息。结合ANN,周期性和趋势成分可以作为网络的输入,使模型能够更充分地学习和表示径流数据中的周期性和趋势特征,从而提高模型的数据表达能力和预测性能。张力等[37]利用STL将原始数据分解为周期项、趋势项和剩余项,采用多模型集成进行预测,结果表明该模型有效预测了长江流域的径流波动过程。为使径流序列的复杂非线性特征得到更全面地提取,雷庆文等[38]提出一种基于局部加权回归STL与CNN和LSTM神经网络相融合的月径流预测模型,STL可将径流序列分解,使预测值更为精确。

1.4 人工神经网络模型与智能优化算法的耦合

为提高径流预测精度和速度,科研人员相继提出多种智能优化算法与不同的ANN结合进行优化,以完善径流预测理论,并指导生产实践。在径流预测中,算法多与BP网络、RBF、GRNN、Elman网络和LSTM神经网络耦合。

以往研究将BP模型与共轭梯度算法、遗传优化算法(genetic algorithm,GA)、Levenberg-Marquardt(LM)算法、回溯搜索优化算法(backtracking search optimization algorithm,BSA)、狼群算法(wolf pack algorithm,WPA)、PSO和偏最小二乘回归(partial least squares regression,PLSR)等优化算法进行融合。多算法结合相较于单一BP模型呈现出明显的优势。共轭梯度算法利用梯度信息快速收敛于极小值点,有效改善BP模型的训练速度和收敛性能。GA通过模拟自然进化的过程,在搜索空间中找到全局最优解,有助于提高BP模型的泛化性能和预测精度。Sedki等[39]采用GA优化BP网络,避免过早收敛和排列问题。LM算法是一种非线性最小二乘优化方法,对于BP模型的权重调整具有较快的收敛速度和较好的稳定性。李婕妤等[40]引入LM算法,构建LMBPDH(LM-BP-double hidden)模型,增强了系统输入输出之间复杂关系的映射能力,训练性能与预测准确度优于常规BP改进算法,从而具有较强的预测及泛化能力。BSA的全局寻优性有助于BP模型克服局部极值问题,提高模型的鲁棒性和预测性能。崔东文等[41]引入BSA并建立BSA-BP模型,提高了预测精度及泛化能力。WPA灵感来源于狼群的捕食行为,该算法具备全局搜索和局部优化能力,有助于优化BP模型的权重和偏置,提高预测精度。崔东文等[42]提出WPA并建立WPA-BP模型,并对月径流进行预测,结果表明优化了BP神经网络的预测精度和泛化能力。PSO可以有效地搜索复杂的非线性优化空间,为BP模型提供更好的权重和偏置选择。杨道辉等[43]提出PSO-BP神经网络进行径流预测,结果表明比单一BP预测精度高、收敛速度快、预测周期短。PLSR用于特征选择和降维,结合BP模型提高模型的学习效率和泛化性能。刘易文等[44]引入PLSR,建立的BP-PLSR模型可以避免径流峰值处过拟合及突变点附近局部最优的情况,为降雨径流的预测提供了新的方法。大量实验研究均表明BP神经网络的预测准度因多种前沿智能算法的引入而大大加强。

随着研究的不断进步,发现利用智能算法优化其他机器学习模型后再运用到BP网络上更能提高预测精度。王文川等[45]利用哈里斯鹰群算法(Harris hawks optimizer,HHO)优化SVM参数,并利用优化后的SVM构建了基于马尔科夫链的BP-SVM模型,用于年径流预测,在一定程度上提高了预测精度。陈芳等[46]引入蝴蝶算法(butterfly optimization algorithm,BOA)优化BP网络参数,通过集合经验模态分解得到分解-重构-预测组合模型,建立EEMD-BOA-BP模型,并应用于某站的年、月径流预测,得到较高的预测合格率。综上所述,通过智能算法优化其他机器学习模型再与BP网络结合的方法在径流预测中显示出明显优势。

随着径流预测领域的不断发展,将RBF与多种优化算法相结合,已经成为提高预测性能的有效途径,譬如全监督学习算法、Adaboost算法、多组群教学优化(multi-group teaching-learning optimization,MGTLO)算法、热量传递搜索(heat transfer search,HTS)算法和果蝇优化算法(fruit fly optimization algorithm,FOA)等。Lin等[47]利用RBF网络对降雨径流进行预测,提出全监督学习算法对网络进行参数估计,提高了预测精度。黄剑竹[48]引入Adaboost算法构建RBF-Adaboost模型,增强了泛化能力。MGTLO算法和HTS算法都能有效优化GRNN、SVM关键参数[49-50],二者分别与GRNN、RBF和SVM融合组成预测模型,减少了预测误差。而FOA算法[51]可以更好地使GRNN的参数标准误差降低,提高GRNN的预测力及稳定性。综上所述,通过这些优化算法与RBF模型相融合,能够充分发挥各自的优势,显著提高径流预测的精度和可靠性。多算法的结合为径流预测领域提供了新的视角和有效的解决方案,对于改进现有预测模型以及指导相关实际应用具有重要意义。

以往研究表明,将LSTM神经网络与多种优化算法相融合可显著提高预测准确性。通过将蚂蚁狮优化(ant lion optimizer model,ALO)算法、极端梯度提升树(eXtreme Gradient Boosting,XGBoost)算法、贝叶斯优化算法(Bayesian optimization algorithm,BOA)、数据挖掘(data mining,DM)算法、北方苍鹰优化(northern goshawk optimization,NGO)算法和改进的自适应噪声集合经验模态分解(intrinsic computing expressive empirical mode decomposition with adaptive noise,ICEEMDAN)算法等应用于LSTM模型中,取得了显著的优势。Yuan等[52]提出了ALO算法与LSTM相耦合,构建LSTM-ALO模型应用于阿斯特河,研究表明时间滞后对该模型的影响很小,ALO可以提高LSTM在不同模型输入下预测月径流的准确性。史剑伟等[53]提出集成决策树算法中的XGBoost算法,可以精准捕获黄河流域的径流数据,对黄河的综合调度工作具有指导意义。徐冬梅等[54]建立BOA-LSTM模型对年径流进行预测,该算法可以非常精确地率定模型超参数从而提高预测精度。崔忠捷等[55]依据城市降雨径流较高的时间分辨率及不规律的样本特征分布,提出DM算法,构建DM-LSTM模型进行城市降雨径流预测,运用数据挖掘算法中一种无监督的机器学习方法——聚类分析,使数据集被高效聚类并重构,最后提高了精度,对城市发生各类降雨事件有较大的参考意义。Yang等[56]结合了ICEEMDAN算法强大的非线性处理能力、NGO算法完美优化策略及LSTM神经网络良好的分配信息的能力,构建了ICEEMDAN-NGO-LSTM模型,结果表明预测月径流趋势的准确性很高。

ELSTM(enhanced long short-term memory)是改进的LSTM结构,在径流预测中表现出显著优势。ELSTM能够更好地处理并捕捉时间序列数据中的长期依赖性并对异常值和噪声体现较强的鲁棒性,增强了预测的准确性和适应性。通常使用梯度下降反向传播法进行传统Elman神经网络训练,从而导致训练时收敛速度慢、时间长、动态性能较差,且倾向于在局部极值收敛。针对上述问题,可利用粒子群算法或遗传算法的全局搜索优化能力优化Elman神经网络的权重和阈值,尽量减小误差。李志新等[57]利用GA对网络权值知阈值全局优化,一定程度缓解了Elman网络陷入局部极值的缺陷,优化了泛化能力与预测精度。王文川等[58]采用PSO优化Elman模型参数,运用马尔科夫链对初始预测值修正,进而使平均相对误差和均方根误差降低,精度得到提高。

2 人工神经网络径流预测模型方法评价

人工神经网络是基于数据类的方法,相比传统的数据类方法,它可以更好地处理大规模样本,提高数据利用率及泛化能力,且不会像信息熵一样易受主观影响。此文梳理总结了人工神经网络模型与物理模型的耦合、多人工神经网络模型的耦合、分解技术与机器学习方法的耦合及人工神经网络模型与智能优化算法的耦合对径流进行的预测。为改进预测精度并增强模型的可解释性和泛化能力,以下分析耦合方法的优缺点。

(1) 人工神经网络模型与物理模型的耦合。将ANN和物理模型耦合可以将经验和理论知识相结合,从而增强模型对复杂水文过程的理解。此种耦合可提高预测性能,减少对大量水文数据的依赖,并赋予模型更高的理论指导性。然而,这种方法可能增加模型的总体复杂度,并且过于严格的物理规则可能阻碍ANN的自由度。

(2) 多人工神经网络模型的耦合。采用多个ANN模型让各网络专注于处理特定的子任务,从而提高整体预测系统的灵活性和鲁棒性。此方法有助于通过综合分析来捕获更多方面的水文动态变化,可以减轻单个ANN模型的过拟合风险。然而,多网络耦合需要更多的计算资源,并且管理多个模型的训练和协同工作也较为复杂。

(3) 分解技术与机器学习方法的耦合。将分解技术如主成分分析与ANN模型耦合,能够帮助减少模型输入的维度,提取最具代表性的水文特征,同时缩短训练时间并提升模型效率。在径流预测中,通过这种方法可以从大量的环境变量中筛选出关键的影响因子。但是,这种方法可能会导致一些重要信息的丢失,并且组合模型可能在解释性上存在局限。

(4) 人工神经网络模型与智能优化算法的耦合。智能优化算法(如遗传算法、粒子群优化算法)与ANN的耦合对于参数选取和优化具有显著的助益。此类耦合可以实现全局搜索,避免模型陷入局部最优解,并在高维参数空间中寻找更优的网络配置。在径流预测场景中,它有利于提高模型适应具有强季节性和突发水文事件的流域。但是,优化算法本身可能需要花费更多的时间和计算资源,并可能因增加的调优步骤而引入更多的复杂性。

虽然此文列举的诸多实例中,这些方法相互借鉴、完善,研究者都得到了较高精度的预测,但据上文对每个模型优缺点的分析,需研究新方法使其得以突破。全球气候与环境不断变化,极端天气频发,需不断研究新模型以适应新环境。从经济角度来看,研究径流预测可以提高水力发电、河流航运等行业的运行效率及经济回报。

3 研究展望

神经网络模型作为一种重要的预测工具,在水文方面应用广泛,而径流预测是其中的一个重要方向。未来,随着深度学习和优化算法的不断发展和完善,ANN在径流预测上的应用前景将变得更加广阔。从以下几个方面展望ANN在径流预测方面的应用。

(1) 建立多模型集成预测系统。由于水文过程的复杂性和多样性,单一的径流预测模型可能无法满足所有的预测需求。因此,可以建立多模型集成预测系统,将不同的预测模型结合起来,形成集成预测结果。这种方法可以有效地利用不同模型之间的互补性,提高预测精度和可靠性。

(2) 引入时空特征和非线性关系。径流预测是一个时空过程,需要考虑不同时间和空间尺度下的影响因素。因此,在神经网络模型的设计和应用中,应该引入时空特征和非线性关系,更好地描述和预测径流变化。同时,可以考虑使用多元时间序列分析方法和深度学习模型,对径流进行更加细致全面地预测。

(3) 加强应用场景研究。ANN在径流预测上的应用,需考虑不同的应用场景和需求。例如,对于城市水源地和灌溉农田等不同用水需求的场景,需针对性地优化和调整模型和算法。

(4) 深化对神经网络模型的理解和解释性。神经网络模型由于其复杂的网络结构和参数设置,其预测结果缺乏解释性,难以理解。因此,需要深化对ANN的理解和解释性研究,探索ANN预测的产生机理和模型参数的物理意义,从而更好解释模型的预测结果,并提高模型的可靠性和可解释性。

(5) 探索不确定性预测模型。神经网络模型在径流预测方面可以达到较高的预测精度,但在处理不确定性方面存在一定的局限性。因此,需要探索不确定性预测模型,从不同的角度和方法去解释预测结果的不确定性来源,并探索如何准确地评估不确定性。

(6) 探索预测模型的可迁移性。ANN的应用受到训练数据的限制,当预测模型在其他地区或时段使用时,可能会出现较大误差。因此,需要探索预测模型的可迁移性,即如何让模型在不同的时间和空间尺度上保持预测精度和稳定性。

总之,神经网络模型在径流预测方面的应用前景非常广阔,需要进一步加强研究和应用,从多方面探索新的预测方法和技术,提高预测精度和可靠性,实现对水资源的科学管理和有效利用,为人类的可持续发展作出贡献。

参考文献
[1]
赵海军, 曹洁, 潘玲, 等. 2007—2019年山东省短时强降水时空分布特征[J]. 海洋气象学报, 2021, 41(2): 149-155.
[2]
VOGEL R M, FENNESSEY N M. Flow-duration curves. I: new interpretation and confidence intervals[J]. J Water Resour Plann Manage, 1994, 120(4): 485-504. DOI:10.1061/(ASCE)0733-9496(1994)120:4(485)
[3]
张洪刚, 王辉, 徐德龙, 等. 汉江上游降水与径流变化趋势研究[J]. 长江科学院院报, 2007, 24(5): 27-30.
[4]
ASCE Task Committee on Application of Artificial Neural Networks in Hydrology. Artificial neural networks in hydrology. Ⅱ: hydrologic applications[J]. J Hydrol Eng, 2000, 5(2): 124-137.
[5]
HAN H, MORRISON R R. Data-driven approaches for runoff prediction using distributed data[J]. Stoch Environ Res Risk Assess, 2022, 36(8): 2153-2171. DOI:10.1007/s00477-021-01993-3
[6]
阚光远, 李致家, 刘志雨, 等. 概念性水文模型与神经网络模型的耦合应用研究[J]. 水力发电学报, 2013, 32(2): 9-13.
[7]
刘媛媛, 刘业森, 郑敬伟, 等. BP神经网络和数值模型相结合的城市内涝预测方法研究[J]. 水利学报, 2022, 53(3): 284-295.
[8]
李鑫, 刘艳丽, 朱士江, 等. 基于新安江模型和BP神经网络的中小河流洪水模拟研究[J]. 中国农村水利水电, 2022(1): 93-97.
[9]
SINGH S K, YANG R, BEHJAT A, et al. PI-LSTM: physics-infused long short-term memory network[C]//18th IEEE International Conference on Machine Learning and Applications (ICMLA). Boca Raton, Florida: IEEE, 2019: 34-41.
[10]
李易凡. 茅洲河流域降雨特征分析及其对径流与水质的影响研究[D]. 哈尔滨: 哈尔滨工业大学, 2020.
[11]
陈剑飞, 李勇, 刘俊江, 等. 耦合陆面水文模型和机器学习方法的水库径流量预报及应用[J]. 气象研究与应用, 2022, 43(1): 1-7.
[12]
徐嘉远, 邹磊, 夏军, 等. TVGM-LSTM耦合模型及其径流模拟效果分析[J]. 水资源保护, 2023, 39(6): 104-110.
[13]
郭俊, 周建中, 张勇传, 等. 基于改进支持向量机回归的日径流预测模型[J]. 水力发电, 2010, 36(3): 12-15.
[14]
陶凤玲, 武晟, 余生才, 等. 基于最小二乘支持向量机的龙羊峡径流预测[J]. 水文, 2008, 28(4): 29-30.
[15]
魏胜. 回归支持向量机模型及其在年径流预测中的应用[J]. 水资源与水工程学报, 2014, 25(2): 213-217.
[16]
武夏宁, 江燕. 年径流预报的非线性混合回归模型研究[J]. 中国农村水利水电, 2010(11): 8-10.
[17]
王治林. 水文集成预报模拟研究[D]. 徐州: 中国矿业大学, 2021.
[18]
XIANG Z R, YAN J, DEMIR I. A rainfall-runoff model with LSTM-based sequence-to-sequence learning[J]. Water Resour Res, 2020, 56(1): e2019WR025326.
[19]
唐鑫. 基于集成学习的径流研究以及应用[D]. 成都: 电子科技大学, 2022.
[20]
胡鹤轩, 隋华超, 胡强, 等. 基于图注意力网络与双阶注意力机制的径流预报模型[J]. 计算机应用, 2022, 42(5): 1607-1615.
[21]
田烨, 谭伟丽, 王国庆, 等. LSTM变体模型在径流预测中的性能及其可解释性[J]. 水资源保护, 2023, 39(3): 188-194.
[22]
YAO Z Y, WANG Z C, WANG D W, et al. An ensemble CNN-LSTM and GRU adaptive weighting model based improved sparrow search algorithm for predicting runoff using historical meteorological and runoff data as input[J]. J Hydrol, 2023, 625: 129977.
[23]
BI X Y, LI B, LU W L, et al. Daily runoff forecasting based on data-augmented neural network model[J]. J Hydroinform, 2020, 22(4): 900-915.
[24]
HE S, SANG X F, YIN J X, et al. Short-term runoff prediction optimization method based on BGRU-BP and BLSTM-BP neural networks[J]. Water Resour Manage, 2023, 37(2): 747-768.
[25]
凌旋, 袁鹏, 陈景开, 等. 小波神经网络在径流预测中的应用[J]. 水利科技与经济, 2012, 18(8): 51-54.
[26]
杜拉, 纪昌明, 李荣波, 等. 基于小波—BP神经网络的贝叶斯概率组合预测模型及其应用[J]. 中国农村水利水电, 2015(7): 50-53.
[27]
莫崇勋, 邓云, 阮俞理, 等. 基于EWT-PSO-Elman耦合模型在径流预测中的应用[J]. 科学技术与工程, 2022, 22(22): 9775-9780.
[28]
席东洁, 赵雪花, 张永波, 等. 基于经验模态分解与Elman神经网络的月径流预测[J]. 中国农村水利水电, 2017(7): 112-115.
[29]
王栋, 魏加华, 章四龙, 等. 基于CEEMD-BP模型的水文时间序列月径流预测[J]. 北京师范大学学报(自然科学版), 2020, 56(3): 376-386.
[30]
ZHANG X K, ZHANG Q W, ZHANG G, et al. A hybrid model for annual runoff time series forecasting using Elman neural network with ensemble empirical mode decomposition[J]. Water, 2018, 10(4): 416.
[31]
胡斯曼. 基于CEEMDAN-LSTM模型的中长期径流预报研究及系统集成[D]. 武汉: 华中科技大学, 2020.
[32]
王文川, 高畅, 徐雷. 基于TVF-EMD与LSTM神经网络耦合的月径流预测研究[J]. 中国农村水利水电, 2022(2): 76-81.
[33]
WANG X J, ZHANG S, QIAO H F, et al. Mid-long term forecasting of reservoir inflow using the coupling of time-varying filter-based empirical mode decomposition and gated recurrent unit[J]. Environ Sci Pollut Res, 2022, 29(58): 87200-87217.
[34]
SIBTAIN M, LI X S, BASHIR H, et al. A hybrid model for runoff prediction using variational mode decomposition and artificial neural network[J]. Water Resour, 2021, 48(5): 701-712.
[35]
孙望良, 周建中, 彭利鸿, 等. DFA_VMD_LSTM组合日径流预测模型研究[J]. 水电能源科学, 2021, 39(3): 12-15.
[36]
罗灿坤, 刘昊, 黄鑫, 等. 基于VMD-LSTM-ARMA模型的径流预测[J]. 人民珠江, 2023, 44(4): 96-102.
[37]
张力, 王红瑞, 郭琲楠, 等. 基于时序分解与机器学习的非平稳径流序列集成模型与应用[J]. 水科学进展, 2023, 34(1): 42-52.
[38]
雷庆文, 高培强, 李建林. 时序分解和CNN-LSTM相融合的月径流预报模型[J]. 长江科学院院报, 2023, 40(6): 49-54.
[39]
SEDKI A, OUAZAR D, EL MAZOUDI E. Evolving neural network using real coded genetic algorithm for daily rainfall-runoff forecasting[J]. Expert Syst Appl, 2009, 36(3): 4523-4527.
[40]
李婕妤, 陈志军, 闫学勤. LM-BP算法在径流预测中的应用[J]. 人民黄河, 2015, 37(6): 29-31.
[41]
崔东文, 黄恩奎. 基于回溯搜索优化算法的BP神经网络年径流预测[J]. 人民珠江, 2015, 36(5): 43-46.
[42]
崔东文, 金波. WPA-BP神经网络模型在枯水期月径流预测中的应用[J]. 人民珠江, 2016, 37(1): 55-59.
[43]
杨道辉, 马光文, 刘起方, 等. 基于粒子群优化算法的BP网络模型在径流预测中的应用[J]. 水力发电学报, 2006, 25(2): 65-68.
[44]
刘易文, 李家科, 丁强, 等. 汉江流域安康段降雨径流特征分析及预测[J]. 人民珠江, 2021, 42(6): 59-69.
[45]
王文川, 张洁铭, 郑野, 等. 基于马尔科夫链的BP-SVM模型的径流预测[J]. 水利水电技术, 2020, 51(11): 78-84.
[46]
陈芳, 张志强, 李扉, 等. 基于EEMD分解与BOA算法优化神经网络的密云水库大阁水文站径流预测[J]. 西北林学院学报, 2021, 36(6): 188-194.
[47]
LIN G F, CHEN L H. A non-linear rainfall-runoff model using radial basis function network[J]. J Hydrol, 2004, 289(1/2/3/4): 1-8.
[48]
黄剑竹. 改进RBF-Adaboost模型及其在年径流预测中的应用[J]. 人民珠江, 2015, 36(1): 32-36.
[49]
崔东文. 多组群教学优化算法-神经网络-支持向量机组合模型在径流预测中的应用[J]. 水利水电科技进展, 2019, 39(4): 41-48.
[50]
崔东文, 郭荣. HTS算法与GRNN、SVM耦合模型在径流预测中的应用[J]. 华北水利水电大学学报(自然科学版), 2018, 39(5): 73-81.
[51]
林晓佳. 基于果蝇优化广义回归神经网络的径流预测[J]. 重庆科技学院学报(自然科学版), 2016, 18(6): 84-86.
[52]
YUAN X H, CHEN C, LEI X H, et al. Monthly runoff forecasting based on LSTM-ALO model[J]. Stoch Environ Res Risk Assess, 2018, 32(8): 2199-2212.
[53]
史剑伟, 江时俊, 刘启兴. 基于LSTM和XGBoost算法的径流预测模型研究[J]. 治淮, 2020(8): 29-31.
[54]
徐冬梅, 王逸阳, 王文川. 基于贝叶斯优化算法的长短期记忆神经网络模型年径流预测[J]. 水电能源科学, 2022, 40(12): 42-46.
[55]
崔忠捷, 卿晓霞, 杨森雄. 基于DM-LSTM的城市降雨径流预测研究[J]. 中国给水排水, 2022, 38(19): 132-138.
[56]
YANG C, JIANG Y T, LIU Y, et al. A novel model for runoff prediction based on the ICEEMDAN-NGO-LSTM coupling[J]. Environ Sci Pollut Res, 2023, 30(34): 82179-82188.
[57]
李志新, 赖志琴, 龙云墨. 基于GA-Elman神经网络模型的年径流预测[J]. 水利水电技术, 2018, 49(8): 71-77.
[58]
王文川, 王莉芳, 郭安强. 基于PSO-Elman修正模型的年径流预测[J]. 人民长江, 2022, 53(11): 66-71.