关键词:
黄河源区
径流时间序列
LSTM径流预测模型
XG-BOOST-LSTM耦合模型
鲸鱼优化算法
摘要:
为有效挖掘唐乃亥日径流量时间序列的特征信息,提高径流预测模型的高维非线性拟合能力和预测性能的稳定性,以黄河源区气象站的气象资料和唐乃亥水文站的日径流量资料为依托,构建了LSTM(长短期记忆网络,Long-Short Term Memory,LSTM)径流预测模型、XG-BOOST(梯度提升算法,e-Xtreme Gradient Boosting,XG-BOOST)径流预测模型、SVM(支持向量机,Support Vector Machine,SVM)径流预测模型和KNN(K-Nearest Neighbor,KNN)径流预测模型、XG-BOOST-LSTM径流耦合模型以及XG-BOOST-LSTM-WOA(鲸鱼优化算法,Whale Optimization Algorithm,WOA)径流耦合模型,并对比验证模型的预测效果,得出以下结论结果:(1)径流量演变特征分析。通过Mann-Kendall秩次检验、spearman秩次检验方法和R/S重标极差法3种方法对唐乃亥的径流量趋势分析,结果均表明唐乃亥的日径流量在1956-1987年呈现显著上升趋势,2007-2014年径流量呈现上升趋势;采用Mann-Kendall突变检验唐乃亥的年径流量,唐乃亥将在1989年发生径流突变;运用小波分析方法对唐乃亥的日径流量进行周期分析,结果表明1956-1987年日径流量的主周期为315天,一般周期为135天和245天,2007-2014年唐乃亥日径流量时间序列的主周期为70天。(2)径流预测基本模型的稳定性验证。4种径流预测基础模型均显示在预测长度为1d时更具有稳定性,其中LSTM径流预测模型的MSE=5111.4216、MAE=42.5687和RMSE=71.4942,从整体来看,模型的预测精度优于KNN、SVM和XG-BOOST径流预测模型。(3)为提升模型的预测精度,对径流预测基础模型调整主要参数,并进行经验优化。LSTM主要经验优化的参数为dropout,全连接层神经元个数dense和隐藏层神经元个数batch size;XG-BOOST的经验优化参数为迭代次数n estimators和树最大深度max depth;SVM的经验优化参数为:核函数kernel,核函数系数gamma和惩罚因子C;KNN模型的经验优化参数为:样本间距离公式P=1和邻最近个数K。结果表明,4种基础模型的主要参数分别在经验优化的数值时,径流模型的预测效果有明显的提高。(4)通过4种基础模型的对比分析,LSTM径流预测模型的预测效果最好,其次是XG-BOOST径流预测模型。从预测的结果来看,LSTM模型的预测值更贴合径流量的真实值,而XG-BOOST、SVM和KNN模型的预测值与径流真实值之间,存在着一定程度上的误差;从预测趋势来看,LSTM径流预测模型的波峰位置、波峰和波谷的预测以及周期性变化规律成分的挖掘要好于XG-BOOST、KNN和SVM径流预测模型;在2015年01月01日~2020年07月31日的径流量预测结果中,LSTM的预测效果为4种基础模型最好的模型,其KNN径流预测模型、SVM径流预测模型和XG-BOOST径流预测模型的预测值与径流量的真实值与LSTM模型相比,偏离较大。(5)构建XG-BOOST-LSTM径流预测耦合模型。通过XG-BOOST从8个气象因子特征筛选6个气象因子以及历史径流量作为XG-BOOST-LSTM耦合模型的输入变量,以径流量为输出变量,构建了XG-BOOST-LSTM的径流量预测耦合模型。XG-BOOST-LSTM径流预测模型的R2=0.9866,MSE=5018.6849,MAE=35.0916和RMSE=70.4051;XG-BOOST-LSTM径流预测耦合模型的波峰位置、波峰和波谷的端点值预测和周期性的规律特征的挖掘要比XG-BOOST径流预测模型和LSTM径流预测模型的效果更好,且XG-BOOST-LSTM径流预测模型测试集的真实值和预测值能够很好的吻合。(6)通过鲸鱼优化分别对XG-BOOST和LSTM模型的超参数优化,相较于XG-BOOST、LSTM和XG-BOOST-LSTM模型,XG-BOOST-WOA、LSTM-WOA和XG-BOOST-LSTM-WOA径流预测模型的整体精度都有明显的提高,其中XG-BOOST-LSTM-WOA的R为0.9928,MSE为3695.8272,MAE为33.7244和RMSE为60.7933;XG-BOOST径流预测模型在2020年07月31日的基础上往后预测了300天,发现随后对日径流量的趋势预测与历史径流量的趋势高度相似,说明XG-BOOST-LSTM组合模型对唐乃亥水文站的日径流量预测具有较好的实践应用价值。