研究论文

基于LSTM和气候要素分带的金沙江上游流域径流模拟研究

  • 张子凡 , 1, 2 ,
  • 刘时银 , 1, 2, * ,
  • 马凯 1, 2 ,
  • 张鲜鹤 1, 2 ,
  • 杨延伟 3 ,
  • 崔福宁 3
展开
  • 1.云南大学国际河流与生态安全研究院,昆明 650504
  • 2.云南省国际河流与跨境生态安全重点实验室,昆明 650504
  • 3.华电云南发电有限公司,昆明 650228
* 刘时银(1963— ),男,河南信阳人,研究员,博士生导师,主要从事冰川资源、冰川灾害、冰雪遥感、冰雪水文等方向的研究。E-mail:

张子凡(1997— ),男,河南焦作人,硕士生,主要研究方向为水循环与水资源。E-mail:

收稿日期: 2023-01-08

  修回日期: 2023-03-26

  网络出版日期: 2023-06-26

基金资助

国家自然科学基金项目(42171129)

国家自然科学基金项目(42201040)

第二次青藏高原综合科学考察研究项目(2019QZKK0208)

中国华电科技合作项目(CHDKJ21-02-02)

Runoff simulation of the upper Jinsha River Basin based on LSTM driven by elevation dependent climatic forcing

  • ZHANG Zifan , 1, 2 ,
  • LIU Shiyin , 1, 2, * ,
  • MA Kai 1, 2 ,
  • ZHANG Xianhe 1, 2 ,
  • YANG Yanwei 3 ,
  • CUI Funing 3
Expand
  • 1. Institute of International Rivers and Eco-security, Yunnan University, Kunming 650504, China
  • 2. Yunnan Key Laboratory of International Rivers and Transboundary Eco-security, Kunming 650504, China
  • 3. Huadian Yunnan Power Generation Co., Ltd., Kunming 650228, China

Received date: 2023-01-08

  Revised date: 2023-03-26

  Online published: 2023-06-26

Supported by

National Natural Science Foundation of China(42171129)

National Natural Science Foundation of China(42201040)

The Second Tibetan Plateau Scientific Expedition and Research Program(2019QZKK0208)

The Science and Technology Project of China Huadian Corporation(CHDKJ21-02-02)

摘要

全球气候变暖极端事件频发的背景下,近年来金沙江上游区径流变率较1990年代显著增大,出现了百年一遇的极端洪水事件,对流域水资源利用、水库调度带来了新的挑战。金沙江上游地区范围广大、观测站点稀少,基于机器学习模型进行单目标径流模拟较传统模型具有优势,但该方法在大尺度高寒山区的径流模拟研究不足。论文应用长短期记忆(long short-term memory, LSTM)神经网络模型对金沙江上游径流年内过程进行模拟,模型由高程分带提取的日降水(GPM,0.1°×0.1°)、日均气温(ERA5Land,0.1°×0.1°)及逐日积雪面积(MODIS,500 m)数据驱动,以径流观测数据为目标进行建模,同时构建集合模型,模拟流域径流并进行模型对比。模型训练期和验证期分别为2001—2014年和2015—2019年。结果显示:2种模型在预见期15 d内模型效率系数(NSE)≥0.80,且在相邻预见期NSE接近,预见期25 d和30 d的NSE均能达到0.70以上,表明2种模型在30 d预见期内的径流模拟效果良好。以高程分带数据驱动的高程信息模型,1~5 d预见期径流模拟显著优于集合模型,7~13 d预见期优势减小,15~30 d预见期二者模拟效果相当。高程信息模型对汛期径流的模拟优于集合模型,展现出其在洪水模拟方面的优势。总体而言,高程信息模型在预见期为3 d的径流模拟中精度最高,尤其对春汛及夏汛的模拟,可为金沙江中游梯级电站水库调度提供参考,但模型对极端春季洪水模拟效果仍有待提升。

本文引用格式

张子凡 , 刘时银 , 马凯 , 张鲜鹤 , 杨延伟 , 崔福宁 . 基于LSTM和气候要素分带的金沙江上游流域径流模拟研究[J]. 地理科学进展, 2023 , 42(6) : 1139 -1152 . DOI: 10.18306/dlkxjz.2023.06.009

Abstract

The upper Jinsha River has seen increased variability of stream runoff under the global warming since 1990 and extreme flood events with a 100-year recurrence period have occurred in recent years with flood peaks double or triple that of its normal annual mean flow, which has led to challenges to the utilization of water resources and reservoir operation in the basin. The upper Jinsha River Basin covers a large area but has few observation stations. Compared to the traditional models, the single objective runoff simulation based on machine learning (ML) model has shown advantages in forecasting floods, but the research on runoff prediction of ML model for large rivers originated in alpine mountains is insufficient. In this study, the long short-term memory (LSTM) neural network model was used to simulate the annual runoff process in the upper Jinsha River and the model was driven by daily precipitation, mean temperature, and snow cover area extracted from the 500 m elevation bands of GPM, ERA5-Land, and MODIS snow cover products. The model was built with the runoff observation data as the objective. An ensemble model driven by daily means of all above parameters of the whole basin was also built and compared with the LSTM model. Both models used data from 2001-2014 for training and 2015-2019 for validation. The results show that the Nash-Sutcliffe efficiency (NSE) of the two models was greater than or equal to 0.80 within 15 days lead-time, the models had similar NSE in adjacent lead-times, and the NSE decreased to about 0.70 for the lead-times of 25 and 30 days, which indicates that the runoff simulation results of the two models are reasonable at the 30 days and shorter lead-times. Better results of runoff simulation were generated by the LSTM model driven by the vertical zonation data for the 1-5 days lead-times as compared to the ensemble model. The advantage of the vertical zonation data-driven model reduced for the 7-13 days lead-time and the simulation results are equivalent for the 15-30 days lead-time. The vertical zonation data-driven model was superior to the ensemble model in simulating flood season runoff. In general, the runoff simulation accuracy of the vertical zonation data-driven model is the highest at the 3 days lead-time, especially for spring and summer floods. We conclude that the developed model driven by the elevation zonation data can provide reliable prediction of floods, which can provide a reference for the operation of the downstream cascade hydropower stations of the middle Jinsha River. However, the improvement of the ML model for extreme spring floods should still be an important direction in future research.

近一个多世纪以来气候变暖,冰冻圈萎缩引起的冰川消融、冻土退化等问题日趋严峻,极端冰雪灾害呈显著增加趋势及其关联的水灾害频发[1],给社会经济发展及人民生活带来了巨大影响。高寒山区水资源变化直接影响到河川径流乃至全球尺度水循环、水资源及水平衡[2-3]。中国高寒山区主要分布在青藏高原,作为全球气候变化的驱动器和放大器[4],同时孕育着亚洲几大主要河流[5]。金沙江上游位于青藏高原和横断山脉区域,流域面积大,水文、气候、下垫面复杂。历史数据短缺和站点分布稀疏导致基于物理过程的水文模型难以准确模拟流量过程。2018—2019年,金沙江上游春冬季积雪异常偏多,春季径流出现异常,给库群调度、水资源管理带来了影响,现有在大区域的高寒山区径流模拟研究不充分[6-7],无法给相关部门提供科学的决策,在大区域高寒山区开发出精准径流模拟模型有着迫切的需要。
准确可靠的径流模拟对洪水预警以及水资源有效管理有着重要的意义[8-9]。近10年来,关于径流模拟的研究层出不穷[10-11],主要分为基于物理的水文模型和数据驱动模型[12-13]。水文模型可以有效捕捉水文物理过程,但通常需要大量的数据,计算费用昂贵且耗时长,具有一定的局限性[14-16]。水文数据驱动模型不需要了解流域特殊的水文机理,从数据层面能够直接挖掘输入因子与径流之间的非线性关系[17]。机器学习模型是数据驱动模型的一种,在研究区资料稀缺情况下模拟能力更强,在径流模拟研究中得到了广泛的应用[18]。对于中长期径流模拟而言,传统的水文模型需要获取未来较长时间可靠的关键气象要素数据,在实际应用中获取可靠准确的未来数据面临着很大挑战,导致水文模型对未来径流形势模拟效果欠佳。机器学习模型因其无严苛的数据要求及灵活的数据驱动方式,能够有效避免水文物理模型未来模拟面临的窘境[19]
机器学习进行水文模拟是研究热点,属于前沿交叉学科研究[20]。近年来机器学习水文模拟主要基于人工神经网络(ANN)[21-24]、支持向量机(SVM)[25-27]等构建模型。ANN、SVM模型具备非线性拟合优势,能够有效捕捉水文气象数据之间的非线性关系[28-29],相较于线性回归模型(LRM)在水文模拟方面有着巨大的优势。随着人工智能(AI)的发展以及海量数据的积累,深度学习在交叉领域研究发展迅猛。循环神经网络(RNN)属于深度学习范畴,在时间序列数据模拟上有着优秀的表现,但其也有着局限性,往往在反向传播过程中出现梯度消失。长短期记忆循环神经网络(LSTM)作为RNN的变种,可以有效解决梯度消失问题[30]。相较于商业运用,LSTM在学术领域尤其是水文领域运用较少[31],近几年才有着增长趋势。Hunt等[32]首次将LSTM模型用于混合系统的中期预报且效果优于基于物理的模型。Feng等[33]将基于数据融合的LSTM模型应用在大尺度径流模拟中,发现该模型大大降低了美国以地下水为主的西部流域基流偏差并提高了以动态地表水为主的流域径流峰值模拟。Ma等[34]针对水文气象站点稀少、分布不均、无法获取大量数据的研究现状,利用迁移模型有效提升了缺失资料条件下的径流预测。此外,诸多研究采用最新发布的格点数据驱动模型,发现这些格点数据驱动模型在不同时间分辨率的径流模拟中均有很好的表现[35]
尽管LSTM神经网络模型在水文模拟上已有成功的应用,但之前研究大多局限于中小流域,没有考虑海拔差异带来影响[36-37],在流域面积大、海拔差异明显的高寒山区研究不足。因该研究区海拔差异显著,考虑气象要素随海拔变化带来的信息增益有利于进一步构建精准的模型。本文以LSTM深度神经网络作为建模基础,由于研究区常年受积雪的影响,引入积雪面积作为主要输入驱动因子,构建考虑海拔差异的高程信息模型(高程分带数据驱动);依据研究区高差及海拔分布,以划分8个高程带提取的数据作为驱动进行高程信息模型构建,同时构建集合模型(流域数据驱动)作为对照模型;通过模型对比发掘最佳预见期模型,并探究其在春汛、夏汛以及极端洪水事件的模拟能力,挖掘高程信息模型潜在的应用。
本文将回答以下问题:① 合理设置参数、结构的LSTM模型不同时间尺度的模拟表现;② 以高程分带数据为驱动的高程信息模型相较于集合模型的优势期及其在径流过程模拟中优势的体现;③ 最佳预见期模型相较于集合模型在汛期和极端洪水事件具体表现;④ 高程信息模型潜在的应用。

1 研究区域概况

1.1 地理位置及特征

金沙江流域位于中国青藏高原、云贵高原和四川盆地的西部边缘,是长江的上游河段。金沙江全长3486 km,约占长江全程的55%;流域面积 473240 km2,约占长江流域面积的26%。石鼓以上为金沙江上段,石鼓至攀枝花为金沙江中段,攀枝花至宜宾为金沙江下段。作为中国重要的水电开发河段,其已建和在建水电站共20座。
金沙江上游流域概况如图1所示。直门达以上河流由西向东流,山顶终年积雪,多雪山冰川。直门达至石鼓,金沙江进入横断山褶皱带,流域呈狭长的南北带状,河流穿行于高山狭谷之中,水流湍急,流速大。研究区地处青藏高原东南及横断山脉北部,地理坐标介于27°N~36°N、90°E~100°E,流域地势表现为北高南低,总面积为214184 km2,最高海拔6575 m(位于直门达以上),最低海拔为1807 m(位于石鼓、岗托之间)。
图1 金沙江上游流域概况

Fig.1 Overview of the upper Jinsha River Basin

1.2 气候水文特征

金沙江上游流域地处青藏高原,受高原季风气候和副热带季风气候影响显著,海拔差异大具有垂直气候特征。因其地势高,一定程度阻挡了水汽进入,导致该流域降水稀少。通过流域近20年气温、降水数据统计,流域多年平均降水量约350~555 mm,降水呈西北向东南递增趋势,流域多年平均气温为-7.8~3.5 ℃。对流域气温和降水进行MK(Mann-Kendall)和SS(Sen's slope)检验发现,近年来春夏季气温呈缓慢上升趋势,冬季有降低趋势,流域四季降水均呈增加趋势。冬季气温降低及降水增加使得冬季产生了更多的积雪,来年春季温度升高促进积雪融化,同期春季降水微量增加,使得春季径流较往常有增多趋势。
流域主河道共4个全年观测水文站,如图1所示,自上游至下游分别为直门达、岗托、巴塘和石鼓,各水文站控制流域面积分别占总流域面积的64.4%、5.3%、14.7%、15.6%。直门达、岗托、巴塘和石鼓夏秋季流量占比分别为85%、82%、81%、78%。大径流量主要集中在6—10月,分别占全年的81%、77%、76%、72%,占比从上游非丰沛区至下游丰沛区逐渐减少。流域日径流量有着明显的年际周期规律及年内四季变化,夏季流量和秋季流量明显高于春季和冬季流量,洪水期主要发生在夏季和秋季初,洪水极值出现在夏季,春冬季径流量小且平稳,夏秋季径流量大且变化大。直门达以上是流域冰冻圈主要分布区,直门达以下河段河谷窄—宽—窄交替出现,多年平均积雪覆盖占整个流域的74%,决定着流域的积雪覆盖情况。

2 数据和方法

2.1 研究数据与预处理

计算机处理技术与遥感卫星的发展和再分析数据的广泛应用,使得在缺乏实测数据的高寒山区有了另一种选择,弥补了高寒山区观测数据的缺陷。本文采用数据包括:90 m分辨率的SRTM DEM数据(NASA CGIAR https://srtm.csi.cgiar.org)、0.1°×0.1°GPM0.5 h降水数据(NASA GES DISC at NASA Goddard Space Flight Center,doi: 10.5067/GPM/IMERG/3B-HH-L/06)、0.1°×0.1° ERA5Land_ hourly(Copernicus Climate Data Store,doi:10.24381/cds.e2161bac)气温数据、中国MODIS逐日无云500 m积雪面积数据(中国冰川冻土沙漠科学数据中心, http://www.ncdc.ac.cn/portal/metadata/be3a4134-2e5c-467f-8a5e-b1c0ed6cc341)和石鼓站点径流数据。
以上原始数据需要经过初步加工处理,以满足高程信息模型与集合模型的输入输出数据要求。通过SRTM数字高程模型提取以石鼓为断点的流域边界。流域海拔落差约4700 m,气象积雪等因素具有明显海拔差异,为减少海拔差异带来的模型误差,结合所提取的流域边界与DEM数字高程模型,依据500 m一个高程分布带,提取相应高程带,最终划分为8个高程带。对中国MODIS逐日无云500 m积雪面积数据进行坐标、格式转换。将逐小时的ERA5Land气温数据以及0.5 h GPM降水数据进行时区和单位转换处理为逐日数据。高程信息模型输入数据按照相应8个高程带求和提取相应积雪面积数据,求均得气温、降水数据。集合模型积雪面积依据整个流域求和取得,气温、降水根据区域平均求得。径流数据为石鼓水文站逐小时观测流量,对径流量进行逐日求均,并将少量缺失的观测数据进行插值处理。
对处理得到的逐日气温、降水和积雪面积数据进行标准化以消除数据量纲差异并提高模型精度。公式如下:
D n o r m a l = D - D μ D σ
式中: D n o r m a l为标准化的数据, D为原数据, D μ为原数据的均值, D σ为原数据的标准差。
经过上述数据初步处理,高程信息模型与集合模型的气温、降水、积雪面积输入与输出因子如表1所示。
表1 模型输入输出因子

Tab.1 Model input and output factors

数据
模型
气温/℃ 降水/mm 积雪面积/km2 流量/(m3/s)
(ERA5Land) (GPM) (MODIS) (石鼓站)
高程
信息
模型
气温2500 m以下 降水2500 m以下 积雪2500 m以下 观测流量
气温2500~3000 m 降水2500~3000 m 积雪2500~3000 m
气温3001~3500 m 降水3001~3500 m 积雪3001~3500 m
气温3501~4000 m 降水3501~4000 m 积雪3501~4000 m
气温4001~4500 m 降水4001~4500 m 积雪4001~4500 m
气温4501~5000 m 降水4501~5000 m 积雪4501~5000 m
气温5001~5500 m 降水5001~5500 m 积雪5001~5000 m
气温5500 m以上 降水5500 m以上 积雪5500 m以上
集合模型 流域气温 流域降水 流域积雪

2.2 模型原理与参数设置

2.2.1 LSTM循环神经网络

LSTM模型是基于RNN发展形成的。在20世纪80年代已有RNN的相关研究[38-39],RNN区别于传统的神经网络,擅长处理序列型数据,其结构相较于ANN更为复杂。RNN最终的输出不仅依赖当前的输入,之前时刻所贡献的信息也会被计算入内[40]。LSTM和RNN有着相似的结构,为了解决梯度消失问题,LSTM内部结构相较于RNN增加了记忆单元,使得结构更加复杂。LSTM包含了记忆单元 c t和隐层单元 h t,如图2a所示。在每个时刻 t,当前的单元接收上一个单元的记忆单元 c t - 1和隐层单元 h t - 1传来的信息,与当前时刻的输入共同作为输入,计算当前单元的记忆单元 c t与隐层单元 h t传递给随后的单元。
图2 (a) LSTM内部结构、(b) 模型中数据结构和 (c) 本文搭建的模型结构

Fig.2 The internal structure of the long short-term memory (LSTM) model (a), the structure of the data in the model (b), and the structure of the model built in this study (c)

其中,除去记忆单元 c t和隐层单元 h t f t为遗忘单元, i t为输入单元, o t为输出单元,这些单元可以达到不同的目的[41]。遗忘单元的作用是遗忘掉记忆单元 c t的部分信息,输入单元决定着多少当前新的信息传递给 c t,输出单元控制输出信息部分。各部分计算公式如下,其中WfWiWcWo分别为计算 f t i t c ˜ t o t的权重,bfbibcbo分别为计算 f t i t c ˜ t o t的偏置量, c ˜ t代表新的输入带来的信息:
f t = σ W f h t - 1 , x t + b f
式中: h t - 1 , x t代表把2个向量连接起来; σ的输出在0~1之间。输出 f t逐位与 c t - 1的元素相乘,当 f t的某一位值为0时, c t - 1对应位的信息就会失效,值为(0,1)时,对应位的信息保留了一部分,只有值为1时,对应位的信息才会完整保留。
i t = σ W i h t - 1 , x t + b i
c ˜ t = t a n h W c h t - 1 , x t + b c
c t = f t × c t - 1 + i t × c ˜ t
o t = σ W o h t - 1 , x t + b o
h t = o t × t a n h c t
遗忘单元得到的 f t c t - 1相乘,表示过去的信息有选择地遗忘,新的信息 c ˜ t i t表示新的信息有选择地保留,再把这两部分信息综合起来,就是新的 c t c t通过 t a n h计算,所得结果与 o t相乘,得到要传递给下一时刻的隐层单元信息。

2.2.2 模型参数设置

基于先前研究,且考虑到流域径流形成过程,积雪形成消融周期约为7个月,并经过多次调整序列长度实验,序列长度设定为210[42]。模型由一个LSTM层和一个全连接层构成。经过多次调参,LSTM神经元个数介于15~20时效果最佳,本文设置为17。输入 x由每个时刻根据高程带划分的气温、降水、积雪面积标准化处理后的序列数据,最终构建的模型参数和结构图如图2b、2c所示。
经过多次模型调参实验,将Batchsize设置为1000,学习率初始值设置为0.01,迭代次数设置为200,使用L2正则化避免模型过拟合并设置模型收敛时提前结束训练。采用广泛用于机器学习模型优化的MSE(均方误差)[43]作为损失函数。
M S E = 1 N i = 1 N o b s e r v e d i - s i m u l a t e d i 2
式中: N代表样本数量, o b s e r v e d i代表实际值, s i m u l a t e d i代表模拟值。
为研究模型在未来短中长期模拟效果以及海拔差异的影响,分别设计模拟未来1、3、5、7、9、11、13、15、25和30 d径流量的实验。模型的输入输出结构如图3所示。
图3 不同预见期模型输入输出示意图

Fig.3 Schematic diagram of model input and output for different lead times

2.3 模型精度评价

已有大量相关研究采用相关系数R、纳什效率系数NSE以及均方根误差RMSE方法来衡量模型精度[44-45]
(1) 相关系数R
R = i = 1 N ( y i - y - ) ( y i s i m - y - s i m ) i = 1 N ( y i - y - ) 2 i = 1 N ( y i s i m - y - s i m ) 2
(2) 纳什效率系数NSE
N S E = 1 - i = 1 N ( y i - y i s i m ) 2 i = 1 N ( y i - y - ) 2
(3) 均方根误差RMSE
R M S E = 1 N i = 1 N ( y i - y i s i m ) 2
式中: N为样本量, y i s i m是第 i个样本模拟值, y i是第 i个样本观测值, y -为观测值均值, y - s i m为模拟值均值。相关系数 R取值范围为 - 1 R 1, R值越接近1表明模型越优秀。 N S E在径流模拟研究应用中比较成熟[46] N S E 1 N S E值小于0时表明模型表现不如实测值, N S E值越接近1表明模拟效果越优秀, N S E取值为1表明模拟与观测值完全一致。 R M S E值大于等于0,RMSE值越小表明模拟效果越优。

3 结果分析

3.1 集合模型不同未来预见期表现

选定预见期1、3、5、7、15和30 d的集合模型对验证期2015—2019年模拟效果进行评价。集合模型模拟效果如图4所示。由图4a曲线图可以观察出,该模型在30 d预见期内均能较好地捕捉年内年际径流特征。预见期30 d虽能很好地捕捉年内年际径流的规律,但在拟合程度上较先前时间段有着较大的偏差。集合模型在枯水期模拟表现较好,但在模拟洪水能力上表现欠佳。
图4 集合模型在验证期2015—2019年模拟情况

Fig.4 Runoff simulation of the ensemble model in the validation period 2015-2019

图4b散点图可得,随着预见期增加,离散程度逐渐增加。结合图5进一步准确评估模型精度随预见期的变化。整体上,集合模型随着预见期的增加,模型NSE和R值降低,RMSE增加,以上综合表明了模型精度随预见期增加,模型模拟精度降低。集合模型在预见期1~7 d时NSE均不低于0.86,1和5 d预见期模型精度一致,在预见期为3和7 d时精度略低。预见期9~15 d时,模型NSE均高于0.8,且该模型在预见期30 d时模拟NSE仍达到0.7以上。模型在9~30 d预见期时,随着预见期增加,NSE减少速率较1~7 d略快。模型的训练NSE与验证NSE相差0.04以内,表明模型没有产生过拟合,且模型训练NSE均高于验证NSE,表明了模型构建过程中参数调整的合理性(高程信息模型一样)。
图5 高程信息模型与集合模型径流模拟(a)泰勒图和(b)NSE结果

Fig.5 Taylor chart (a) and Nash-Sutcliffe efficiency (NSE) and (b) of the runoff simulation results of the vertical zonation data-driven and ensemble models

综上所述,集合模型在短中期模拟中有着优秀的表现(NSE>0.85),甚至在15 d内的较长期模拟中也有着较好的表现(NSE>0.80),在30 d长期模拟过程中,集合模型表现良好(NSE>0.70)。

3.2 高程信息模型不同未来预见期表现

本文同时构建高程信息模型,同样以预见期1、3、5、7、15和30 d考虑海拔差异的高程信息模型,模拟效果如图6所示。该模型在30 d预见期内均能较好地捕捉年内及年际径流特征。高程信息模型在枯水期相比于集合模型拟合效果较好,在模拟夏季洪水上,相比于集合模型模拟效果有着较大的提升。整体上,模拟与观测径流散点图随预见期增加离散程度增加(预见期3 d除外)。
图6 高程信息模型在验证期2015—2019年模拟情况

Fig.6 Runoff simulation of the vertical zonation data-driven model in the validation period 2015-2019

图5可知,整体上模型NSE和R值随着预见期的增加呈下降趋势,RMSE呈增加趋势,以上表明,模型精度随着预见期的增加而降低。高程信息模型在预见期1~7 d,模型NSE均能达到0.90以上,在预见期3 d时NSE最高,预见期1 d和5 d的模型效果相当(保留3位小数情况下,5 d预见期略优)。预见期9~15 d,模型NSE均高于0.80,模型精度变化速率较1~7 d相对增大。预见期25 d和30 d时的模型NSE均达到0.70以上,NSE分别为0.74和0.72。
在该高寒山区流域,高程信息模型短期模拟中NSE达到了0.90以上,模拟效果优秀;在中期模拟中NSE仍高于0.88,也有着优秀的表现;在30 d长期模拟中NSE达0.7以上,有着良好的表现。

3.3 高程信息模型与集合模型比较

图5a为高程信息模型与集合模型在不同预见期的泰勒图,图5b(训练结果为多次模型训练稳定取得的均值,结果保留两位小数)为高程信息模型与集合模型在各预见期的训练及验证NSE。
整体上,2种模型精度均随着预见期的增加而降低。由图5a可知,在1~7 d预见期,高程信息模型相较于集合模型有着明显的边界,后随着预见期增加,2种模型重合明显,高程信息模型在1~7 d预见期优势更为明显。随着预见期进一步增加,高程信息模型相较于集合模型提升不明显,在11~30 d预见期模型精度基本一致。由图5b可知,两模型NSE在1~9 d预见期模型精度差距最大,平均提升4%,在预见期3 d时提升6%,两模型此时差距最大。在11~13 d预见期高程信息模型略优,15 d预见期后两模型模拟效果相当。综合考虑泰勒图与NSE结果图可以得出,模型在1~13 d未来径流模拟中,高程信息模型相较于集合模型有着更高的精度,1~5 d时高程信息模型优势最为突出。
进一步比较分析高程信息模型与集合模型在不同预见期模拟效果差异,选取连续300 d的验证期数据进行对比分析,如图7所示。观测流量在不同的时间差异较大,这一客观情况增加了模型拟合难度。2种模型在枯水期模拟效果均较好,在丰水期高程信息模型优于集合模型。在1~5 d预见期,高程信息模型在枯水期略优于集合模型,在丰水期,高程信息模型相较于集合模型模拟效果提升明显。在7~13 d预见期,高程信息模型在枯水期与集合模型模拟效果相当,在丰水期模拟效果略优,两模型差距随着预见期增加逐渐缩小。预见期为13 d时,两模型已无明显的差距。15~30 d预见期两模型在枯水与丰水期模拟效果相当。
图7 高程信息模型与集合模型在300 d内模拟效果比较

Fig.7 Comparison of the runoff simulation results of the vertical zonation data-driven and ensemble models in 300 days

综上所述,高程信息模型在1~13 d预见期相较于集合模型有着提升,在1~5 d预见期提升效果明显,15~30 d预见期相较于集合模型已无提升。以上结果表明,高程信息模型在一定时间内有提升,超过时间阈值已无优势。通过对比高程信息模型与集合模型在不同预见期R、RMSE、NSE和径流过程表现情况综合得出,预见期3 d的高程信息模型在各项指标的评估中均达到最优。

4 讨论

4.1 模型模拟特殊表现情况分析

集合模型在1~7 d预见期模型精度相差不大,推测在该时段内,输入与输出之间相关性差异不大,流域面积大、输入因子求均模糊了短期内数据之间的差异,以及气温、降水、积雪面积变量在短期内时间相关性高且变化较少综合所致。随着预见期增加,输入与输出数据相关性降低,且差异较1~7 d预见期增大,流域求均已无法缩小不同预见期的差异,从而导致模型精度随预见期增加而下降。
研究区上游区域的融雪融冰影响着全年的径流变化。该流域面积大,高海拔上游区域影响石鼓径流有着明显的时滞性,且不同高程带分布在不同的区域,有着不同时滞期。直门达水文站洪水发生时间较石鼓早3 d,推断直门达以上区域至石鼓时滞期在3 d以上。高程信息模型在预见期3 d内,低海拔下游区有着更快的响应速度,在预见期3~5 d,高海拔区域影响更为明显,5 d后,高海拔降水以及融雪融冰影响逐渐减弱,输入与输出相关性逐渐降低,模型精度随之下降。高程信息模型在未来1和5 d径流模拟能力相当,且出现预见期为3 d模拟效果最优这一特殊情况,因流域空间的复杂性及关联的时间变化,目前模型仍难以解释,随着进一步挖掘时滞期所对应的高程区,构建考虑更加深入的时滞期影响的高程区进行建模,有望解释这一问题。
高程信息模型在短中期内提升效果明显,因在短中期内数据本就有着较高的相关性,高程信息模型在此基础上能挖掘出更有效的信息,从而提升明显。随着预见期增加,输入数据本就对模型训练难以提供足够有效信息,对数据进一步挖掘也无法提供信息增益。

4.2 最佳模型汛期及极端事件的模拟能力

预见期3 d的高程信息模型与集合模型在2015—2019年模拟效果如图8所示。2015年春汛3月高程信息模型优于集合模型,4—5月集合模型优于高程信息模型。2015年夏汛高程信息模型拟合程度更贴近观测径流,在夏汛模拟表现更优。2016年整个春汛时期,高程信息模型均优于集合模型。高程信息模型2016年夏汛时可以更好地拟合洪水的峰值以及洪水的变化,明显优于集合模型,且夏汛模拟提升效果优于春汛模拟。如同2016年,2017、2018年高程信息模型在春汛和夏汛时均优于集合模型且夏汛提升效果更为明显。2019年4—5月发生了春季极端洪水,两模型春季极端洪水表现均不佳,其余春汛时期高程信息模型优于集合模型;夏汛时,高程信息模型除6月的洪水极值,其余时期均优于集合模型。
图8 最佳3 d预见期两模型在验证期2015—2019年模拟情况

Fig.8 Runoff simulation results of the vertical zonation data-driven and ensemble models for the optimal 3 days lead-time in the validation period 2015-2019

整体上,预见期为3 d的高程信息模型在春汛及夏汛表现均优于集合模型,而且在夏季洪水期能够更好地模拟极端洪水与径流变化情况,优势更为明显。
2015年春季4—5月和2019年6月洪水极值处集合模型模拟表现优于高程信息模型特殊情况,可解释为模型参数训练过程中自身存在不确定性,训练数据是多年全年数据,模型更多地关注整体情况而忽略局部细节,导致高程信息模型在局部时期表现不如集合模型,这是正常的。2019年4—5月发生春季极端洪水时期,两模型表现欠佳,可解释为春季极端洪水发生本就罕见,缺少足够的极端洪水样本数据提供模型科学训练,且模型输入数据是多年逐日数据,春季极端洪水在整个训练样本中所占比例较少,而模型参数调整是基于所有样本进行,从而导致模型对春季极端洪水模拟欠佳。为了更准确地模拟春季极端洪水,可取训练样本仅为春汛期,且要具备足够多的极端洪水事件样本供模型学习,但该模型就无法重现全年的径流过程。

4.3 高程信息模型的潜在应用

高寒山区是水资源的发源地[47],位于河流的上游地区。能否对高寒山区水资源进行有效的管理,影响着中下游的民生与经济。未来径流的准确模拟可为相关部门进行科学合理的决策提供依据。高寒山区因其复杂的地理气候条件,对该流域准确的径流模拟提出了挑战。基于物理过程的水文模型,因其使用数据及模型结构的局限性,难以满足高精度的未来径流模拟的要求,基于数据驱动的LSTM模型可以较好地解决此类问题。LSTM高程信息模型考虑高寒山区的海拔差异,相较于集合模型进一步挖掘了有效的数据信息,在长、中、短期(30 d内)都有着良好的表现。高程信息模型在短期模拟中,NSE达到了0.90以上,在中期模拟中NSE高于0.88,在30 d长期模拟中NSE达0.70以上。集合模型洪水模拟效果不佳,高程信息模型在预见期1~5 d,洪水模拟能力显著优于集合模型,预见期7~13 d模拟能力也要优于集合模型,表明了高程信息模型更适合短中期洪水模拟应用。

5 结论

本文构建了基于气候要素分带的高程信息模型和无考虑分带的集合模型,共构建20个模型并分析其在未来短、中、长期的模拟果,主要结论如下:
(1) 两模型均能很好地模拟年内年际径流变化规律,集合模型在预见期1~15 d时模型NSE均高于0.80,且该模型在预见期30 d时NSE仍达到0.70以上。高程信息模型在预见期1~7 d时NSE均能达到0.90以上,预见期延长至15 d,模型NSE高于0.80,预见期为25和30 d时,NSE仍能达到0.70。在短期模拟中,集合模型NSE>0.86;高程信息模型模拟效果优秀,NSE>0.90。中期模拟中,两模型模拟精度NSE>0.85。30 d长期模拟NSE均高于0.70。两模型结构及参数设置在短、中、长期(30 d内)模拟中均有着良好的效果。
(2) 整体上,随着预见期的增加,两模型精度逐渐降低,在预见期9~15 d时下降速度最快。高程信息模型在1~13 d时相较于集合模型有着更高的模型精度,在预见期1~5 d时有着明显的优势,13 d后高程信息模型已不具备优势。两模型在枯水期模拟效果较好,在丰水期高程信息模型优于集合模型。预见期1~5 d,高程信息模型枯水期模拟表现优于集合模型,丰水期表现相较于集合模型提升明显。在7~13 d预见期,高程信息模型与集合模型枯水期表现相当,高程信息模型丰水期模拟效果略优。此外,高程信息模型在洪水模拟中有着更优异的表现。
(3) 预见期为3 d的高程信息模型表现最优,整体上无论在春汛以及夏汛模拟过程中相较于集合模型更加优秀,且在夏汛模拟过程中优势更为明显。但对于发生频率极低的极端春季洪水事件,两模型均不能有效地重建洪峰过程,极端洪水模拟仍有进一步改进空间。
[1]
陈仁升, 阳勇, 韩春坛, 等. 高寒区典型下垫面水文功能小流域观测试验研究[J]. 地球科学进展, 2014, 29(4): 507-514.

[Chen Rensheng, Yang Yong, Han Chuntan, et al. Field experimental research on hydrological function over several typical underlying surfaces in the cold regions of Western China. Advances in Earth Science, 2014, 29(4): 507-514.]

DOI

[2]
Kang S C, Xu Y W, You Q L, et al. Review of climate and cryospheric change in the Tibetan Plateau[J]. Environmental Research Letters, 2010, 5(1): 015101. doi: 10.1088/1748-9326/5/1/015101.

DOI

[3]
汤秋鸿, 刘星才, 周园园, 等. “亚洲水塔”变化对下游水资源的连锁效应[J]. 中国科学院院刊, 2019, 34(11): 1306-1312.

[Tang Qiuhong, Liu Xingcai, Zhou Yuanyuan, et al. Cascading impacts of Asian water tower change on downstream water systems. Bulletin of Chinese Academy of Sciences, 2019, 34(11): 1306-1312.]

[4]
潘保田, 李吉均. 青藏高原: 全球气候变化的驱动机与放大器(Ⅲ): 青藏高原隆起对气候变化的影响[J]. 兰州大学学报, 1996, 32(1): 108-115.

[Pan Baotian, Li Jijun. Qinghai-Tibetan Plateau: A driver and amplifier of the global climatic change Ⅲ: The effects of the uplift of Qinghai-Tibetan Plateau on climatic changes. Journal of Lanzhou University, 1996, 32(1): 108-115.]

[5]
Immerzeel W W, van Beek L P H, Bierkens M F P. Climate change will affect the Asian water towers[J]. Science, 2010, 328: 1382-1385

DOI PMID

[6]
肖豪, 周春辉, 尚艳丽, 等. 基于SWAT与新安江模型的闽江建阳流域径流模拟研究[J]. 水力发电, 2022, 48(10): 19-25.

[Xiao Hao, Zhou Chunhui, Shang Yanli, et al. Runoff simulation in Jianyang watershed of Minjiang River based on SWAT and Xin'anjiang model. Water Power, 2022, 48(10): 19-25.]

[7]
雷磊, 吴健, 万昊, 等. 基于改进降水输入模块的农田地表中尺度径流模拟[J]. 水利水电技术, 2021, 52(S1): 149-154.

[Lei Lei, Wu Jian, Wan Hao, et al. Simulation of mesoscale runoff on farmland surface based on improved precipitation input model. Water Resources and Hydropower Engineering, 2021, 52(S1): 149-154.]

[8]
Young C C, Liu W C. Prediction and modelling of rainfall-runoff during typhoon events using a physically-based and artificial neural network hybrid model[J]. Hydrological Sciences Journal, 2015, 60(12): 2102-2116.

DOI

[9]
伊璇, 周丰, 王心宇, 等. 基于SOM的流域分类和无资料区径流模拟[J]. 地理科学进展, 2014, 33(8): 1109-1116.

DOI

[Yi Xuan, Zhou Feng, Wang Xinyu, et al. Classification and runoff simulation of data-scarce basins based on self-organizing maps. Progress in Geography, 2014, 33(8): 1109-1116.]

DOI

[10]
孙赫, 苏凤阁. 雅鲁藏布江流域多源降水产品评估及其在水文模拟中的应用[J]. 地理科学进展, 2020, 39(7): 1126-1139.

DOI

[Sun He, Su Fengge. Evaluation of multiple precipitation datasets and their potential utilities in hydrologic modeling over the Yarlung Zangbo River Basin. Progress in Geography, 2020, 39(7): 1126-1139.]

DOI

[11]
Westerberg I K, Guerrero J L, Younger P M, et al. Calibration of hydrological models using flow-duration curves[J]. Hydrology and Earth System Sciences, 2011, 15(7): 2205-2227.

DOI

[12]
张国锐, 杨传国, 卢书梅, 等. CMORPH卫星站点融合降水的沂河流域径流模拟适用性评估[J]. 水电能源科学, 2023, 41(1): 6-9.

[Zhang Guorui, Yang Chuanguo, Lu Shumei, et al. Applicability evaluation of CMORPH merged rainfall in hydrologic simulation Yihe River Basin. Water Resources and Power, 2023, 41(1): 6-9.]

[13]
Kim T, Yang T T, Gao S, et al. Can artificial intelligence and data-driven machine learning models match or even replace process-driven hydrologic models for streamflow simulation? A case study of four watersheds with different hydro-climatic regions across the CONUS[J]. Journal of Hydrology, 2021, 598: 126423. doi: 10.1016/j.jhydrol.2021.126423.

DOI

[14]
Wood E F, Roundy J K, Troy T J, et al. Reply to comment by Keith J. Beven and Hannah L. Cloke on "Hyperresolution global land surface modeling: Meeting a grand challenge for monitoring Earth's terrestrial water"[J]. Water Resources Research, 2012, 48(1): W01802. doi: 10.1029/2011WR011202.

DOI

[15]
Duan Q Y, Sorooshian S, Gupta V. Effective and efficient global optimization for conceptual rainfall-runoff models[J]. Water Resources Research, 1992, 28(4): 1015-1031.

DOI

[16]
赵安周, 刘宪锋, 朱秀芳, 等. 基于SWAT模型的渭河流域干旱时空分布[J]. 地理科学进展, 2015, 34(9): 1156-1166.

DOI

[Zhao Anzhou, Liu Xianfeng, Zhu Xiufang, et al. Spatiotemporal patterns of droughts based on SWAT model for the Weihe River Basin. Progress in Geography, 2015, 34(9): 1156-1166.]

DOI

[17]
Muhammad Adnan R, Yuan X, Kisi O, et al. Application of soft computing models in streamflow forecasting[J]. Proceedings of the Institution of Civil Engineers-Water Management, 2019, 172: 123-134.

DOI

[18]
He Z B, Wen X H, Liu H, et al. A comparative study of artificial neural network, adaptive neuro fuzzy inference system and support vector machine for forecasting river flow in the semiarid mountain region[J]. Journal of Hydrology, 2014, 509: 379-386.

DOI

[19]
Pandey A, Srinivas V V. Use of data driven techniques for short lead time streamflow forecasting in Mahanadi Basin[J]. Aquatic Procedia, 2015, 4: 972-978.

DOI

[20]
Shen C P. A transdisciplinary review of deep learning research and its relevance for water resources scientists[J]. Water Resources Research, 2018, 54(11): 8558-8593.

DOI

[21]
李鸿雁, 刘寒冰, 苑希民, 等. 人工神经网络峰值识别理论及其在洪水预报中的应用[J]. 水利学报, 2002, 33(6): 15-20.

[Li Hongyan, Liu Hanbing, Yuan Ximin, et al. Peak value recognition theory of artificial neural network and its application to flood forecasting. Journal of Hydraulic Engineering, 2002, 33(6): 15-20.]

[22]
Chen C S, Chen B P T, Chou F N F, et al. Development and application of a decision group back-propagation neural network for flood forecasting[J]. Journal of Hydrology, 2010, 385(1-4): 173-182.

DOI

[23]
Chua L H C, Wong T S W, Sriramula L K. Comparison between kinematic wave and artificial neural network models in event-based runoff simulation for an overland plane[J]. Journal of Hydrology, 2008, 357(3/4): 337-348.

DOI

[24]
袁晶, 张小峰. 基于遗忘因子的BP神经网络水文实时预报方法[J]. 水科学进展, 2004, 15(6): 787-792.

[Yuan Jing, Zhang Xiaofeng. Real-time hydrological forecasting method of artificial neural network based on forgetting factor. Advances in Water Science, 2004, 15(6): 787-792.]

[25]
Parisouj P, Mohebzadeh H, Lee T. Employing machine learning algorithms for streamflow prediction: A case study of four river basins with different climatic zones in the United States[J]. Water Resources Management, 2020, 34(13): 4113-4131.

DOI

[26]
Chen S T, Yu P S. Pruning of support vector networks on flood forecasting[J]. Journal of Hydrology, 2007, 347: 67-78.

DOI

[27]
郭俊, 周建中, 张勇传, 等. 基于改进支持向量机回归的日径流预测模型[J]. 水力发电, 2010, 36(3): 12-15.

[Guo Jun, Zhou Jianzhong, Zhang Yongchuan, et al. Daily runoff forecast based on improved support vector machine regression model. Water Power, 2010, 36(3): 12-15.]

[28]
Kumar P S, Praveen T V, Prasad M A. Artificial neural network model for rainfall-runoff: A case study[J]. International Journal of Hybrid Information Technology, 2016, 9(3): 263-272.

[29]
Lin G F, Chen G R, Huang P Y, et al. Support vector machine-based models for hourly reservoir inflow forecasting during typhoon-warning periods[J]. Journal of Hydrology, 2009, 372(1-4): 17-29.

DOI

[30]
Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.

DOI PMID

[31]
张力, 王红瑞, 郭琲楠, 等. 基于时序分解与机器学习的非平稳径流序列集成模型与应用[J]. 水科学进展, 2023, 34(1): 42-52.

[Zhang Li, Wang Hongrui, Guo Beinan, et al. Integrated model and application of non-stationary runoff based on time series decomposition and machine learning. Advances in Water Science, 2023, 34(1): 42-52.]

[32]
Hunt K M R, Matthews G R, Pappenberger F, et al. Using a long short-term memory (LSTM) neural network to boost river streamflow forecasts over the western United States[J]. Hydrology and Earth System Sciences, 2022, 26(21): 5449-5472.

DOI

[33]
Feng D P, Fang K, Shen C P. Enhancing streamflow forecast and extracting insights using long-short term memory networks with data integration at continental scales[J]. Water Resources Research, 2020, 56(9): e2019WR02 6793. doi: 10.1029/2020WR027590.

DOI

[34]
Ma K, Feng D P, Lawson K, et al. Transferring hydrologic data across continents-leveraging data-rich regions to improve hydrologic prediction in data-sparse regions[J]. Water Resources Research, 2021, 57(5): e2020WR028600. doi: 10.1029/2020WR028600.

DOI

[35]
Gauch M, Kratzert F, Klotz D, et al. Rainfall-runoff prediction at multiple timescales with a single long short-term memory network[J]. Hydrology and Earth System Sciences, 2021, 25(4): 2045-2062.

DOI

[36]
任成清, 马建国, 张冲, 等. 基于LSTM神经网络与蒙特卡罗模型的辽河源头区径流预测[J]. 水电能源科学, 2021, 39(11): 40-43.

[Ren Chengqing, Ma Jianguo, Zhang Chong, et al. Runoff prediction of source area of Liaohe River based on LSTM neural network and Monte Carlo model. Water Resources and Power, 2021, 39(11): 40-43.]

[37]
黄克威, 王根绪, 宋春林, 等. 基于LSTM的青藏高原冻土区典型小流域径流模拟及预测[J]. 冰川冻土, 2021, 43(4): 1144-1156.

DOI

[Huang Kewei, Wang Genxu, Song Chunlin, et al. Runoff simulation and prediction of a typical small watershed in permafrost region of the Qinghai-Tibet Plateau based on LSTM. Journal of Glaciology and Geocryology, 2021, 43(4): 1144-1156.]

DOI

[38]
Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors[J]. Nature, 1986, 323: 533-536.

DOI

[39]
Werbos P J. Generalization of backpropagation with application to a recurrent gas market model[J]. Neural Networks, 1988, 1(4): 339-356.

[40]
Zhao Z, Chen W H, Wu X M, et al. LSTM network: A deep learning approach for short-term traffic forecast[J]. IET Intelligent Transport Systems, 2017, 11(2): 68-75.

DOI

[41]
Fischer T, Krauss C. Deep learning with long short-term memory networks for financial market predictions[J]. European Journal of Operational Research, 2018, 270(2): 654-669.

DOI

[42]
Kratzert F, Klotz D, Brenner C, et al. Rainfall-runoff modelling using Long Short-Term Memory (LSTM) networks[J]. Hydrology and Earth System Sciences, 2018, 22(11): 6005-6022.

DOI

[43]
Bauer E, Kohavi R. An empirical comparison of voting classification algorithms: Bagging, boosting, and variants[J]. Machine Learning, 1999, 36(1/2): 105-139.

DOI

[44]
胡庆芳, 曹士圯, 杨辉斌, 等. 汉江流域安康站日径流预测的LSTM模型初步研究[J]. 地理科学进展, 2020, 39(4): 636-642.

DOI

[Hu Qingfang, Cao Shiyi, Yang Huibin, et al. Daily runoff predication using LSTM at the Ankang Station, Hanjiang River. Progress in Geography, 2020, 39(4): 636-642.]

[45]
Mandeville A N, O'connell P E, Sutcliffe J V, et al. River flow forecasting through conceptual models part III: The Ray catchment at Grendon Underwood[J]. Journal of Hydrology, 1970, 11(2): 109-128.

DOI

[46]
Gao S, Huang Y F, Zhang S, et al. Short-term runoff prediction with GRU and LSTM networks without requiring time step optimization during sample generation[J]. Journal of Hydrology, 2020, 589: 125188. doi: 10.1016/j.jhydrol.2020.125188.

DOI

[47]
Xu X D, Lu C G, Shi X H, et al. World water tower: An atmospheric perspective[J]. Geophysical Research Letters, 2008, 35(20). doi: 10.1029/2008GL035867.

DOI

文章导航

/