新闻资讯

模块化建模框架中水文模型结构的先验选择

1 简介
模块化降雨径流建模框架已被广泛使用,为不同流域的建模提供更灵活的方法。这些框架由模型结构或模型结构元素组成,可以以各种方式组合以代表不同的主要水文过程(通常在流域规模)。一些更广泛使用的框架包括模块化建模系统(MMS)(Leavesley等人,2017)。引文1996),降雨径流建模工具箱(RRMT)(Wagener等人。引文2001),理解结构错误的框架(FUSE)(Clark等人,2001 )。引文2008),流域建模框架(CMF)(Kraft等人。引文2011),SUPERFLEX(Fenicia等人。引文2011年,卡维茨基和芬妮西亚引文2011),统一多种建模替代方案的结构(SUMMA)(Clark等人, 2011 )。引文2015年a,引文2015b),生态水文模拟环境(ECHSE)(Kneis引文2015),水文框架预测的动态通量和 ConnectIvity(DECIPHeR)(Coxon等人,2015) 。引文2019),非平稳降雨径流工具箱(NRRT)(Sadegh等人,2019) 。引文2019),降雨径流模型工具箱的模块化评估(MARRMoT)(Knoben等 人,2019) 引文2019)和 RAVEN(Craig等人, 2019) 。引文2020)等。这些框架的空间分辨率、模型结构和所包含的结构元素、构成模型结构的组件的粒度以及其他方面(例如所包含的优化或不确定性量化工具)各不相同。

任何模块化建模练习的第一步都是选择要考虑的模型结构(或模型结构组件),因为它们应该是所研究系统的潜在表示并且适合建模目标。我们可能会假设一个框架非常灵活,可以反映任何系统,但即便如此,一些预先选择可能有助于避免测试已经被认为是先验不合适的模型结构,例如那些基于流程感知的模型结构,但这些模型结构并不适用。存在于研究领域中——避免由于错误的原因而得到正确的结果(例如 Grayson等人,2017)。引文1992年,基什内尔引文2006)。嵌入底层系统感知模型中的经验是识别流域等系统之间差异的一种方法(Seibert 和 McDonnell)引文2002年,贝文和查佩尔引文2021,瓦格纳等人。引文2021年,芬尼西亚和麦克唐纳引文2022)。在这种情况下,一个反复出现的问题是,各种多模型研究发现,对于特定的流域,没有一个特定的模型比所有其他模型表现得更好,并且我们可能只会发现一些基本趋势,即具有更多参数的模型具有更大的拟合灵活性降雨-径流关系(例如 Perrin等人,引文2001 年,科拉特等人。引文2012年,范埃斯等人。引文2013年,Orth等人。引文2015)。然而,即使这样的结论也并不总是明确的,并且由于某些过程表示的充分性而变得更加复杂(Knoben等人,2017)。引文2020)。因此,流域类型和表现良好的模型结构之间通常没有明确的关系(例如 Nicolle等人,2014)。引文2014年,莱伊等人。引文2016,诺本等人。引文2020)。迄今为止研究较少的一个方面是,此类研究中包含的模型结构的实际选择可能会增加模型性能的等效性问题,因此可以通过更好的先验选择来减少该问题。

迄今为止,上述两个模块化建模框架已在英国的多项研究中使用——RRMT(Wagener等人, 2017) 。引文2001年,李等人。引文2005)和 FUSE(Coxon等人。引文2014,莱恩等人。引文2019)框架。前一个框架是专门为英国开发的,该地区大部分流域面积较小,气候温和,而后者则包括基于全球使用的模型的更广泛的模型组件(更多详细信息在方法部分给出)。Lee等人使用 RRMT。(引文2005)在英国 28 个流域测试了 12 个模型结构。作者无法找到流域类型和模型结构之间关系的证据,尽管他们确定了一个比其他模型表现更好的子集。李等人。(引文2005)仅使用可用于测量和未测量的英国流域的描述符(面积、区域基流指数和平均降雨量)来表征流域类型,这些描述符在表征水文差异方面价值有限(Addor等, 2005 )。引文2018)。Coxon等人使用 FUSE 框架。(引文2014)评估了英格兰和威尔士 24 个不同流域的 78 个模型结构的性能。他们发现统计模型的性能随着流域湿度的增加而增加,并且只有某些模型结构在基流主导的流域中提供了良好的模型性能。此外,他们强调了识别更多信息签名以更好地识别模型(在测量流域中)的可能性。莱恩等人。(引文2019)跟进了 Coxon等人的研究,从 FUSE 框架中仅选择了四种模型结构,但在 1000 多个英国 (GB) 流域中实施了它们。英国所有四个模型的性能模式非常相似。它们在较湿润(较干燥)的流域中表现更好(更差),并且在地下水渗漏到邻近流域的流域中表现尤其差,而模型结构没有考虑到这一点。尽管不同类型流域的这些模型结构之间存在一些性能差异,但作者无法通过模型结构/复杂性差异来解释它们。

在本研究中,我们的目的是测试多模型研究中模型结构之间的区别在多大程度上取决于预先选择的模型结构。换句话说,我们想研究先验模型选择步骤(即决定哪些模型结构将包含在多模型研究中)对于我们观察模型结构之间相关性能差异的能力的重要性。为此,我们比较了蒙特卡罗框架中 998 GB 流域的两个模块化降雨径流建模框架(及其包含的模型结构)的性能。为了进行比较,我们从 RRMT 中选择了六种模型结构(Wagener等人,2017)。引文2001 )并将这些结果与 Lane等人报告的四种 FUSE 模型结构的模拟结果进行比较。(引文2019)。然后,我们尝试使用水文特征来解释模型结构之间产生的差异——作为比流域属性提供更多信息的描述符。莱恩等人。(引文2019)使用了类似复杂性的模型结构,发现它们的过程表示之间没有明显的差异,这些差异可以很容易地与我们对英国各地不同主导水文过程的看法联系起来。我们假设不同的先验模型选择将提高我们区分跨流域类型的模型结构性能的能力。因此,我们正在努力克服 Lane等人研究后留下的两个问题。(引文2019):(1)渗漏流域缺乏性能良好的模型结构;(2) 模型结构和流域类型之间缺乏独特且与水文相关的性能差异。

2 数据、模块化建模框架和方法
2.1 数据和水文特征
在本文中,我们分析了英国各地与 Lane等人选择的相同的流域。(引文2019)以确保我们结果的可比性。这些流域选自国家河流档案(生态与水文中心)引文2020年)基于流量时间序列的质量和可用性。它们代表了地形、地质和气候方面的各种流域特征,从而捕获了整个英国发现的大部分变化。在英国,年平均降水量从西北向东南递减,范围为550-3600毫米/年。相反,年平均潜在蒸散量(PET)从西北向东南增加,范围为 380-570 毫米/年。鉴于降水减少和 PET 增加,径流系数(定义为以径流形式离开集水区的降水的平均比例)从西北(平均 0.8)到东南(平均 0.3)减少。径流状况不仅受到气候的影响,还受到地形流域范围之外的地下水相互作用的影响,东南部存在高渗透性含水层,导致地下水为主的地区。英格兰东南部和中部地区的水流进一步受到人类改造的影响,例如抽水、污水排放(即污水回流)、城市化和/或水库。大多数 (>90%) 流域很少甚至没有降雪,即所有降水量中只有不超过 5% 以雪形式降落,导致降雪比例不超过 0.05 (Coxon等人。引文2020)。苏格兰只有 12 个集水区的积雪分数高于 0.1,最高可达 0.17(Coxon等,2017)。引文2020)。

我们使用 21 年(1988 年 1 月 1 日至 2008 年 12 月 31 日)的每日降雨量、径流和 PET 时间序列来覆盖与 Lane等人使用的相同时间段。(引文2019)。每日降雨量和 PET 数据来自生态和水文区域降雨量网格估算中心 (CEH-GEAR)(Tanguy等人,2017)。引文2021)和气候水文学和生态学研究支持系统潜在蒸散量(CHESS-PE)(Robinson等人, 2021 )。引文2015a),分别。使用 Penman-Monteith 方程 (Monteith引文1965)对于浇水良好的草地表面(Allen等人,1965 )引文1998)与来自气候水文学和生态学研究支持系统数据集(CHESS-met)的气象数据(Robinson等人, 1998 )。引文2015年a,引文2015b)。来自国家河流档案馆 (NRFA) 的每日观测水流数据用于评估模型性能(生态与水文学中心引文2020)。

为了比较不同流域类型的模型结构性能,我们根据过去发现有助于区分英国流域的四种水文特征来组织流域(Coxon等人,2017)。引文2014 年,麦克米伦等人。引文2022年):基流指数(BFI)、径流比(RR)、水平衡赤字(dRR)和流量持续时间曲线斜率(FDC斜率)。我们选择这些水文特征是因为它们提供的有关流域径流过程的信息有所不同。RR代表降水转化为径流的比例,BFI代表源自地下水的径流比例。dRR 表明集水区产生的径流是否比仅基于气候的预期更多或更少,而 FDC 的斜率表明集水区是否具有更多或更少的闪现(即可变)流态(例如 Yadav 等人,2015)。引文2007)。我们进一步使用来自英国水文登记册(Marsh 和 Hannaford)的水流衍生 BFI 值引文2008)。

对于每个流域,我们计算其长期水平衡(即径流比,RR = Q/P)、干旱指数(AI = PET/P)和 FDC 斜率(第 33-66 个百分位;Sawicz 等人。引文2011)使用每日降水量 P、潜在蒸散量 PET 和水流 Q 数据得出的值。我们还使用 Turc-Mezentsev 曲线仅根据气候计算预期水平衡(预期 RR)。Turc-Mezentsev 曲线基于广泛研究的 Budyko 框架(Budyko引文1961)。它为流域水平衡的能源和水限制提供了参考条件。水平衡不受除气候之外的其他自然或人为控制影响的流域预计将沿着位于水限制 (AET = P) 和能量限制 (AET = PET) 之间的 Budyko 曲线绘制,其中 AET 代表实际蒸散量。同样,Turc 和 Mezentsev 将长期平均蒸发量与长期平均降水量联系起来(Mezentsev引文1955年,图尔克引文1955)。由于在流域尺度上无法测量实际蒸散量,因此我们使用 1 − (Q/P) 作为响应项来调整公式,而不是原始公式中使用的 AET/P。这种调整也用在以前的研究中(例如Lebecherel等人,2014)。引文2013,格南等人。引文2019)并通过计算实际(即观测到的)径流比值与预期径流比值之间的差异(即增量RR)来量化流域内的水损失或增益。

2.2 模块化建模框架
在这项研究中,我们选择了一组最小的模型结构,涵盖了我们英国研究领域的主要水文过程范围。我们希望确保模型结构具有不同程度的复杂性(即参数数量)来表示这些主要水文过程,并且模型结构选择(例如流量演算模块的类型)可以单独评估以证明影响不同模型结构模块对模型性能的影响。

为了实现这些目标,我们首先从 RRMT 中选择模型结构(图1(一))(瓦格纳等人。引文2001)。RRMT 是一个灵活的建模框架,允许用户通过结合土壤湿度核算和中低复杂度的流量路由模块来开发不同复杂程度的模型结构(Wagener 等人,2017) 。引文2004)。我们从工具箱中选择了六种模型结构,由两个土壤湿度核算模块和三个流量路由模块的不同组合组成。土壤湿度核算模块(PEN(即基于 Penman 干燥曲线的模型)和 PDM(即概率分布式模型))基于英国流域的长期经验(参见 Wagener 等人的讨论)。引文2004年,李等人。引文2005年,摩尔引文2007)并捕获整个英国的关键径流生成过程。流量演算模型(CRES(即概念性水库)、2PAR(即两个并行的概念性水库)和 LEAK(即渗漏含水层模型结构))捕获一到两个线性水库和渗漏演算组件的不同复杂程度,以反映不同的复杂性。由于英国各地不同的土壤和区域含水层而产生的流动路径(摩尔引文2007)。下面对模型结构模块进行详细说明,各模块的参数列于补充材料表S1中。

PEN 是一种简约的两层结构,基于彭曼根据在英国土壤中观察到的干燥模式开发的经验干燥曲线概念(引文1949)。上层和下层分别代表根区和无限的土壤库。彭曼分析了英国的土壤(引文1949)发现只要根区水库中有水,实际蒸散量就会接近潜在速率。当上部存储耗尽时,实际费率会降至潜在费率的很小百分比(8%)。有效降雨——降雨中有助于径流的部分——以两种方式产生:要么作为降雨旁路,代表诸如地下水快速补给或河流附近降雨等过程,要么作为饱和过量径流,当两者同时发生时产生商店都满了。模型参数定义根区存储的大小 S max1和旁路流量的分数 φ。

PDM 是概率分布的土壤湿度核算组件,它使用存储深度的分布来表示典型潮湿流域土壤湿度存储的变异性(Moore引文2007)。有效降雨是从蓄水池溢出而产生的,其被描述为基于两个参数的帕累托分布:最大蓄水容量 C max和描述分布形状的参数 b。

存在三种不同的路由组件。首先,CRES 是仅由时间常数定义的单个线性水库。2PAR是两个线性水库并行路由的组合,一个代表快流,另一个代表慢流。有效降雨量根据参数 a 进行分布,该参数描述了通过快速水库的流量分数,而两个水库均由时间常数定义。第三,LEAK 是一个渗漏含水层路由组件,它允许模型考虑流域水平衡未关闭时的情况。底部出水口的流量代表集水区的渗漏,而中部和上部出水口则有助于引导有效降雨。

FUSE 建模框架提供的四种模型结构(Clark等人.引文2008)并被 Lane等人使用。(引文2019)显示在图1(b)。这些模型结构基于四种水文模型,即 TOPMODEL(Beven 和 Kirkby引文1979),可变渗透能力(ARNO/VIC)(Liang等人,2014)。引文1994年,托迪尼引文1996),降水径流模拟系统(PRMS)(Leavesley等人。引文1983)和萨克拉门托(Burnash等人。引文1973)。模型参数的详细信息列于补充材料表 S2 中。Lane等人描述了建模决策。(引文2019 年,表 3)。尽管这些模型具有相似的复杂性,但它们的结构在上下土层的结构以及蒸发、地表径流、渗流、互流和基流等水平衡分量的参数化方面有所不同。由于只有一小部分流域 (1%) 的积雪分数高于 0.1,并且可能受到积雪影响,因此从 RRMT 或 FUSE 框架中选择的任何模型结构中均未使用积雪模块。

FUSE 框架中的模型方程通过 Newton-Raphson 方法的隐式版本求解(参见 Clark等人的附录 A) 。引文2008)。RRMT框架的土壤水分核算和路由模块中的方程是一阶方程,在MATLAB编程环境中求解(Wagener等人,2014)。引文2001)。然而,我们的重点不是分析两个框架之间的相对性能,而是分析每个框架内模型结构之间的差异。每个框架在其模型结构中都使用一致的策略,这意味着模型结构之间的差异应该与数值实现无关。

2.3 方法
2.3.1 设置
为了能够与 Lane等人的结果进行比较。(引文2019)我们复制了作者使用的建模设置。因此,本研究中六个模型结构的 10 000 个参数是从均匀分布中独立随机采样的。21年期间(1988年至2008年)的前五年被用作热身期。

2.3.2 模型性能评估
在这项研究中,至关重要的是能够比较多个流域的多个模型结构的性能,并使结果与 Lane等人进行比较。(引文2019)。考虑到这一点,我们使用 Nash-Sutcliffe (NSE)——这是 Lane等人使用的。(引文2019) - 和 Kling-Gupta (KGE) 效率指标,因为它们是标准化且无单位的指标,可以比较跨流域的模型性能。这两个指标都是针对 1993 年至 2008 年期间计算的。我们只拥有基于 NSE 的 Lane等人的最佳运行结果。(引文2019)研究,这就是为什么我们计算这些值的 KGE 值并且不单独确定最佳 KGE 运行的原因。

为了确定特定模型结构的性能(使用 KGE 或 NSE 测量)是否随特定水文特征的大小而变化(第 2.1 节),可以简单地创建一个相对于另一个的散点图,但存在大量噪声使得人们很难看到趋势。因此,我们对数据进行平滑处理,以降低流域间变异性的影响,以便可以更清楚地观察模型结构相对性能差异的增加或减少趋势之间的分离(例如 Burn 和 Elnur)引文2002)。如果不进行平滑处理,则很难观察散点图上的增加和减少趋势(参见补充材料,图S1)。我们使用非参数局部加权回归(LOWESS)方法,其中包括双平方权重函数,以最大限度地减少平滑值中异常值的影响(克利夫兰引文1979 年,考克森等人。引文2015)。有关 LOWESS 平滑过程的详细信息在补充材料中进行了解释,并如图 S1 所示。我们发现 40 个流域的平滑窗口大小反映了流域之间的性能变化,而不会过度平滑结果。然后我们计算每个模型结构与最佳模型结构(即具有最高平滑NSE或KGE值的模型结构)之间的性能差异(即NSE或KGE差异)。

3 个结果
3.1 GB 范围内的 RRMT 和 FUSE 性能
首先,我们比较两个框架的模型结构在 GB 上的性能。而莱恩等人。(引文2019)在他们的分析中包括了 1013 个流域,我们删除了 15 个流域,因为它们的径流比值不切实际(即 RR > 1)或因为所有模型结构都不起作用(即 NSE < 0)。我们假设这些问题是由未知且无法解释的人为影响引起的。图2(一) 和 (乙)分别显示了 RRMT 和 FUSE 框架的所有模型结构对于 998 GB 流域的最佳 NSE 性能。两个框架都模拟了 95% 的研究流域,其 NSE 值高于 0.5,如图所示图2(c)。更复杂的 FUSE 模型在两个框架都实现高 NSE 值的流域中表现稍好。

模型性能的空间模式图2(一) 和 (乙)大体相似。然而,在英国东南部有 40 个流域,我们发现框架之间存在较大的性能差异(即 > ± 0.2 NSE)(参见补充材料,图 S2(a) 和 (c))。其中 28 个中,RRMT 框架获得了最高的 NSE 值,并且显着高于 FUSE 框架获得的值(即 NSE 差异 > 0.2)。其中80%以上的流域具有高渗透性地质,覆盖了各自流域面积的60%以上。其中,有 6 个流域的 FUSE 模型表现特别差(即 NSE < 0),但 RRMT 能够模拟 NSE > 0.7 的水流。在这个白垩质地区,流域大多以基流为主,其中一些流域通过区域地下水流流失水量。

苏格兰东北部和中部以及威尔士北部的一些流域也出现了较低的 NSE 值,这可能是由于降雪或水库造成的。苏格兰东北部有三个流域(即雪分数 > 0.1),其模型性能显示 NSE 值小于 0.5。鉴于这些只是近 1000 个流域中的三个,我们没有进一步关注这一点。为了更详细地研究水库的影响,我们研究了两个与水库相关的描述符之间的关系(水库上游的贡献面积和标准化的上游容量;Salwey等人,2017 )。引文2023 年)以及 RRMT 和 FUSE 模型结构为 252 个流域获得的最高 NSE 分数(请参阅补充材料)。我们发现,水库距离流域出口越近,模型性能略有下降,水库越大,模型性能下降越小(图S4)。然而,性能变化的可变性非常大,并且需要考虑其他方面,例如储层管理,以将储层添加到此处使用的模型中(例如 Payan等人,2017)。引文2008),这超出了本研究的主要目的。

我们还计算了最佳 NSE 模型运行的 KGE 值以进行比较(图2(c) 和 (乙))和图S3。总体而言,与英国各地的 NSE 值相比,它们表明了相似的模式。然而,图2(d)表明 RRMT 具有大量 KGE 值 > 0.4 的集水区,并且两个框架在 KGE > 0.8 后具有非常相似的分布,而 FUSE 具有大量 NSE 值 > 0.6 的集水区(图2(c))。在比较 NSE 和 KGE 值时,RRMT 和 FUSE 框架之间的性能差异并不完全一致,因为 NSE 和 KGE 值是根据每个流域中产生最佳 NSE 的模拟计算得出的,因为 NSE 和 KGE 之间的公式不同。虽然流的偏差、方差和相关分量在 KGE 公式中具有相同的权重,但它们在 NSE 公式中的权重不同(即方差项在 NSE 中比其他项更占主导地位)(Gupta 等人,2016) 。引文2009)。此外,对于不同的流域,NSE 和 KGE 之间的关系会有所不同,主要取决于观测到的水流的变异系数(Knoben、Freer 和 Woods)引文2019年;拉蒙塔涅等人。引文2020)。拥有更复杂的模型结构(即具有更多数量的参数)可能会为 FUSE 提供比 RRMT 更强的捕获流方差的能力,当三个组件的权重不同时(即在 KGE 中),这种差异就会消失。

3.2 将模型结构性能与水文特征和流域特征联系起来
图3和图5显示了六种 RRMT 模型结构(PEN+2PAR、PEN+LEAK、PEN+CRES、PDM+2PAR、PDM+LEAK、PDM+CRES)和四种 FUSE 模型结构(TOPMODEL、ARNO/VIC、 PRMS、SACRAMENTO)与每个框架中表现最佳的模型结构相关。我们根据四个水文特征绘制这些结果——(a) BFI、(b) dRR、(c) RR 和 (d) FDC 斜率——这些特征在过去已被证明对英国环境提供了信息(Yadav 等人,2017 )。引文2007)。我们以两种不同的方式可视化结果。左边的列图3和图5显示模型结构性能的散点图,以百分比差异的形式与表现最佳的模型(在每个框架中)相比,在第 2.3.2 节中描述的平滑过程后针对水文特征进行比较已被应用。左列还显示了 10% 的阈值,以可视化(作为水平虚线)哪些模型结构的性能相似(即,相对于最佳模型结构,NSE 差异小于 10%,该模型具有最高的性能) NSE 值)。选择 10% 是一个主观决定(仅用于可视化目的),但与我们尝试的其他阈值(即 5%、8%、15%)相比,使用该值的模型结构的性能之间观察到更清晰的分离,如图所示补充材料,图 S5。面板条形图显示在右列中图3和图5指示与所选属性的最佳性能结构相比,哪些模型结构显示 NSE 差异小于 10%,以更好地显示哪些模型结构作为不同签名值的函数不再表现良好。998 GB 流域的 BFI、dRR、RR 和 FDC 斜率的直方图在补充材料图 S6 中给出。

六种 RRMT 模型结构的性能水平之间存在明显的区别。我们发现包含并行流路由模块来表示快流和慢速流的模型结构(即 PEN/PDM+2PAR)和具有泄漏流路由模块的模型结构(即 PEN/PDM+LEAK)在 139 个流域中优于其他模型具有高基流贡献 (BFI > 0.7) (图3(一))。两种结构都允许较慢的响应,从而获得更好的基流表示。对于较小的 BFI 值(即 BFI > 0.4,244 个流域),所有模型结构都具有相似的性能(即 NSE 差异 < 10%),这表明具有单个路由水库(即 PEN/PDM+CRES)的模型结构就足够了。图3(b)表明,在 62 个流域中,PEN/PDM+LEAK 的表现优于其他模型,其 dRR 值显着为负(dRR < -0.2,表明地下损失或大型抽取)。具有漏流路由模块的模型结构在失水的集水区中表现最佳。有趣的是,只有 PDM+2PAR 在 19 个水增益较高的流域(即 dRR > 0.2)中表现优于其他模型,这表明该模型在径流生成和路由方面的灵活性比其他模型结构能够更好地捕捉这种情况。

为了更详细地探索这些相互作用,图4显示了 PEN/PDM+2PAR 和 PEN/PDM+LEAK 的 BFI、dRR 与模型性能之间的关系。我们发现,使用 PEN/PDM+2PAR 时,大多数 (~66%) 具有高 BFI 值(即 BFI > 0.7)的流域具有较高的 NSE 值。PEN/PDM+LEAK 优于 PEN/PDM+2PAR 的 dRR 值非常负(即 dRR < -0.2)。这意味着某些流域具有高 BFI 和非常负的 dRR 值,并且 PEN/PDM+LEAK 优于这些流域中的其他 RRMT 模型。

同样,对于 391 个具有高径流比值 (RR > 0.6) 的流域,所有模型结构的 NSE 差异均 < 10%,但具有 PE​​N 模块(即 PEN+LEAK/CRES)的两个模型结构除外,其中 22 个流域的 NSE 差异 > 10%。 RR > 0.9 的流域(图3(c))。由于水管理活动(例如污水回流、地下水增加等),三个RR > 0.9 的集水区往往会获得大量水(即dRR > 0.4),这使得这些集水区人为湿润。基于 Penman 干燥曲线(即 PEN+LEAK/CRES)的简单模型结构在此失败。可能的原因是 PDM 模块通过其分发功能表现出更大的灵活性,尽管这可能是出于错误的原因。如果忽略这些人工湿润的集水区,则所有模型结构在湿润的集水区中都表现良好。因此,具有用于流路由的单个概念库的最简单的模型结构(即PEN/PDM+CRES)已经适合这些条件。在 RR 范围的另一端(即 RR < 0.2,42 个集水区),

最后,图3(d)表明,除了具有单个流路水库的最简单的模型结构(即 PEN/PDM+CRES)之外,所有模型结构在显示非常高的水流变化的流域中都表现良好。较大的水流变化与较大的 FDC 斜率相关(即 FDC 的斜率 > 4、33 个集水区)。在此特征的另一端,只有具有 2PAR 和(在较小程度上)LEAK 的 PDM 模型似乎能够捕获水流变化的缺乏(即 FDC 值的斜率较低,FDC < 1, 17 流域的斜率) 。有趣的是,这不仅仅是路由函数的问题,还需要灵活的径流生产函数(即PDM)。

四种 FUSE 模型结构(TOPMODEL、ARNO/VIC、PRMS、SACRAMENTO)之间也存在一些分离,尽管它们与水文过程差异没有明显关系。我们发现 ARNO/VIC 在所有 BFI 值上都表现良好,并且在 BFI 值较高(BFI > 0.7)的 139 个流域中优于其他流域。很难解释为什么这个模型结构在基流主导的流域中优于其他模型结构,因为所有四个模型都具有慢流成分,如图所示图1(b)。在 BFI 值的下限(即 BFI < 0.4,244 个流域),所有 FUSE 模型结构都在 10% NSE 差异范围内,因此没有显着差异(图5(一))。

有趣的是,ARNO/VIC 模型的性能在广泛的流域行为中都相当稳健。在 RR 和 FDC 值斜率的整个范围内,它的性能优于或足够接近(10% 以内)性能最佳的模型(图5(c) 和 (d))。此外,TOPMODEL 实现适用于所有 RR 值,而其他两个模型仅适用于稍窄的 RR 值范围。我们从 Lane等人的研究中得知(引文2019)认为 TOPMODEL 可以产生偏差较小的模拟,但其性能优势的原因尚不清楚。除了 ARNO/VIC 之外,似乎没有特定的模型结构在 22 个流域中具有非常高 RR 值的情况下优于其他模型结构。这又是由于我们上面讨论的三个人工湿润集水区(图3(c))。如果没有这些集水区,所有 FUSE 模型结构都在 10% NSE 差异范围内。如果水平衡与我们仅使用气候预测的水平衡偏差超过约 20%(即 dRR 值 > +0.2/ < -0.2,19/62 流域),则萨克拉门托和 PRMS 模型就会陷入困境(图5(b))。因此,这些模型对水平衡问题非常敏感。ARNO/VIC 和 TOPMODEL 在这方面很稳健,尽管分别针对负 dRR 值和正 dRR 值。最后,在拟合通过 FDC 斜率表示的流量变化时,ARNO/VIC、TOPMODEL、SACRAMENTO 和 PRMS 的效果越来越差(按此顺序)(图5(d))。除 PRMS 外,所有模型结构在 FDC 值斜率较高的 33 个流域中均表现良好(图5(d))。

为了确保我们的结果对不同性能指标的稳健性,我们重新创建图3和图5使用 KGE 差异(参见补充材料,图 S7 和 S8)。当我们比较模型结构的 NSE 和 KGE 差异(使用最佳 NSE 模型)时,我们发现 RRMT 和 FUSE 模型结构的性能分离之间存在一些差异。例如,当使用 KGE 时,PEN+CRES 似乎对于较低的 RR 值表现更好,而与使用 NSE 相比,PEN+2PAR 似乎在此区域表现更差。此外,虽然在基于 NSE 值的 FDC 值斜率较高的流域中,PEN/PDM+2PAR 似乎优于 PEN/PDM+CRES,但基于 KGE 值的情况并非如此。当我们查看 FUSE 模型结构时,我们还观察到它们的性能分离存在一些差异。例如,当在 FDC 值的高斜率(即 > 4)中使用 KGE 而不是 NSE 时,ARNO/VIC 的性能并不优于 PRMS。而且,基于 NSE,TOPMODEL 和 PRMS 分别在 0 < RR < 0.2 和 0.4 < RR < 0.6 范围内的 10% 阈值内,而基于 KGE 值则并非如此。这些发现表明,使用 KGE 而不是 NSE 会在模型结构相对于评估的签名的性能分离方面产生一些差异。然而,在检查定义特定流域类型(即基流主导、泄漏、潮湿)的特征范围时,在基流主导流域中使用 KGE 而不是 NSE 时,只有 PEN+2PAR (RRMT) 和 SACRAMENTO (FUSE) 显示出不同的性能分离(即 BFI > 0.7)。使用 KGE 或 NSE 时,两个框架的其他模型结构在所有流域类型中都显示出相同的分离。

最后一个问题是我们是否可以预测本研究中使用的水文特征(即 dRR、RR、BFI 和 FDC 的坡度),以便我们可以将我们所学到的知识应用于未测量的流域。在 GB 设置中,BFI 是根据 BFI-HOST(即源自 29 类土壤类型水文学 (HOST) 分类的基流指数)框架中的物理流域特性进行预测的(Marsh 和 Hannaford)引文2008)。这些 BFI-HOST 值表明与我们在研究中使用的 BFI 值有很强的相关性,如图补充材料图 S9(a) 所示,而 RR 显示出对 AI 的强烈依赖性,如图 S9(b) 所示。然而,鉴于不同的物理特性和人类活动可能会影响这种偏差,我们无法确定单个物理属性或合理的属性组合来预测未计量流域的 dRR。渗漏(dRR < -0.2)和增益(dRR > 0.2)集水区的径流受到地质差异和不同水管理实践(例如抽水、水库和污水回流)的影响(参见补充材料,图S10)。然而,迄今为止尚未评估此类做法对英国流域的净影响。

4。讨论
我们比较了两个模块化建模框架,以分析先验模型结构选择对与英国流域类型相关的性能分离的影响。在模型性能的直接比较中,我们发现当两个框架的 NSE 指标都大于 0.5 时,FUSE 结构的性能稍好(结果与以下值相反)。一般来说,FUSE 稍好一点并不奇怪,因为它的模型有 10 到 12 个自由参数,而 RRMT 有 3 到 7 个自由参数。多项研究发现模型性能与免费校准参数的数量之间存在联系(例如 Perrin等人,2017)。引文2001 年,科拉特等人。引文2012 年,Höge等人。引文2018)。然而,我们还表明,正如 Knoben等人发现的那样,对于模型性能而言,参数的数量并不重要。(引文2020),因为在地下损失显着的流域中,包含 RRMT 泄漏路由结构的模型比 FUSE 结构效果更好——尽管它们的参数较少。

我们在此处研究的英国流域内发现的情况的直观总结。BFI > 0.7、dRR < -0.2 和 RR > 0.6 的流域分别为 139 个 (14%)、62 个 (6%) 和 391 个 (40%)。FDC 的坡度没有提供有关模型结构之间分离的附加信息,因为较平坦的坡度也是通常具有较高 BFI 值的集水区。因此,BFI 和 FDC 结果存在大量镜像,这并不能证明包括两者都是合理的。图6(一)表明,RRMT 的六个模型结构在不同流域类型之间相互区分,符合我们对水文差异的预期。相比下,图6(b)表明 FUSE 的一些模型结构在某些流域类型中也优于其他模型结构,但很难解释它们为何不同(正如 Lane 等人先前得出的结论)。引文2019)。原因是没有可识别的结构/行为差异来解释这些模型结构之间的性能差异。RRMT 框架中选择的六种模型结构是从对不同 GB 流域建模的经验演变而来的(Wagener等人,2016)。引文2004年,李等人。引文2005年,摩尔引文2007)。我们的结果表明,这些模型结构更适合特定的流域类型,尽管我们也发现它们不一定比其他模型结构提供更好的性能(除了地下水流失严重的流域的情况)。

其中一些流域类型也被发现在其他地方产生了显着的模型性能。卡维茨基和芬妮西亚(引文2011)和大卫等人。(引文2022)还发现以基流为主的流域需要具有平行水库的路由结构。卡维茨基和芬妮西亚(引文2011)从 SUPERFLEX 框架和固定 GR4H 模型(modèle du Génie Rural à 4 paramètres Journalier)中选择了七个模型结构,并在新西兰和卢森堡的四个流域进行了测试。大卫等人。(引文2022)仅选择了同样来自 SUPERFLEX 的四个模型结构,并对巴西 508 个流域的它们进行了评估。两项研究都根据其研究领域的先验知识和经验选择了模型结构。同样,不同的研究发现,可以使用各种模型结构很好地对湿流域进行建模(例如 Atkinson等人,2017)。引文2002年,卡维茨基和芬妮西亚引文2011,考克森等人。引文2014年,马斯曼引文2020,大卫等人。引文2022)。更具体地说,对于 GB,我们的研究结果与 Lee等人的研究结果相似。(引文2005),他还发现英国各地具有渗透性含水层的集水区需要漏水路由组件,例如白垩纪、侏罗纪石灰岩和石炭纪/泥盆纪岩石。

尽管如此,一些研究(例如Lee等人)引文2005 年,范埃斯等人。引文2013,莱恩等人。引文2019,诺本等人。引文2020)在不同国家(例如英国、法国、美国)进行并使用来自不同模块化框架(例如 RRMT、SUPERFLEX、FUSE、MARRMoT)的模型结构,但无法识别清晰的模型结构与流域类型关系(超出上述 Lee等人案例中的渗透性集水区)。李等人。(引文2005),他使用了英国 28 个流域的 RRMT 的 12 个模型结构,Van Esse等人。(引文2013),他们在 237 个法国流域使用了 SUPERFLEX 的 12 个模型结构加上 GR4H 模型,观察到他们使用的模型结构之间的性能差异,但他们无法建立流域类型与模型结构之间的关系。两项研究都表明,所使用的流域特征不足以反映流域的水文行为。李等人。(引文2005)指出了一些其他可能的原因,例如在他们的研究中做出的其他选择(例如流域数量、适宜性标准)以及使用观测到的降雨径流数据,这些数据不足以代表流域。此外,Lane等人的研究。(引文2019),他使用了来自 FUSE 的 1013 GB 流域的四种模型结构,Knoben等人。(引文2020)使用了 MARRMoT 跨越 559 个美国流域的 36 个模型结构,由于选择了具有相似过程表示或复杂性的多个模型结构,因此无法观察到跨流域类型的模型性能之间的明显差异。

我们的研究结果表明,模块化建模框架可能受益于在其框架中包含特定模型结构、流程模块或系统组件(针对特定领域)的适当策略。对他们来说,明确提供模型结构的过程模块或组件之间的概念差异和相似之处,并建立关于它们可能代表得好或不好的流域类型的期望,可能是有益的。如果这些差异先验不清楚,那么我们随后就不太可能解释模型性能差异。虽然一些模块化建模框架,例如 SUPERFLEX(Fenicia等人。引文2011)和 MARRMoT(Knoben等人。引文2019)提供了有关模型结构的组成部分/通量之间的差异/相似性以及它们可以代表的水文过程的详细信息,这可能还不够。诺本等人。(引文2020)通过为美国 559 个流域预先选择 46 个 MARRMoT 模型结构中的 36 个来调查模型的适用性。他们根据模型结构在每个流域的表现对模型结构进行排名,然后尝试将这些排名与 52 个流域属性(例如水文、气候和物理)相关联。然而,他们无法找到模型排名和流域属性之间的明确关系。他们的研究表明,没有使用合适的水文特征/流域属性来反映其研究领域中不同的水文行为可能是一个原因。我们的结果表明,更加注重预先选择由(尽可能多的)研究领域不同的基于过程的组件组成的模型结构可能是减少这个问题的一种方法。

5。结论
尽管选择模型结构组件的最佳方法仍不清楚,但模块化建模结构广泛流行。可能并不奇怪的是,许多研究发现很难在所考虑的模型结构或结构组件之间找到有意义的分离。在这里,我们假设研究领域(例如英国等地区)内的长期经验可以导致不同模型结构的发展,为先验模型包含提供指导。虽然降雨径流模型通常没有明确演变为模块化框架,但它们至少可以包含在尝试模拟跨异构域的不同流域时所取得的一些经验(例如摩尔引文2007)。因此,我们使用英国经验作为我们研究的指导。

应用以这种方式选择的模型结构,我们发现这些先验选择的模型结构在跨流域的性能方面比之前使用非英国重点模型结构的多模型研究中使用的模型结构在逻辑上更加独立(Lane 等人,2017 )。引文2019)。我们框架的路由组件根据基流贡献的程度分离成单个或并行流组件,而具有显着地下损失的集水区需要泄漏组件。两个土壤湿度核算成分不会那么强烈地分离,除非需要显着的灵活性,在这种情况下 PDM 结构受到青睐(例如,比仅根据气候预期的集水区更湿润)。

我们的结果表明,首先建立跨研究领域(例如 GB)遇到的不同流域(或系统)的感知模型可能会有所帮助(例如 Beven 和 Chappell引文2021,瓦格纳等人。引文2021 年,麦克米伦等人。引文2023)。在这里,我们根据之前在我们的研究领域应用不同模型结构的经验来调整我们的看法。如果不考虑所包含的模型结构中反映的不同感知模型,模块化建模练习可能会简化为知识增益有限的回归类型分析。

发布日期:2024-02-02