新闻资讯
1 简介
业务水文学中的一个典型问题是模拟流域中出现的降雨径流过程,然后将所得的水流过程线通过河流廊道。这种预测对于防洪建筑物、洪水预警系统、河道整治工程等各种水工建筑物的分析和设计具有重要作用。目前正在使用三种基本程序——水文、水力和黑盒建模方法来确定穿过河流廊道的水流过程线(Hasanvand等人, 2015) 。引文2013)。在所引用的三种方法中,与后两种程序相比,水文选路方法具有更简单的结构和数据要求。然而,讽刺的是,假设典型水文模型的流入-储存-流出函数在整个模拟期间和沿河道具有确定且不变的数学结构(Kim 和 Georgakakos)引文2014)。这种假设是值得怀疑的,因为它忽略了自然过程和/或人类活动引起的关系中潜在的系统性变化。在这里,典型的系统性变化被定义为所考虑的系统的结构和/或行为的重大变化(Polhill等人,2014)。引文2016)。从建模的角度来看,这意味着模型结构和/或其参数中的某些转换规则(以前是可以接受的)需要在某个时间点进行调整,以便能够继续正确地捕获系统的动态行为(Verstegen等人。引文2016)。
一般来说,河流和溪流的自然流态正在因水坝、防洪工程和其他人类活动而发生显着改变(Slater等人,2017)。引文2021)。其中,水坝作为河流水势改变的最普遍原因,是控制河道生态完整性和物理性质的主要因素之一(Graf引文2006,左等人。引文2019)。理论上,通过调节、上游流域土地利用和气候变化来改变自然河道的水文状况,可以导致其走廊沿线的物理反应(Poff等,2017)。引文1997年,马修斯和里希特引文2007 年,Buechel等人。引文2022)。对于给定的河段,通过改变河床基质的大小、河流形态和淹没区域,对扰动事件的物理调整可以带来系统性变化,从而影响洪水波在河流廊道内的传播(Hall等,2015)。引文2014,斯莱特等人。引文2015年,冯等人。引文2019)。然而,由于自然渠道变化的渐进性,系统性变化预计将是渐进的。此外,由于受到固有阻力、可用能量、河流系统的空间范围和扰动事件严重程度等多种因素的影响,响应路径被认为是高度波动的且知之甚少(Poeppl等人,2014)。引文2017)。有鉴于此,如果河流系统经历干预,为了证明路由模型的逻辑应用合理性,至关重要的是能够确定其结构是否足以模拟系统在干扰后条件下的功能行为或不是。
抛开适用于不同空间和时间尺度的质量平衡方程不谈,典型水文路径模型的结构充分性与选择适当的流入-储存-流出函数高度相关(Singh 和 Scarlatos引文1987年,瓦坦卡引文2021)。因此,为了解决上一段提到的研究空白,需要一种诊断方法来适当地识别模型执行的时间段,在此期间流入-存储-流出函数不足以代表系统行为。为此,一种可能的策略是利用数据同化 (DA) 框架(Gustafsson)获得的内部诊断信息引文2000年,西蒙引文2006 年,Reichle等人。引文2008)。水文文献中最常见的诊断程序之一是分析创新序列的统计特性(Rajaram 和 Georgakakos引文1989 年,乔治卡科斯等人。引文1990 年,巴茨等人。引文2004 年,贝内特等人。引文2013年,弗鲁特和萨德引文2013)。
这种诊断方法基于这样的假设:如果假设的状态空间模型具有正确的结构和参数,则其创新序列将是具有已知协方差矩阵的零均值白色随机过程(Gustafsson引文2000年,西蒙引文2006)。从顺序DA的角度来看,创新被定义为提前一步预测残差,并且可以解释为保存新信息的测量的一部分(Meditch引文1969)。尽管这种方法背后有强大的理论背景,但这些研究活动的主要缺点是以主观方式评估和评价创新。例如,Rajaram 和 Georgakakos(引文1989)他们的评估基于主观测量来描绘结构性缺陷的位置。他们认为,标准化创新的高价值对应于流量测量的剧烈变化,这可以被认为是潜在的结构性缺陷。然而,创新序列的任何波动并不一定表明模型存在结构性缺陷,并且需要定义客观标准来调查此类异常的影响。
可以考虑通过探索创新序列和检测其中某些统计特性(例如平均值、标准差等)可能突然变化的时间来客观地解决这个问题。引文2012)。变点分析(无论是参数化还是非参数化)的成功应用已在多个科学领域得到报道,以识别时间序列统计特性中变点的数量和位置(Matteson 和 James引文2014 年,夏尔马等人。引文2016,西里亚等人。引文2019,周等人。引文2019)。然而,在诊断水文模型结构演化路径时尚未考虑这些变点分析方法的实施。
在本研究中,研究了检测河流调节导致的水文路径模型结构演化路径的可能性。为此,提出了一种客观的变化点检测算法,该算法基本上由两个主要模块组成:创新生成器和变化点检测器。在这方面,卡尔曼滤波器(KF)框架内的双状态参数更新内核(Kalman引文1960),与线性马斯金格模型(LMM)相结合,生成归一化创新序列(McCarthy引文1938)。对于变化点的检测,采用基于最小化惩罚对比度函数的参数方法来客观地检测变化点。通过基于合成数据的多个场景来评估所提出方法的鲁棒性。目的是检查所提出的算法检测模型结构在扰动后条件下失去其充分性的时间的能力。
2。材料和方法
2.1 提议的方法
作为一般规则,在面对河流流态的剧烈变化时,典型的静态模型结构可以在一定限度内满足数据可变性,超过该限度,拟合优度就会恶化。在这种情况下的一个基本问题是探索更新模型结构可以防止拟合优度度量恶化的时间跨度。因此,为了建立一个更好地捕获所考虑系统的动态行为的建模框架,有必要检测洪水路由模型结构的系统变化并研究其随时间的演变。为此,需要一种诊断方法来客观地描述变化点的数量和位置。因此,提出了一种两步变化检测算法,
从统计变化检测的角度来看,DA框架内的任何状态估计器(即更新内核,也称为白化滤波器)都可以接收强迫数据和可用的观测输出,然后使用统计方法估计新息均值和协方差矩阵(古斯塔夫森引文2000)。因此,如图所示图。1,所提出算法的第一步是生成一系列标准化创新,并通过以下关系进行计算:
假设有一个理想的模型结构,同时估计系统状态和参数的典型 DA 框架会导致不相关的连续创新,因为它有可能明确解决由初始条件、观测和参数引起的不同不确定性来源。事实上,假设如果正确解决与所引用的不确定性来源相关的错误,则标准化创新序列中潜在检测到的变化可能与模型结构引起的不确定性相关。传统上,可以采用以下任一方法来同时估计 DA 框架内每个时间步的状态和参数:(1)状态增强,引文2008 年,史密斯等人。引文2013);或(2)双状态参数估计,其中参数和状态通过两个连续的滤波器分别估计(Moradkhani等人,2015)。引文2005年,莱森林和莫拉德卡尼引文2012)。两种方法之间的主要区别在于它们的更新步骤,与增强方法不同的是,在状态更新之前,双重过滤方法在一定程度上消除了系统状态预测中的系统误差。因此,这里采用对偶状态参数估计方法,因为它有可能产生无偏先验。
模型在结构和参数方面的充分性可以通过检查其创新序列的白度特性来评估(Simon引文2006)。理想情况下,如果系统没有变化,则其最优过滤器获得的创新构成均值为零且方差已知的独立随机变量的时间序列。然而,创新的统计特性可能会因系统条件的变化而改变。在这种情况下对系统的评估可以通过定义代表与无变化假设的偏离的变化标准来客观地实现。可接受的变化标准包括平均值、方差、相关函数和符号相关性的变化(Gustafsson引文2000年,拉维埃尔引文2005)。
本文作为创新序列波动的替代方案,联合分析其归一化序列的均值和方差的变化,以检测模型结构中潜在的变化点。该分析是通过所提出方法的第二步实现的,其中基于 Lavielle 提出的方法的变化检测器(引文2005)用于探索标准化创新序列并检测其均值和方差不符合预期的时间。如图所示图。1,检测器接收通过上一步生成的归一化创新序列作为输入,然后使用两个惩罚对比函数对其进行分析,稍后将更详细地描述。采用这种方法的优点是能够检测导致方差增加而不影响均值的变化。以下小节将简要讨论所提议方法的主要部分。
2.2 使用 KF 的双状态参数估计
迄今为止,已经基于不同的易处理近似集开发了几种用于实现 DA 的计算技术。在具有高斯变量和不确定性的线性动态模型的情况下,KF 通过分析提供了滤波问题的最优解。在业务水文学的背景下,使用标准 KF 的双状态参数估计方法的出现可以追溯到 Todini 开发的相互交互状态参数(MISP)(引文1978),其中连续执行两个 KF 来联合更新模型状态和参数。在这方面的另一项有价值的研究是 Moradkhani等人的工作。(引文2005),他提供了实现双状态参数估计的总体框架。然而,后一种方法的重点是将集成卡尔曼滤波器(EnKF)的适用性扩展到状态和参数的同时估计。鉴于此,提供了一个在线性离散时间系统中使用广义 KF 进行双状态参数估计的框架(Simon引文2006)。
2.4 实验设计细节
一般来说,设计的数值实验必须考虑模型参数和结构随时间的演化。这种时间变化可能来自驱动力,例如河流廊道中的人类活动(例如河流调节)和/或流域中的土地利用变化。这一额外的解释将为更好地评估拟议方案的有效性铺平道路。因此,以下框架由八个步骤组成,用于根据指定场景规划四个真实系统:
步骤1:选择两种结构不同的水文路径模型来应对系统中可能发生的变化。
在本文中,由于河流调节引起的通量边界条件(即流量和沉积状况)的变化被认为是对河流系统施加的外部刺激。一般来说,如果在给定时间范围内典型河段的通量边界条件没有变化适用,那么在指定时间范围内正在进行的地貌调整保持相对均匀(Fryirs引文2017)。不用说,河流河段的行为状况可能会随着其水文状况的变化而发生变化,因此需要具有不同结构的不同路线模型来解决河流行为的平衡状态。在这方面,马斯金格模型的两种常见形式(即线性和非线性)基于以下两种输出流量的递归关系,分别用于表示扰动前和扰动后的河流行为状况
这种时间变化的基本结果是提出一个分段函数来指定线性情况下的路由参数(参见表格1),因此参数在快速流量响应期间根据正弦函数变化,并在基流条件下保持固定。此外,通过突然改变模型参数的基线值来解决相对于筑坝前时期的河段物理特征(例如平均河床高程和中值河床物质尺寸)的变化。然而,随着时间的推移,床的水平和纹理的实际变化可能会更加平滑(Williams 和 Wolman引文1984)。对于每个参数,基线值被定义为当水流仅由基流组成时的参数大小。不用说,这种依赖性不能推广到非线性马斯金格参数,因为它们不符合物理解释(Singh 和 Scarlatos)引文1987)。
步骤 3:选择具有代表性且无偏差的水流观测样本作为强迫数据(上游水位线)。
选择来自真实数据集的输入过程线以确保具有代表性和无偏的强迫数据集(将在第2.5 小节中更详细地解释)。
步骤 4:在前向框架中,通过实施各自选定的路线模型,使用其相关参数和选定的强迫数据,生成下游流量的两个不同的过程线。
步骤 5:开发一个考虑潜在结构变化的转换内核,并参考预期场景将控制模型从 LMM 转移到 NMM。
在这项工作中,为了提供一个数学框架来捕获初始模型中未来的结构变化,根据地貌对扰动事件的响应原理开发了一个过渡模型(Phillips 和 Van Dyke)引文2016)。换句话说,有人认为模型结构变化的时间模式遵循地貌对河流调节的可能响应路径。因此,该模型使用计算过程线的线性组合来描述如下:
是缩放因子。如所列表2,设计了四种使用不同模式的缩放因子的合理场景来评估不同情况下的算法性能。使用河流敏感性和恢复力两个概念来规划模板场景(Fryirs引文2017)。这些概念根据河流对扰动事件的响应模式和速率将河流系统分为两大类:敏感的和有弹性的。在这方面,前两种情景是根据弹性河流的特征规划的,河流具有恢复扰动前条件的固有能力,因此显示出有限的修改。最后两种情况代表敏感河流,即沿其路线更容易发生变化的河流。四种设计方案的基本概念在表3。为了制定场景 3 和 4,遵循 Graf 的工作,使用了双曲正切函数(引文1977)和吴等人。(引文2012),他提到了河流响应率的指数变化。此外,由于河流治理及其对河流廊道地貌特征(如下切、河道变窄)的影响之间存在时间间隔,因此在模型结构演化路径中还考虑了5年的时滞,以解决反应时间(佩茨引文1987年,布赖尔利和弗赖尔斯引文2013)。反应时间是系统对更改做出反应所需的时间(Allen引文1974)。
步骤 6:对于每种情况,使用相应的转换内核合并从第四步获得的两个过程线,生成下游流量的新过程线。
步骤 7:用损坏的噪声干扰生成的时间序列,以表征测量误差引起的不确定性。
从某种意义上说,通过将每个数据乘以概率密度函数在 0.9 和 1.1 之间均匀的系数,生成的合成河流流量数据随后在每个时间步被噪声破坏。
步骤 8:将扰动时间序列视为下游水流观测值。
上述行动计划生成四个不同的输入和输出过程线数据集,用于进一步的实验和假设检验。
2.5 观测数据及航道说明
作为代表性的强迫数据,选择蒙大拿州(美国)弗拉特黑德河下游廊道作为实验水体,因为自 1938 年以来,克尔大坝为了发电和发电而对其进行了剧烈的改造。用作娱乐和灌溉设施(Arrigoni等人,2017)。引文2010)。这条实验河段从波尔森以南克尔大坝的弗拉特黑德湖 (Flathead Lake) 延伸,向南和向西流经弗拉特黑德印第安保留地,全长 115 公里。上游水文过程线选自美国地质调查局 (USGS) 在下弗拉特黑德河波尔森附近的测量站收集的每日水流测量数据。假设输入过程线是非随机的,并且本研究中排除了侧向流入。由于克尔大坝下方河流走廊的物理调整需要数十年的时间尺度(Petts引文1987年),模拟期长度为50年,即1928年至1977年,其中前10年为大坝建设前的时期。
2.6 更新内核(白化滤波器)的开发
在这个阶段,总结我们迄今为止所做的事情可能会被认为是信息丰富的。在第 2.4 节中,生成了四个不同的数据集,然后我们假装观察它们。在本节中,由于主要目标是评估所提出的算法用于检测模型结构演化路径的性能,因此计划通过在状态空间公式中编写主要模型(即 LMM)来模拟看似观察到的系统用于产生创新。因此,作为所提出算法的第一步,创新序列的生成是使用 KF 估计器完成的,由此将 50 年的每日时间步长的水流观测值同化到 LMM 中。在 LMM 的标准形式中,河流河段及其流入量 (I)、流出量 (Q) 和蓄水量 (S) 由以下方程捕获为线性系统
3。结果与讨论
3.1 创新序列的生成
为了实现本研究提出的目标,基于白度特性的创新,开发了一种两阶段模型结构缺陷检测算法。根据河流对典型扰动的响应类型,使用四种计划场景检验了所提出方法的能力。根据所提出的算法,如第 2.6 节中讨论的那样,主模型与更新内核(白化滤波器)相结合,最初用于在四种设计场景下生成归一化创新序列。在这方面,在每个时间步,首先从观测到的测量值减去预测值,以计算创新值。随后,使用以下方法估计创新方差:方程等式(12)
,并且最终,方程利用方程(1)从其估计均值和方差中获得归一化创新。图2显示了从所提出算法的第一步获得的归一化创新的四个序列。这些图表提供了创新随时间变化的简单图形表示。对这些图表的初步目视检查表明,尽管在后监管时期的前两种情景下,创新均匀地分布在时间轴上,但与情景 3 和 4 相关的创新图存在从零开始的系统性偏离(参见放大的图图2)。从创新自相关分析的角度来看,创新的这种周期性行为图2(c)和(d)表示源于模型结构不充分的非白人过程,而创新的均匀分布图2(一) 和 (b) 可能是随机测量误差产生的,证实了模型结构设法模仿了数据中固有的所有确定性特征。
一般来说,承认这样一个事实非常重要:创新可以被认为在每个时间步骤由两个组成部分组成:随机组成部分和系统组成部分。模型结构只能捕获创新的系统成分,而与其随机成分无关。综上所述,调控前的常态化创新高峰是另一个值得思考和分析的问题。图2。与 Rajaram 和 Georgakakos 提出的分析相反(引文1989年),如果这些不稳定值的位置被认为是模型结构不足的可能位置,我们支持这样的观点,即创新中的这些异常基本上与创新的随机组成部分相关,不能归因于模型结构不足。考虑到本研究中设计的情景的性质,我们假设模型结构预计在河流治理之后而不是在治理之前是不充分的。事实上,可以说,监管前时期常态化创新异常的存在并不是由于模型的结构性问题。相反,其他因素(例如采用非最佳参数集)可能会导致这种情况。因此,需要分析这些图表提供的信息,以检测系统变化的可能位置,
与通过 LMM 不使用任何内核更新来预测系统响应相比,报告实施状态参数更新方法对模型模拟系统行为的能力的影响并从而美化创新也很有趣且信息丰富。为此,利用基于计算观测值和模拟值之间差异的均方根误差(RMSE)标准来评估模型性能。传统上,该指标通常是使用整个数据集来计算的,这可以掩盖由于模拟期间的系统干扰而导致的拟合优度测量的时间变化(Bennett等人,2017)。引文2013)。因此,评估是在本地基础上(五年移动窗口)进行的,以揭示 RMSE 的时间变异性。这个过程导致的结果是表4,其中记录了三个时间范围内的 LMM 和 LMM+Dual KF 两个模型的 RMSE 值及其比率:调节前、调节后和整个数据集。
结果提供于表4研究表明,虽然前两种情景的模型的 RMSE 比率在监管前和监管后时期几乎相同,但情景 3 和 4 所决定的系统性变化导致该比率在监管后时期几乎翻倍。至预监管期。这可能是由于扰动造成的系统变化导致模型结构发生变化,而扰动无法通过单独改变模型参数来解决,正如预期的那样。然而,在四种设计场景下,更新 DA 框架中的模型参数导致了水流路由精度的显着提高。施加干扰后,图3)。
参考当前论文的重点,表4揭示了这样一个事实:基于整个数据集计算拟合优度度量不能用于描绘扰动对创新产生重大影响的时区,并且模型结构需要细化以准确捕获系统动态。不用说,在选择时区时,内容表4这项研究中的数据是根据主观标准收集的,但根据一个时区到另一时区的 RMSE 数值得出有效结论是相当有效的。在下一节中,将通过变化点检测算法自动划分代表性时区。
3.2 变化点检测
在所提出方法的下一步中,使用第 2.3.1 节中描述的程序(即 MPC 方法)来自动指定变化点的数量和位置。在这方面,两个对比函数定义为方程方程 (22)
根据检测到的变化点,进一步探讨本研究中提出的假设是有用且信息丰富的。参考在归一化创新序列的均值和方差中检测到的变化点,我们可以将这些潜在的片段称为模型结构不足的实例,其中模型结构值得进一步关注以增强交叉验证统计数据。在此阶段,合理化检测到的变化点及其与每个设计场景所指示的变化的同步是有意义的。为此,在每个情景中的变化点的位置和结构演化的路径被绘制在图5。如图所示图5(a-d),根据均值变化检测到的片段可以很好地描绘和跟踪不同场景中的结构演化路径。然而,根据方差变化检测到的片段与模型结构中指定的变化之间没有显着相关性(参见图5(e-h))。因此,可以承认均值变化标准是检测系统性变化并研究其对模型结构充分性影响的更合适的衡量标准。此外,通过比较四种设计场景下均值变化的检测点,可以认为该变化准则在跟踪弹性系统和敏感系统的模型结构演化路径方面具有良好的性能。例如,场景 2 中河流治理对模型结构的短期影响(图5b)以及场景 3 中恢复路径的指数形式(图5c)通过均值变化标准准确识别。所提出的方法在检测不同的调整路径方面的鲁棒性被认为是所提出的算法的另一个有吸引力的优点。通过比较场景 3 和 4 的结果来检验这个问题。如图所示图5(c)和(d),检测具有时间延迟的第一个点以及片段的长度,都表明与场景 3 相比,场景 4 中的响应路径更加渐进,这与场景 4 的性质非常一致。
由于方差而创建的变化点(尤其与第一种情况相对应)表明,方差并不是系统性变化检测的良好衡量标准,因为我们预计情景 1 中不会出现任何这种性质的变化。归一化创新序列的方差可归因于与模型结构不足无关的其他因素。承认水流变化作为系统刺激,环境流成分的历史周期,即整个流量模拟期间的低流量、极低流量、高流量脉冲、小洪水和大洪水,与方差变化一起绘制情景 1 下的点用于调查方差变化的原因,因为它与径流变异性相关(参见图6)。如所讨论的,方差变化情况下的对比函数是基于恒定均值假设而开发的。因此,情景1的方差变化点很好地满足了这一假设,被认为是研究这一问题的参考。如图所示图6,洪水系列的不同簇(例如高流量脉冲、小洪水和大洪水的周期)对应于基于方差变化标准检测到的分段。因此,可以获得两者之间的显着相关性,即水流变化和基于方差变化检测到的片段。鉴于上述阐述,似乎有必要区分系统性变化和由于系统输入暂时变化而导致的创新波动,因为它与模型结构的不足有关。
4。结论
本研究旨在调查在给定时间范围内检测典型河流河段内由于其可能和潜在的调节而发生的系统性变化的可能性。为此,开发了一种客观的两步变化检测算法。这里贡献的主要新颖之处在于,在第一步中通过适当的模型与更新过滤器相结合来生成一系列综合归一化创新,然后在第二步中将该序列作为输入引入到变化检测器中。为了研究所提出方法的稳健性,根据地貌对扰动事件响应的原理设计了四个数值实验。从目前的研究中可以得出以下结论:
对生成的标准化创新序列的目视检查表明,创新序列的特征是检测系统变化以及所选模型结构无法模仿数据固有的确定性特征的良好措施。然而,为了对模型结构的不足做出可靠、客观的判断,分析创新序列提供的信息的演变至关重要。
一般来说,所提出的方法在检测系统性变化方面的性能取决于所选择的变化标准。我们对数值实验结果的研究清楚地表明了变化标准选择在描绘和跟踪结构演化路径中的重要性。
检测到的变化点的合理化凸显了这样一个事实:平均变化标准是检测系统变化并研究其对模型结构充分性影响的更合适的衡量标准。然而,方差变化准则更适合研究水流变化和检测流入过程过程中的周期性行为。
总体结论是,由于所提出的方法受益于客观决策系统来研究系统在中断后条件下的功能行为,因此它可以被视为检测系统变化并研究其对模型结构充分性影响的合适替代方案。
使用相对简单的水文路径模型,即LMM,作为初始模型可以被认为是该方法的局限性之一。当前研究的另一个潜在限制是,所提出的方法的实施受益于合成数据,而不是真实的现场数据。此外,与所提出的方法相关的另一个陷阱是,在三组潜在的变化驱动因素中,即河流廊道本身的人类活动、土地利用变化和气候变化,只有河流调节被视为系统驱动因素。因此,建议在真实的河流走廊中实施所提出的方法,其中任何这些因素和/或它们的组合都可以充当系统刺激。认识到拟合优度度量的局部评估对于揭示模拟期间显着发散行为的重要性,另一个推荐的研究途径是研究所提出的方法作为自动分组方法的性能。在这种情况下,所提出的方法可用于描绘代表性时区,其中拟合优度的度量对于从一个分组范围到另一分组范围的可能的模型结构更新保持不变。