新闻资讯

使用非平稳技术估算极端月降雨量

1 简介
对极端水文气象事件的分析可以根据水文气候变量的历史记录做出推断。通常,这些推论用于预测未来极端事件变量阈值水平发生的概率。选择连续时间段内变量的最大值(时间块中的最大值、块最大值或 BM)构成了模拟极端气候的基本基础。极端事件选择最简单的技术之一是年度最大值法(AMM)(Gumbel引文1958),其中包括选择每年的最大值,其主要限制是可用信息的次优使用。此外,由于年份以下时间尺度上的气候变化以及具有足够长记录的水文系列的可用性较低,因此提出了其他替代方案。(史密斯引文1989)提出了阈值峰值(POT)方法,该方法侧重于将感兴趣的极端事件定义为超过给定阈值的值。这种方法存在一些局限性,因为它排除了局部极端事件,例如夏季发生的事件,因此它无法模拟所有年际变化(Menéndez等人,2017)。引文2009)。另一种克服 AMM 局限性的研究使用每月最大值(而不是每年)来研究环境变量(Méndez等人,2017)。引文2007年,引文2009 年,明格斯等人。引文2010)。每月最大值的使用有多种应用,包括一年中特定时间(例如融冰季节)的洪水风险管理和水库管理(根据蓄水量确定给定月份内可以控制的最大洪水) 。使用每月最大值的另一个优点对应于所使用的数据可能增加,这通过最大似然估计(MLE)方法改善了分布上尾部的拟合(Méndez 等人,2017)。引文2007)。

广义极值分布 (GEV)(詹金森引文1955)是拟合与环境变量相关的极端事件的最常见分布之一(Stedinger等人, 1955) 。引文1993)。该分布由于能够捕获广泛的尾部行为而被广泛使用(Coles引文2001)。拟合分布意味着找到最能捕捉观测到的最大值分布的 GEV 三个参数的值。尽管有多种方法可以找到参数,但 MLE 是最常用的一种(Smith引文1985)。

经典频率分析假设分布参数随时间保持恒定(平稳条件)。这一假设意味着用于拟合的样本是可以互换的。任意两个值可以互换,并且无法区分原始系列和修改后的系列。仅当使用平稳期进行拟合时才会出现这种情况,这就是通常使用年度最大值的原因。平稳性假设还意味着当前和未来的极端值遵循相同的分布,因此我们不应期望未来极端值的行为有任何差异。

然而,在实际条件下,平稳性假设并不能完全满足,因为气候变化引入了一定程度的非平稳性——例如,旱年和丰水年的最大降雨量可能相差很大,足以区分。气候变化还可能引入环境变量时间序列的趋势,从而导致分布参数具有一定程度的时间依赖性。这一说法的证据是对极端事件的非平稳性进行了大量研究(Adlouni等人,2017)。引文2007 年,明格斯等人。引文2010年,索拉里和洛萨达引文2011年,萨拉斯和奥贝塞克拉引文2014)。那么,对于某些应用,具有恒定参数的固定 GEV 模型在我们当前的气候条件下不再有效(Leadbetter等人,2017)。引文1983)。

极端天气事件未来发生变化的概率非零(Kharin 和 Zwiers引文2000年,引文2005年,王等人。引文2004)。此外,有证据表明气候变化对极端水文气候事件的分布有影响,这表明它们很难被视为静止的(Wang等,2014)。引文2004 年,IPCC等。引文2013),强调了非平稳分析的重要性。这一证据推动了近几十年来极值分析的进步,使从业者能够更好地表征自然气候变化和极端事件的非平稳性。例如,围巾(引文1992)考虑了 GEV 分布的扩展,纳入了位置参数的趋势;科尔斯 (引文2001)提供了一种描述参数中协变量的使用的方法,其中包含遥相关指数,例如南方涛动指数( SOI);和卡茨等人。(引文2002)提供的例子包括对与降水和洋流时间序列相关的极端情况的分析,包括趋势以及对大气-海洋环流天气模式的依赖。

近几十年来,不同的作者在水文气候极端事件的非平稳分析中纳入了协变量。例如门德斯等人。(引文2007)引入了一种与时间相关的 GEV 模型,该模型结合了调和函数(具有年度周期)、长期趋势和来自位置、规模和形状参数的遥相关指数的区域气候模式。布朗等人。(引文2008)研究了自 1950 年以来每日极端气温的全球变化,结合了区域趋势和大气天气模式,例如北大西洋涛动(NAO)。梅南德斯等人。(引文2009)提出了考虑年际变化和极端波高季节性的与时间相关的GEV模型。洛佩斯和弗朗西斯(引文2013)使用气候和水库指数作为外部协变量,实施位置、规模和形状的广义加性模型(GAMLSS)来分析西班牙内陆河流的非平稳洪水频率。Roderick等人提出了其他确定未来极端降水变化的合理大气指标的方法。(引文2020)。大多数这些分析都使用 MLE 方法来拟合他们的模型。

对于大样本量,MLE 方法可以产生良好的拟合效果。然而,当样本量相对较小时,用于查找分布参数的数值解往往会发散。为了防止这个问题,已经提出了一些基于使用先验分布的技术,这些先验分布包含有关 GEV 参数可以取的最可能值的信息。这些方法与 Hamilton 提出的拟贝叶斯最大似然法 (QBML) 具有方法上的相似性(引文1991),它消除了与 MLE 相关的奇点并建立了蒙特卡罗模拟,显示了其改善均方误差的恒定潜力。类似的研究也存在,例如张等人的研究。(引文2004),他们使用蒙特卡罗模拟,比较多种方法来检测极值幅度的趋势;或中岛等人。(引文2012),他使用马尔可夫链蒙特卡罗(MCMC)方法实施了贝叶斯方法,以找到使用自回归(AR)或移动平均(MA)过程的GEV模型的精确近似值。

整合上述方法和方法来对区域范围内的极端事件进行分析提出了额外的挑战,因为所有测量分析必须显示出彼此的兼容性,同时捕获每个地点的具体特征。有一些方法,例如区域频率分析 (RFA),基于从多个测量站点选择数据,假设所有数据遵循相同的概率分布(Hosking 和 Wallis引文1993年,布拉德利引文1998);也就是说,他们假设该地区的极端情况是同质的。这种分析涉及地理区域的划分,以测试它们是否同质并且可以用唯一的分布模型来表示。通过包含不同空间点的多个观测值,RFA 比单站点模型提供了两个主要优点:(1) 未校准位置的频率估计,以及 (2) 改进了跨位置分布参数的估计(Bracken 等人,2017)。引文2018)。RFA 的各种近似值可以在文献中找到,包括非平稳条件下洪水和降水研究的区域化(Renard引文2011 年,切巴纳等人。引文2014,布雷肯等人。引文2016)。

尽管文献中有将非平稳方法与区域分析相结合的研究,但我们还没有发现任何对参数方法和 AR 方法的应用进行比较和评估的研究。因此,本研究的目的是分析最能表征和估计极端降水事件时间变化的模型,并使用西班牙的数据进行比较。为了补充拟议的目标,我们建议将领土划分为气候均匀的区域(遵循柯本-盖革气候分类),然后验证区域之间的极端事件是否具有可比性以及是否可以通过同一模型捕获。将使用两种方法来制定模型:(1) 基于非平稳 GEV 模型的参数方法(Coles引文2001),纳入协变量和对时间的明确依赖;(2) AR 方法,其中 GEV 分布的参数将遵循时间序列模型。第一种方法将采用 MLE 方法,而第二种方法将使用贝叶斯技术。

2 研究范围及信息来源
我们在西班牙开展研究主要有两个原因:首先,因为西班牙拥有密集的雨量计网络(图。1) 提供可用信息;其次,也是更重要的一点,因为那里有各种各样的气候。事实上,西班牙有许多不同的气候,在很短的距离内就会发生强烈的变化。柯本-盖革气候分类定义的五个气候组中的四个(AEMET 和 IPMA)引文2011)可以在西班牙找到。只有 A 组(热带气候)不存在。最常见的气候是 C 型(温带)和 B 型(干燥),常见于西班牙大陆以及加那利群岛和巴利阿里群岛。D 型和 E 型(分别为大陆型和高山型)存在于山区,但后者仅存在于比利牛斯山脉的高地地区。

图1。(a) 西班牙气象局 (AEMET) 每日雨量计的位置(8310 个雨量计,蓝点);(b) 由 AEMET 创建的柯本-盖革气候组的空间分布,以及选定的具有 1979-2019 年期间降水记录的雨量计。图例 KÖPPEN CLIMATE ZONES 中出现的缩写是指气候子组:Bsk,寒冷草原;BSh,炎热的草原;BWh,炎热的沙漠;BWk,寒冷的沙漠;Csa,温带,夏季干燥或炎热;Csb,温带,夏季干燥或温带;Csc,温带冷夏;Cfa,温带,旱季,夏季炎热;Cfb,温带,有旱季和温带夏季;Dsb,夏季炎热潮湿的地中海大陆影响;Dsc 和 Dfc,亚北极气候;Dfb,夏季炎热潮湿的大陆性气候;ET,苔原气候。

图 1. (a) 西班牙气象局 (AEMET) 每日雨量计的位置(8310 个雨量计,蓝点); (b) 由 AEMET 创建的柯本-盖革气候组的空间分布,以及选定的具有 1979-2019 年期间降水记录的雨量计。 图例 KÖPPEN CLIMATE ZONES 中出现的缩写是指气候子组:Bsk,寒冷草原; BSh,炎热的草原; BWh,炎热的沙漠; BWk,寒冷的沙漠; Csa,温带,夏季干燥或炎热; Csb,温带,夏季干燥或温带; Csc,温带冷夏; Cfa,温带,旱季,夏季炎热; Cfb,温带,有旱季和温带夏季; Dsb,夏季炎热潮湿的地中海大陆影响; Dsc 和 Dfc,亚北极气候; Dfb,夏季炎热潮湿的大陆性气候; ET,苔原气候。
显示全尺寸
本研究使用西班牙气象局 (AEMET) 雨量计网络记录的每日降水数据(图。1)。该网络覆盖了大部分气候带,但子组 Csc(C 型气候)和 ET(E 型气候)除外。这些子组出现在比利牛斯山脉的高地区,并且不包含具有每日降水数据的雨量计,因此它们没有包含在分析中。同样,没有关于 BWk 子组(B 型气候)的信息。此外,山区气候 Dsb、Dsc、Dfb 和 Dfc 仅包含六个具有可用信息的雨量计;因此,考虑到它们的地理特征,它们被纳入称为 D 的气候组(Diez-Sierra 和 Del Jesus)引文2019)。

总共处理了 8310 个雨量计,并对它们的时间序列进行了质量控制。这个过程包括识别非典型数据,确保它们在物理上是可能的(Gonzalez 和 Bech引文2017);连续两天或以上重复值的对照;以及质量指数的实施,丢弃具有许多缺失数据、假零、空数据等的时间序列。(Lez-Rouco引文2001 年,Llabrés-Brustenga等人。引文2019)。

选择具有最佳质量指标的时间序列后,第二个选择标准对应于百分比覆盖率和记录周期。考虑了 1979 年至 2019 年期间至少 80% 完整年份的台站。一整年被定义为所有月份至少有 80% 完整数据的一年。共有1576个站通过了质量控制。由于后续分析中处理这些信息的计算成本很高,因此选择了每种气候最好的 20 个站点,确保它们均匀地覆盖每种气候的空间分布(图。1)。由于 D 组仅包含 6 个站点,因此总共使用了 146 个雨量计。

遥相关指数用于捕捉极端降水事件发生的年际波动。这些指数用作 GEV 分布参数变化的协变量。具体来说,我们使用了 NAO 和地中海涛动指数 (MOI)。选择这些指数是考虑到它们对西班牙近几十年来降雨量变化的影响(Martin-Vide 和 Lopez-Bustins引文2006)。MOI和NAO指数由东安格利亚大学气候研究单位(University of East Anglia引文2021 年,数据可在http://www.cru.uea.ac.uk/cru获取。所有指数都有每日数据并涵盖分析期(1979-2019)。

3 方法
我们研究的主要目的是确定一个最佳的非平稳模型来描述极端降水事件的特征。我们还旨在确定该最佳模型是否会根据分析的气候类型而变化。

为了实现这些目标,我们遵循三个步骤(如图所示)图2)。首先,对历史降水和大气数据进行审查和处理,建立质量控制观测数据库。其次,极值的非平稳模型(在第 3.1节中介绍)与观测结果进行拟合,并相互比较以确定最佳模型(参见第 3.2.1 节和第 3.2.2 节)。此步骤使用两种不同的技术:通过 MLE 拟合的参数模型,以及使用贝叶斯技术拟合的 AR 时间序列模型。最后,比较每个类别(MLE 和贝叶斯)的最佳模型,以确定哪种方法提供最佳近似值。使用两种衡量标准进行比较:一种基于性能指标(参见第 3.3 节)),另一个基于该方法对未来降水量的估计程度(参见第 3.3.2 节)。

图 2.拟议的方法,其中面板 (a) 显示了西班牙历史降水和大气数据的审查和预处理框架。图 (b) 和 (c) 分别介绍了根据拟合优度和复杂性选择最佳参数模型和自回归模型的方法。面板(d)显示了按气候带划分的最佳参数或自回归模型在拟合优度和复杂性方面的比较和选择,用于西班牙极端降水事件的概率表征和预测。

图 2. 拟议的方法,其中面板 (a) 显示了西班牙历史降水和大气数据的审查和预处理框架。 图 (b) 和 (c) 分别介绍了根据拟合优度和复杂性选择最佳参数模型和自回归模型的方法。 面板(d)显示了按气候带划分的最佳参数或自回归模型在拟合优度和复杂性方面的比较和选择,用于西班牙极端降水事件的概率表征和预测。
显示全尺寸
两种方法中的最佳模型不仅基于拟合优度来确定,还考虑了模型复杂性,以支持简约模型(假设拟合优度相同,应首选参数较少的模型;请参见第 3.3 节)。这种权衡是使用 Akaike 信息准则 (AIC) 实现的(Akaike引文1998)作为绩效指标。

所提出的方法旨在找到最能描述和估计西班牙极端降水事件时间变化的模型。它还旨在验证最佳模型是否依赖于气候,或者是否可以使用单个模型在整个地区捕获极端事件的时间结构。该方法由四个主要模块组成,如图所示图2,简要描述如下:

(a) 组:历史降水和大气数据的审查和预处理。

图 (b):参数模型的配置和拟合,使用 AIC 作为优化指标,按照 Köppen-Geiger 分类按气候分离极端事件。

面板 (c):AR 时间序列模型的配置和拟合,使用 AIC 作为优化指标,按照 Köppen-Geiger 分类按气候分离极端事件。

图 (d):按气候区比较最佳参数模型和 AR 时间序列模型,以确定性能最佳的模型系列。

3.1 非平稳GEV模型
极值分布由 Fisher 和 Tippett 引入(引文1928),是詹金森(引文1955),他将三个极端分布系列——Gumbel、Fréchet 和 Weibull——组合成一个独特的累积分布函数(CDF),称为 GEV 分布,由下式给出

3.1.1 GEV参数模型
参数模型表示 GEV 参数的时间变化,将它们表示为随时间变化的函数的线性组合。我们将这些随时间变化的函数称为协变量。协变量可以代表季节性、变异性和趋势的影响。季节性可以通过正弦函数引入(Menéndez等人,2014)。引文2009)明确考虑了 GEV 分布参数中的年度和半年度周期。年际和年代际变化可以从区域气候模式中捕获,这些模式通常由遥相关指数表示(Hatzaki等,2016)。引文2010,格雷格森等人。引文2013)。西班牙的气候变化受到多种指数的影响,但与降水最相关的是 MOI 和 NAO 指数 (Martin-Vide引文2004 年,洛佩兹-布斯廷斯等人。引文2008)。我们假设遥相关指数随参数时间变化的影响是线性的。

3.2 最优模型的选择
最佳模型的搜索探索了捕捉季节性、变异性和长期趋势的术语组合,假设每个时间尺度与其他两个时间尺度很好地分开。在每个时间尺度(例如季节性时间尺度)内,还测试不同的项(例如常数项、每年周期的正弦曲线等)。为了使这种探索系统化,我们将每个术语同化为一个基因,该基因可能表达也可能不表达,从而改变模型的行为。激活基因会激活并拟合相应的参数。基因的组合,即基因集,将定义一个特定的模型。因此,特定模型的性能指标将被分配给生成该模型的基因集。在测试了所有可能的基因组后,

参数模型和 AR 模型的具体细节有所不同,因为前者是通过 MLE 拟合的,而后者是通过贝叶斯技术拟合的。然而,在为每个类别选择最佳模型后,将两者进行比较,并选择性能最好的模型。此外,由于分析周期足够长,我们将其分解为两个子周期,在第一个子周期上拟合(训练)模型,在第二个子周期上进行估计,以评估每种方法的估计能力。

3.2.1 参数模型选择
为了找到最佳模型,有必要探索协变量的所有可能组合。文献中已经提出了迭代方法来确定协变量的最佳组合(Menéndez等人,2017)。引文2009 年,明格斯等人。引文2010)。然而,一个可行的替代方案是实现一组基因集,打开或关闭协变量以探索所有可能的组合。我们提出了一种相当于遗传算法(一种随机全局优化算法)的方法,但我们不是只测试某些基因集,而是测试所有基因集以找到最佳基因集。这种数据结构受到生物理论的启发,基于具有二进制表示的自然选择(Sheppard引文2018)。该基因集的结构显示在图3。该图显示季节性、变异性和趋势是单独分析的,每个都具有不同的协变量组合。

3.2.2 AR模型选择
从 AR 方法中选择最佳基因集的方法与参数模型选择类似。然而,在这种情况下,只考虑两个元素:AR 成分和季节性成分。由于 AR 项可以模拟长期相关性,我们假设它可能自然地包含气候变异性,从而没有必要明确包含气候变异性成分。AR 术语将仅考虑 lag-1 分量,而季节性术语将使用 lag-12 分量包含在内。图4显示了所探索的不同术语(基因)的方案。在这种情况下,基因集有六个组成部分:三个用于 AR 部分,三个用于季节性部分:每个 GEV 参数两个。

3.3 比较参数模型和 AR 模型
一旦选择了最佳参数和 AR 模型,人们的兴趣就转向确定一类模型的性能是否优于另一类。为了实现这一目标,提出了两种不同的程序:一种基于 AIC 比率,另一种基于估计未来降水量。

3.3.1 AIC比率法
第一个过程使用 AIC 比率来比较参数方法和 AR 方法。无论是通过 MLE 还是贝叶斯技术计算,平稳模型的性能都必须相同(因为在两种情况下它是完全相同的模型),但前者仅产生一个数字,而后者产生一个完整的分布。因此,为了比较两种方法的 AIC,必须将 AR 方法的 AIC 总结为一个数字(我们选择中位数),然后乘以归一化因子。该因素解释了 MLE 拟合的平稳模型的性能与贝叶斯技术获得的平稳模型的性能中值之间的变化。

3.3.2 预测未来降水量
由于这项工作的目标之一是确定最佳估计模型,因此我们建议使用未来降雨量的估计精度来比较每个类别中的最佳模型。为了进行比较,全球分析期分为两个时期:第一个时期涵盖 1979 年至 1998 年,第二个时期涵盖 1999 年至 2019 年。第一个时期用于拟合最佳模型。然后使用这些模型来估计第二阶段的降雨量。第二阶段将进行另一次拟合,以验证第一次拟合获得的估计值。

基于分析周期的分解,将比较两种不同的统计特征:

历史拟合:最佳模型与第二期(1999-2019)数据的拟合,通过为该范围年中(对应于 2009 年 1 月)提供的估计进行总结。

估计拟合:最佳模型与第一阶段(1979-1998)数据的拟合,通过为第二阶段年中(对应于 2009 年 1 月)提供的估计进行总结。

比较的重点是10年重现期对应的降水量值。在参数情况下,历史拟合和估计拟合为每个测量仪提供 10 年重现期降雨量的值。因此,准确度由两个值之间的差异来表征。在 AR 情况下,10 年重现期的降雨量是一个分布。由此进行比较,分析通过对历史分布和估计拟合分布进行采样获得的 5000 个样本之间的差异。

3.4 使用的软件工具
使用 Julia 编程语言包中提供的全局黑盒优化模块 BlackBoxOptim.jl 来拟合参数模型(Bezanson等人,2017)。引文2017)。贝叶斯方法使用 PyStan 进行拟合(Stan Dev Team引文2021)和Python。

PyStan 使用MCMC方法,这是传统数值方法的替代方法。我们使用具有四个大小为N = 1000 的链的 PyStan,应用 2000 个样本的燃烧期。链的构建是使用 Metropolis-Hastings 算法完成的。

4 个结果
4.1 最优参数模型
最优参数模型的选择结果如图所示图5。面板(a)显示,整个西班牙极端情况的非平稳性可以通过特定的模型形式(小圆圈阴影区域;彩色图中的绿色)来最佳捕获。只有在 BWh 类型的气候下,在最干旱的地区,固定模型才能做得更好。

图 5.最佳参数模型的空间分布以及每种气候下不同参数模型的性能评估。面板(a)显示了最佳模型的空间分布。带小圆圈的阴影区域(覆盖BSh(热草原)、Bsk(冷草原)、Cfa(温带旱季和炎热夏季)、Csa(温带旱季或炎热夏季)、Cfb(温带旱季)和温带夏季)、Csb(温带干燥或温带夏季)和 Köppen_D 气候)代表通过包括季节性、变异性和趋势来最好地捕获极端变化的区域

最佳参数模型的结果表明,非平稳性分析可以最佳地包含在位置和尺度参数中,几乎完全包含在位置和尺度参数中。季节性、变率和趋势的影响与除 BWh 组之外的所有气候组相关,BWh 组代表位于伊比利亚半岛东南部小区域和加那利群岛的干燥沙漠地区(图5(一)),其中固定模型做得更好。这些区域与半岛的最小雨量测量值一致(AEMET 和 IPMA引文2011),这可能表明不存在足够的极端事件来最佳地拟合非平稳模型。

4.2 最优AR模型
在测试的 27 种型号中​​,只有 5 种提供了合理的贴合度,它们是:

固定模型。

μ-AR(1):用自回归项建模的位置参数。

μ-AR(1/12):用自回归和季节项建模的位置参数。

σ-AR(1):使用自回归项建模的尺度参数。

σ-AR(1/12):使用自回归项和季节项建模的尺度参数。

图6显示了每种气候的 AIC 结果(图 (b) 至 (i)),以及最适合的基因集的空间分布(图 (a))。从图中可以看出,模型μ-AR(1/12)在BSk、Csa、BSh和BWh气候下表现最好;气候 Csb 中的 σ-AR(1);和 σ-AR(1/12) 在气候 Cfa、Cfb 和 D 中。μ-AR(1) 从来都不是性能最好的模型。固定模型的结果没有显示,因为它的 AIC 值比其他测试的基因集更高(表明性能更差)。

图 6.最佳自回归模型的空间分布以及每种气候的不同自回归模型的性能评估。面板(a)显示了最佳模型的空间分布。斜线(45°)阴影区域是μ-AR(1/12)为最佳模型的区域(气候Bsk(冷草原)、Csa(温带,夏季干燥或炎热)、BSh(热草原)和BWh(炎热沙漠));σ-AR(1) 的水平线阴影区域(气候 Cfb(温带,有旱季和温带夏季));σ-AR(1/12) 的交叉线(气候 Cfa(温带,有旱季和炎热的夏季)、Csb(温带,有干燥或温带夏季)和 D)。面板 (b) 至 (i) 显示每个基因集和气候类型的中值 Akaike 信息准则 (AIC) 的箱线图。箱线图中的水平虚线显示了每种气候下表现最佳的模型的最小中值 AIC。请注意,箱线图带有阴影并对应于所描述的区域。

图 6. 最佳自回归模型的空间分布以及每种气候下不同自回归模型的性能评估。 面板(a)显示了最佳模型的空间分布。 斜线(45°)阴影区域是μ-AR(1/12)为最佳模型的区域(气候Bsk(冷草原)、Csa(温带,夏季干燥或炎热)、BSh(热草原)和BWh(炎热沙漠)); σ-AR(1) 的水平线阴影区域(气候 Cfb(温带,有旱季和温带夏季)); σ-AR(1/12) 的交叉线(气候 Cfa(温带,有旱季和炎热的夏季)、Csb(温带,有干燥或温带夏季)和 D)。 面板 (b) 至 (i) 显示每个基因集和气候类型的中值 Akaike 信息准则 (AIC) 的箱线图。 箱线图中的水平虚线显示了每种气候下表现最佳的模型的最小中值 AIC。 请注意,箱线图带有阴影并对应于所描述的区域。
显示全尺寸
结果表明,在 AR 框架中,在位置和尺度参数中捕获了非平稳性,并且不需要对形状参数进行任何修改。

需要 AR 和季节项来正确捕捉整个分析区域的极端行为,气候 Csb 区域除外,夏季明显干燥(AEMET 和 IPMA)引文2011),其中季节性项可能不太重要。但请注意,气候 Csb 的 σ-AR(1) 和 σ-AR(1/12) 之间的差异很小,因此可能需要进行额外的实验才能正确考虑季节性分量的需要。

4.3 比较最优参数模型和 AR 模型
图7比较每个气候带的两种方法(参数和 AR)中表现最佳模型的 AIC 分布。请注意,AR 模型的 AIC 由其中位数表示,该中位数已标准化(请参见方程公式 21)

对两种方法进行公平的比较。该图清楚地表明,对于分析的每种气候,AR 模型都优于参数模型。事实上,这些分布差异很大,不存在重叠,这清楚地表明了 AR 方法在解释西班牙极端降雨事件的非平稳行为方面的优越性。
图 7.最优方法的空间分布以及参数方法和自回归方法之间的性能比较。面板 (a) 显示了最佳执行方法的空间分布。由于自回归方法每次都优于参数模型,因此面板显示与图6。面板 (b) 至 (i) 显示最佳参数模型和最佳自回归模型的 Akaike 信息准则 (AIC) 分布的箱线图。该图显示,对于所有气候类型,自回归模型明显优于参数模型。请注意,自回归模型的 AIC 已标准化(请参见方程公式 21)

以便对两种方法进行公平的比较。
图 7. 最优方法的空间分布以及参数方法和自回归方法之间的性能比较。 面板 (a) 显示了最佳执行方法的空间分布。 由于自回归方法每次都优于参数模型,因此面板显示与图 6 相同的分布。面板 (b) 到 (i) 显示最优参数的 Akaike 信息准则 (AIC) 分布的箱线图和最优自回归模型。 该图显示,对于所有气候类型,自回归模型明显优于参数模型。 请注意,自回归模型的 AIC 已标准化(请参见方程方程 21)(21) NR=AICStaPARAICStaAR(21),以便在两种方法之间进行公平比较。
显示全尺寸
关于结果的可变性并考虑到观察到的规模,可以看到非常低的离散度,不存在非典型数据,这标志着两种分析方法之间的另一个差异,证明了有利于 AR 模型的证据的强度。因为 AR 方法是最佳方法,所以相同的均匀气候带(参见面板(a))图7)在第 4.2 节中描述的被识别。

为了补充分析并为 AR 方法的性能提供额外的证据,图8比较了对 10 年重现期的降雨量的估计。比较显示了从最佳 AR 模型(分布)和最佳参数模型(图中每个面板下部的点估计)获得的估计值。使用历史拟合和第 3.3.2 节中定义的估计拟合来计算估计值。

图 8. 2009 年 1 月 10 年重现期降雨量的比较,该降雨量是根据每种气候的代表性测量仪的历史拟合值和估计值得出的。该分布是通过对相应的最佳自回归模型的 2000 个值进行采样得出的。用垂直线阴影的密度函数表示基于前一时期数据的估计(估计拟合;参见第 3.3.2 节)。用斜线阴影的密度函数表示同一时期内估计的降雨量(历史拟合;参见第 3.3.2 节))。在分布图的轴下方,有两个附加轴显示相应最佳参数模型的估计值:上面的轴显示来自估计拟合的估计值,下面的轴显示来自历史拟合的估计值。请注意,BWh(热沙漠)区域由两个子图(右下和右中)表示,它们包含相同的分布;然而,从右下角可以看出,该气候带的两个模型的估计值之间存在较大差异。右上子图不包含参数模型的估计值,因为它们超出了范围(历史拟合:22 毫米,估计拟合:23 毫米)。

图 8. 2009 年 1 月 10 年重现期降雨量的比较,该降雨量是根据每种气候的代表性测量仪的历史拟合值和估计值得出的。 该分布是通过对相应的最佳自回归模型的 2000 个值进行采样得出的。 带有垂直线阴影的密度函数表示基于前一时期数据的估计(估计拟合;参见第 3.3.2 节)。 用斜线阴影的密度函数表示同一时期内估计的降雨量(历史拟合;参见第 3.3.2 节)。 在分布图的轴下方,有两个附加轴显示相应最佳参数模型的估计值:上面的轴显示来自估计拟合的估计值,下面的轴显示来自历史拟合的估计值。 请注意,BWh(热沙漠)区域由两个子图(右下和右中)表示,它们包含相同的分布; 然而,从右下角可以看出,该气候带的两个模型的估计值之间存在较大差异。 右上子图不包含参数模型的估计值,因为它们超出了范围(历史拟合:22 毫米,估计拟合:23 毫米)。
显示全尺寸
该图仅显示了每种气候的一种选定雨量计,以说明两种方法之间的差异。此外,结果适用于 2009 年 1 月的回报期值,即分析日期范围的中点。

图8表明,两种方法总体上提供了兼容的结果,但最干旱的气候(BWh、中图和右下图)除外,其中固定参数模型预测的值比最佳 AR 模型预测的值大 66%;对于气候 Cfa,参数估计超出范围(历史拟合:22 毫米,估计拟合:23 毫米)。AR 模型产生更连贯的估计,其中历史拟合和估计拟合之间的一致性似乎比参数情况更好。

一般来说,给定气候的 AR 估计值的分布显示出相似的形状,它们之间几乎完美匹配(气候 Cfb),具有较小的偏差(气候 Cfa 和 Csb)或具有较大的偏差(气候 Bsh) ,但仍低于 10%。气候 Csa 和 D 的分布显示出最大的差异,但仍然提供偏差低于 10% 的兼容预测。从绝对值来看,最小差异接近于 0 (Unknown node type: font
mm),最大略小于5mm(对应VILLAFRANCA BOSCANA NOU站,中心面板图8)。

然而,结果图8仅参考一个站点(具有平均质量适合度的站点)。为了评估这两种方法的表现是否不同,图9显示了针对每种气候考虑的所有站点的估计结果的系统比较。斜线 (45°) 阴影的箱线图显示了在特定站点使用历史拟合和参数方法的估计拟合(第3.3.2 节中定义)计算的 10 年重现期值之间的差异。每个箱线图总结了不同气候的结果。同样,带点的阴影箱线图表示相同的差异,但使用 AR 方法。Csa 子组的 VILLAFRANCA BOSCANA NOU 站被排除在图表之外(其差异为 -4.7 毫米),因为它是唯一一个差异超过图表下限(-1.5 毫米)的站。

图 9.每种气候下每个气象站的估计拟合与历史拟合(第 3.3.2 节中定义)之间估计 10 年重现期降雨量的差异。带斜线 (45°) 阴影的箱形图显示了参数方法的差异,带点阴影的箱形图显示了自回归方法的差异。每个箱线图总结了各自气候的结果。估计拟合 (EF) 估计值大于历史拟合 (HF) 估计值的区域用水平线阴影,因为它是安全区域(基于过去的估计值大于基于当前值的估计值)。历史拟合估计值较大的区域用斜线 (135°) 阴影,因为它是不安全区域。

图 9. 每种气候下每个气象站的估计拟合与历史拟合(第 3.3.2 节中定义)之间估计 10 年重现期降雨量的差异。 带斜线 (45°) 阴影的箱形图显示了参数方法的差异,带点阴影的箱形图显示了自回归方法的差异。 每个箱线图总结了各自气候的结果。 估计拟合 (EF) 估计值大于历史拟合 (HF) 估计值的区域用水平线阴影,因为它是安全区域(基于过去的估计值大于基于当前值的估计值)。 历史拟合估计值较大的区域用斜线 (135°) 阴影,因为它是不安全区域。
显示全尺寸
图9表明参数模型生成的预测比 AR 模型具有更大的离散范围。它的偏差很小,但比 AR 模型的偏差大。大多数参数模型结果都在安全区(图9(用水平线阴影),根据估计拟合计算的值大于根据历史拟合计算的值的区域。然而,进入不安全区(该区域)图9与 AR 相比,参数化方法中用斜线 (135°) 阴影的部分数量更多且更大。

事实上,AR 模型显示出比参数模型更低的偏差(差异的中值更接近于零)和更低的方差,因为大多数预测都紧密围绕零差异误差聚集。这两种方法唯一具有可比性的气候是 BWh 气候,因为这里的最佳模型是固定模型。对于所有其他气候,AR 模型的结果都非常出色。

5 讨论
最佳参数模型是根据拟合优度和复杂性确定的,有利于在更多类型的气候下表现更好的模型。该方法的结果表明,在所研究的八个气候区中的​​七个气候区中,相对于稳态参数模型,在 GEV 分布参数中引入非平稳过程的模型获得了更好的表示。GEV 参数中季节性、变异性和趋势的引入改善了上述分布对极端降水事件的调整,但 BWh 子组除外,该子组代表位于伊比利亚东南部小区域的干燥沙漠地区半岛和加那利群岛,其中平稳模型获得了更好的代表性。

在提出的模型中,我们假设气候变化引入的非平稳性被捕获在趋势中,因为这是模型中包含的唯一年际变化,并且不能由气候指数解释。考虑这一趋势很重要,因为它提供了对正在发生的变化的长期看法。该趋势可以提供对可能发生的变化的长期概述。对于所选参数模型,它以线性项 t 为框架,包含在所选模型的位置、比例和形状参数中。此外,位置参数包含二次项 t 2,表明该参数代表的趋势比其他参数更大。由于我们的主要兴趣是短期估计,气候模型预测的变化很少甚至没有变化,因此我们假设气候变化会导致模型参数发生漂移,以推断最近的趋势,假设其他气候变化影响(例如气候变化)季节性等)可以忽略不计。

在 AR 模型中,无法以同样的方式捕获气候变化带来的非平稳性。在这种情况下,趋势项并不代表单独 AR 和季节性成分的拟合度方面的改进。事实上,这一结果可能表明参数模型中捕获的极端情况的长期趋势可能是人为的,但需要进一步的分析来加深我们对这一具体结果的理解。

最佳 AR 模型很好地代表了所有气候下的极端降水事件。事实上,当位置参数或尺度参数中包含非平稳性时,这些模型获得了良好的结果。然而,形状参数必须保持恒定以确保模型的收敛,可能是因为模型表达能力的增加需要更多的数据点才能收敛到唯一的解决方案。

AR方法的结果表明,月最大降水事件受到前几个月极端事件以及气候季节依赖性的影响。尽管某些区域最好通过在位置参数中引入非平稳性来捕获,但最好将效果纳入尺度参数中。在所研究的所有气候带中都观察到了这种行为,在 Csb 子组的季节性成分中稍微不那么明显,该子组代表夏季明显干旱的区域(AEMET 和 IPMA)引文2011)。

研究中考虑的两种方法(参数法和 AR)用于估计所分析站点与 10 年重现期相关的最大年降水量。根据获得的结果,AR 方法对于极端降水事件的概率估计似乎更准确。即使这两种方法构成了考虑极值与气候时间演变之间依赖性的工具,AR 模型也提供了更大的灵活性,从而获得更准确的估计。

应用非平稳技术来表征极端事件对于管理者和实践者来说非常重要,他们可以为他们的设计和系统生成更准确的强迫描述。我们提供的结果可以指导和简化这些方法的应用,从而有助于西班牙境内灌溉和水力发电厂的管理。此外,我们的实验设计可用于分析其他降雨网络并找到纳入气候变化的最佳方式。

6。结论
对于所有分析的气候,AR 模型在拟合质量和复杂性 (AIC) 方面都比参数模型表现更好。结果表明,AR 模型能够最好地捕捉和表征极端降水事件的时间变化。

AR 方法在 AIC 方面的改进可能归因于两个因素:首先也是最重要的,AR 和季节性项提供的结构和灵活性,能够建模长期相关性(滞后长达 12 个月);第二,拟合方法,由于贝叶斯方法不存在过拟合问题。

AR 模型和参数模型之间的 AIC 差异是由似然函数驱动的。然而,参数的数量——尽管不是决定因素——显示出很大的差异。参数模型大约需要19个参数,而AR模型最多需要4个参数。AR 模型以更少的参数实现了更高水平的表现力。这一事实也导致了观察到的差异。

在预测方面,最优 AR 模型比最优参数模型更准确(参见图9),尽管预测性能的差异很重要,但比 AIC 的差异要小,而 AIC 的差异是显着的(参见图8)。将 AIC 结果与预测性能相关联可能很直观,但这不是正确的比较,因为 AIC 不是衡量预测拟合优度的合适指标(Gelman等人,2017)。引文2014)。事实上,格尔曼等人。(引文2014)认识到比较非常不同的模型是有用的,为此,预测比较是有意义的。在提出的模型中,我们假设气候变化引入的非平稳性嵌入在趋势中,因为这是唯一考虑超出气候指数解释的年际变化的术语。对于所选参数模型,它由线性项 t 构成,存在于所选模型的位置、比例和形状参数中。此外,位置参数包含二次项t 2,表明该参数代表比其他参数更大的趋势。

在 AR 模型中,无法以同样的方式捕获气候变化带来的非平稳性。在这种情况下,趋势项并不代表相对于 AR 和所选模型的位置和尺度参数中引入的季节性分量的拟合度的改进。

代表气候变化影响的长期趋势仅对参数模型重要,对 AR 模型不重要。事实上,在参数化方法的三个参数中,趋势成分是必要的,而 AR 模型在没有这个术语的情况下表现得更好。这一结果可能表明,每月最大值的趋势可能是一种数学假象,源自某种严格的季节性项与气候指数之间的相互作用。需要进一步分析来澄清这一结果的真正原因。

所提出的方法框架构成了分析极端降水事件的时间依赖性的工具,包括非平稳条件下的估计。所提出方法的应用为解决与水工结构设计和水资源管理相关的问题提供了坚实的基础。进一步的研究可能集中于整合不同协变量以表示非平稳性的其他统计分布的应用,包括开发新的风险评估框架。

发布日期:2024-02-02