新闻资讯

探索不同实际可用信息场景中天气发生器极端估计的不确定性

1 简介
导致重大洪水的极端降水事件是在世界各地造成重大经济损失和大量人员死亡的自然灾害。此外,气候变化预测预测其频率和幅度都会增加(例如 Alfieri等人,2015)。引文2017年,帕普罗特尼和莫拉莱斯-那不勒斯引文2017年),结合全球社会经济发展,将导致在不久的将来极端降水事件造成的洪水损失的频率和严重程度增加(IPCC引文2022)。更好地了解这些事件,从而能够更好地预测它们,将导致洪水预警协议的广泛改进,并更好地调整未来基础设施的规模(或调整现有基础设施的规模),这是减少未来损失的关键。

然而,这些极端降水事件的时空变异性较高,特别是可用降水记录较短,因此很难获得可靠的分位数(X时间)
在对这些事件建模时进行估计,特别是那些X时间
与高回报期相关。这个问题在干旱和半干旱气候中变得更加明显,这些气候中大部分降雨集中在短时间内(主要以强降雨形式出现),然后是长期干旱。

最近广泛采用的解决此问题的方法是使用随机天气生成器 (WG)。WG 是计算机模型,可生成一系列长合成气象数据,这些数据具有与观测数据类似的统计特性(Chen等人,2017)。引文2010)。此外,虽然观测到的时间序列仅代表对气候的一种认识,但工作组可以产生许多认识,从而提供更广泛的可行情况(Khazaei等,2017)。引文2021)。它们已广泛与水文和环境模型结合使用(例如 Cowpertwait等人,2014)。引文2013年,戴和琴引文2019,贝尼托等人。引文2020),最近作为气候降尺度的工具,通过将参数与气候模型输出联系起来来提高气候预测的分辨率(例如Chun等人,2020)。引文2013年,李和巴博维奇引文2019,卡扎伊等人。引文2021)。

尽管开发的第一个工作组大多是单变量、单站点并且具有每日时间分辨率(例如理查森引文1981年,理查森和赖特引文1984年,威尔克斯引文1998),对多个天气变量、多个地点和更精细的时间分辨率的长数据系列的需求导致最近集成所有这些需求的新工作组呈指数级增长。

当前的工作组可大致分为参数化或非参数化(或重采样;参见 Rajagopalan 和 Lall)引文1999 年,艾略特等人。引文2020)。大多数现有工作组都是参数类型,因为可以改变参数来模拟不同的天气情景,从而促进气候变化研究(Wilks引文2009)。两种类型的工作组在再现某些变量的平均特征方面都表现得相当好。过去与月降水量平均值年际变化相关的问题(Wilks 和 Wilby)引文1999年,谢里夫和伯恩引文2006 年,艾略特等人。引文2015)近年来已得到解决。帕帕莱西乌 (引文2018)提出了明确再现长期持续性自相关结构或分解年度/每月时间序列以保留所需变异性的模拟过程(Papalexiou等人,2018 )。引文2018)来解决这个问题。尽管如此,由于生成的气象变量的统计特性预计与观测到的天气记录的统计特性相似,并且当前寄存器的长度相对较短(即极值信息很少),因此工作组的性能再现高重现期的估计仍然有限。因此,即使在使用 WG 扩展降水记录之后,估计值仍较高X时间 
仍然存在高度不确定性(Khazaei等人,2017)。引文2021)。

人们特别是在水文界做出了广泛的努力,对高降水量进行统计建模。考珀特维特 (引文1998 )应用一种推导高阶矩的方法来获得观测降水时间序列的三阶矩函数。艾文和法夫尔(引文2012)通过引入瞬态风暴到达率的概念完善了Neyman-Scott模型结构。其他努力,有大量证据表明降水量分布是重尾的,已经投入(Furrer 和 Katz引文2008)。从这个意义上说,近年来出现了几个结合重尾分布函数的工作组(例如 Hundecha等人,2017)。引文2009年,埃文等人。引文2018年,安引文2020)。最近,帕帕莱西乌(引文2022)开发了一种二态降雨模型 CoSMoS-2s,强调了选择适当的分布来描述非零降雨的重要性,并指出如果拟合的边际很好地描述了降雨的行为,那么它也会重现尾部属性,从而极端行为。然而,尽管分布似乎可以很好地描述观察结果,但这并不能保证其尾部精确地再现极端值(Papalexiou引文2022)。尽管如此,不确定性的来源仍然在于观测到的降雨时间序列(Merz 和 Blöschl引文2008 年,萨拉查-加兰等人。引文2021)。其他作者(例如 Beneyto等人)也关注这一点。(引文2020),建议将更稳健的研究(例如区域降水研究)纳入工作组的参数化,类似于 Evin等人。(引文2018),明显降低了低频流量估算的不确定性;然而,减少不确定性并不属于他们的工作范围。

最近的研究主要集中在气候变化的影响上,评估基于工作组的降尺度在应用于未来气候预测时所带来的不确定性(例如 Chen等人, 2017) 。引文2011,维塞利等人。引文2019年,沙拉法蒂和佩泽什基引文2020)。然而,我们在文献中没有发现任何研究旨在量化与可用信息量相关的工作组生成的低频分位数估计的不确定性。

本文的主要目的是量化较高降水量的不确定性X时间 
随机工作组在四种不同的实际可用信息场景中生成的估计。这些可大致分为两组:两种情景,其中唯一可用的信息是观测,另两种情景包含来自年度最大日降水量区域研究的信息。根据位于西班牙地中海沿岸(即半干旱气候)的一个现有雨量计创建了一个综合研究区域。使用专注于极端事件的工作组进行蒙特卡罗模拟,评估模拟的三个性能指标

一直是一个问题,特别是在现代洪水建模研究中,其中水文模型由工作组产生的降水提供数据。其背后的主要原因是可用气象数据系列的长度较短,这阻碍了工作组适当捕获低频事件。本研究旨在通过评估可靠的降水数据系列的重要性以及纳入额外信息作为工作组的输入来为该领域做出贡献,从而更好地未知节点类型:字体未知节点类型:字体 
估计并减少其不确定性。

2 综合案例研究
2.1 位置和可用气象数据
我们的综合研究区域并不是完全虚构的研究区域,而是利用从位于西班牙地中海沿岸的一个雨量计获得的信息建立的,在对该地区不同雨量计进行统计分析后,该雨量计被认为代表了半干旱气候。1951-2015 年期间的每日降水量记录是从 Spain02-v5 数据集获得的(Herrera等, 2015) 。引文2016,科特拉斯基等人。引文2017):0.11°旋转网格中的一系列插值降水和温度数据。该地区的气候属于半干旱气候:尽管年平均降水量为 570 毫米,但 75% 以上的天数是干旱的,降水主要集中在秋季,受中尺度对流系统(MCSs)的影响很大。 )(拉萨特和普伊格塞弗引文1990年),导致暴雨事件。这些降雨约占年降雨量的40%。春季(25%)和冬季(20%)的特点是与大西洋纬向流相关的锋面系统的通过,而夏季记录的大部分降水(15%)源自孤立的对流风暴(Mateu)引文1974 年,卡马拉萨·贝尔蒙特和塞古拉·贝尔特兰引文2001)。包含基本观察统计数据的表格如下所示表格1。此外,还可以观察到月平均降水量以及逐月的年每日最大发生次数图。1。

2.2 随机工作组:GWEX
这项工作中使用的多站点工作组是 GWEX(Evin等人,2017)。引文2018),由国家科学研究中心 (CNRS) 开发,并于 2018 年首次提出。该工作组旨在关注极端事件;它遵循威尔克斯方法(Wilks引文1998),其中降水发生和降水量分别建模。因此,每个位置的现场发生过程由p阶马尔可夫链定义,并且使用未观测到的高斯随机过程对降水状态的空间依赖性进行建模。对于强度过程,GWEX模型利用尾部相关的空间分布来生成降水量;自相关时间过程;以及每个雨量计和一年中每个月的边际重尾分布。该分布就是扩展广义帕累托分布(E-GPD),由 Papastathopoulos 和 Tawn 首先提出(引文2013),并已被证明可以充分模拟低降水强度和高降水强度(Naveau引文2016)。

3 方法论
根据第 2.1 节中描述的一个雨量计的 66 年样本创建了一个合成“基础”总体。定义该群体的所有参数均使用 GWEX 进行估计。此外,为了简单起见,从现有区域研究中获得的 Ψ 值 0.11 被分配给一年中的所有月份。为了充分占领他们的基地 未知节点类型:字体未知节点类型:字体
, GWEX 模拟了 15 000 年,复制了主要统计数据图。1。

针对该总体,使用 50 × 60 年样本进行了蒙特卡罗模拟研究,这对于当前每日降水记录的范围来说是合理的。对于每个样本,首先从样本记录中拟合与降水发生、数量和时间相关性相关的所有WG参数;然后,根据信息场景,我们估计形状参数 ψ 如下:

对于每个实现,按照 Evin等人的建议,将 xi 参数值设置为 0.05(默认)。(引文2018)。

根据现有观察估计。

有一项关于年最大日降水量的区域研究:

(1) 参数 xi 是用每个实现的一个高 T 区域分位数来估计的(如果不是区域 E-GPD)。

(2) 参数 ψ 设置为每个实现的区域值(如果是区域 E-GPD)。

为简单起见,假设年最大日降水量的区域研究是“完美的”(即没有不确定性)。
4 个结果
4.1 信息场景
进行的第一个分析旨在找到呈现最佳分位数估计的信息场景。图3显示了不同回报期和四种信息场景的 50 个实现的模拟分位数的箱线图。模拟分位数的值(用人口分位数标准化)显示在 x 轴上,不同的重现期显示在 y 轴上。上图(即情景 0 和情景 1)显示了 WG 校准中未添加额外信息时的结果,而下图(即情景 2 和情景 3)则整合了年度最大日降水量区域研究的信息。校准过程。乍一看,从图3可以看出,当纳入额外信息进行校准时,工作组的性能会更好。在场景 0 中,将 xi 保留为默认值,分位数估计显示所有分位数都被系统性低估,当我们转向更高的分位数时,这一点更加明显。在场景 1 的情况下,其中 xi 参数是用样本估计的 未知节点类型:字体未知节点类型:字体
,所有分位数估计都有轻微的改进;然而,仍然可以获得显着的RRMSE值,特别是对于高回报期。与场景 0 相比, CV值显着增加,这是通过样本变异性来解释的。

(即场景 2)导致所有分位数的RRMSE和CV显着降低。考虑到在这种情况下参数 xi 是用区域校准的 ,该分位数的两个指标的预期值都较低;但也取得了令人满意的结果 

估计,RRMSE值分别为 2.46% 和 6.56%,这意味着与情景 0 相比,RRMSE分别降低了 89% 和 75%(图4)。高频分位数仍然被低估;这是因为参数 xi 不会显着影响分布函数下部的形状(图2)。最后,将区域参数应用于所有实现(场景 3),与预期相反,我们观察到所有分位数估计都存在系统性负相对偏差,这可能归因于方法本身的不确定性。尽管如此,与没有纳入额外信息的两种情况相比,RRMSE和CV的降低都很明显;然而,在用区域估计参数 ϵ 的情况下,这种减少幅度更大。

4.3 人口极值
此分析的目的是评估群体的极端性是否会对工作组的绩效产生影响。
被证明对分布函数的上部没有太大影响,因此,通过增加参数 xi {0.09、0.11、0.13 和 0.25} 的值创建了四个合成种群。采用 50 × 60 年样本进行蒙特卡罗模拟研究,用区域 未知节点类型:字体未知节点类型:字体
每个人口。结果是图7显示相对偏差和四分位距随着极值的增加而增加,表明气候越极端,WG 的表现越差。这种衰减对于高回报期更为明显,而对于低于 50 年的回报期则几乎难以察觉。

4.4 样本长度灵敏度
最后,对样本长度的敏感性进行了分析,以评估更长的降水数据集是否可以提高工作组的性能。通过蒙特卡洛模拟,对所有重现期的 50 次实现评估了 60 年、90 年和 120 年的样本长度。图8显示了场景 3 中 T = 10、T = 50、T = 100 和 T = 500 年的结果(Σ 设置为 0.11)。RRMSE和CV均略有降低,这是可观的。在这种情况下,样本延长 60 年意味着RRMSE分别降低 14%、14%、18% 和 20%,并且 CV 也获得类似的降低。

5 讨论
记录的降水数据集仍然太短,无法提供低频分位数的可靠估计。可用观测中记录的极端事件数量有限,使得使用统计或确定性方法等传统方法难以对其进行充分估计,从而导致分位数估计不确定。延长降水记录是近年来广泛采用的解决方案。工作组是能够根据观测统计数据将现有降水记录扩展到无限长度的工具。尽管如此,估计的不确定性仍然取决于可用信息的数量。如今的文献中可以找到许多源自工作组使用的应用,例如气候降尺度或水文建模,通过将 WG 产生的降水输入水文模型,即所谓的连续综合模拟方法。尽管已经证明工作组可以令人满意地再现普通降水,但在现有观测中很少能发现异常降水事件,这使得工作组很难充分再现极端事件。因此,低频分位数估计仍然存在很高的不确定性。在干旱和半干旱气候中,这种不确定性甚至更高,这些极端事件通常强度更大,发生频率更低。事实上,在现有观测数据中发现的异常降水事件很少,这使得工作组很难充分再现极端事件。因此,低频分位数估计仍然存在很高的不确定性。在干旱和半干旱气候中,这种不确定性甚至更高,这些极端事件通常强度更大,发生频率更低。事实上,在现有观测数据中发现的异常降水事件很少,这使得工作组很难充分再现极端事件。因此,低频分位数估计仍然存在很高的不确定性。在干旱和半干旱气候中,这种不确定性甚至更高,这些极端事件通常强度更大,发生频率更低。

许多作者提出使用不同的重尾分布函数来模拟降水强度过程,这已被证明可以大大改善分位数估计。其他人,例如埃文等人。(引文2018),认为除了可用的现场观测之外,还需要更强有力的研究来充分估计某些工作组参数,特别是在试图捕获极端值时。贝尼托等人。(引文2020)提出了一种更好地估计洪水分位数的方法,其中工作组使用从年度最大日降水量区域研究中获得的信息进行校准。他们获得了满意的结果;然而,分位数不确定性降低的量化不在他们的工作范围内。我们在文献中找不到评估工作组生成的分位数估计的不确定性的研究,而这正是这项工作的目的。

由于。。。导致的结果图3表明,在那些无法对年度最大日降水量进行区域研究的研究中(上图),分位数估计值往往会被系统性地低估,尤其是低频估计值。结合年度最大日降水量的区域研究来估计某些 WG 参数(下图)明显提高了 WG 的性能,特别是在关注极端情况时,使CV和RRMSE大幅降低。这种减少对于情景 2 来说更为明显,这表明使用区域
WG 校准比使用区域 Χ 提供更好的结果。这一结果虽然不是预期的,但构成了一个优势,因为使用区域 xi 进行 WG 校准的可能性仅限于那些 WG 和年最大日降水量的区域研究纳入了 E-GDP 分布函数的研究。

将场景 2 设置为信息场景,在减少不确定性方面提供最佳结果,并且
作为参考分位数最合理的选择,对人口极值的敏感性进行了分析。由于参数

被证明不会对 E-GPD 的上尾产生实质性影响,这种极值是通过增加参数 xi {0.09、0.11、0.13 和 0.25} 的值引入到合成总体中的。图7显示每个合成群体的蒙特卡罗模拟结果。可以看出,RRMSE和CV都倾向于随着参数 xi 的值而增加,这在低频情况下更为重要 
,这与 Breinl等人的结论一致。(引文2017),意味着气候越极端,WG的表现越差。这强化了这样的想法:每日降水量的随机生成应根据气候条件进行调整(Li 和 Shi)引文2019)。

此外,还进行了对样本长度的敏感性分析。世界气象组织(WMO)设定30年为标准参考期引文2011),在大多数气候相关研究中使用这一点已成为常见做法。然而,如前所述,工作组生成基于可用观测值的观测统计数据,因此,较长的样本应该会带来更好的分位数估计(不确定性较小)。由于我们是从 66 年的样本中抽取的,因此选择 60 年的标准样本长度进行所有分析。在不考虑较长样本量的非平稳性的潜在问题的情况下,我们对场景 0 和场景 3 的三种不同样本长度(即 60 年、90 年和 120 年)重复了蒙特卡罗模拟。尽管RRMSE和CV均略有下降在场景 3 的情况下可以被察觉,而在场景 0 的情况下则难以察觉,即使在观察长度加倍后也无法突显出重大改进。至少对于半干旱气候来说,这意味着 30 年的假设可能不足以反映正常气候。然而,纳入年度最大日降水量的区域研究显然在校准过程中增加了比可用观测长度更多的信息。因此,这些结果表明,即使在 50 年后,观测本身也不足以正确估计极端降水分位数;其他信息来源仍需要纳入工作组校准过程,

6。结论
使用工作组已成为水文学界扩展可用气象记录的常见做法。然而,这种方法高度依赖于现有的观测结果,特别是在干旱和半干旱气候下,因为它们具有独特的降水模式。这些极端事件的可用记录较短且时空变异性较高,使得工作组很难获得可靠的低频分位数估计,因为不确定性的主要来源仍然在于可用信息量。

本研究分析了工作组在不同的实际可用信息场景中生成的分位数估计的不确定性,重点关注极端事件。已经测试过的工作组获得了令人满意的结果(参见Beneyto等人,2017)。引文选取2020 )进行分析,通过修改边际分布函数的参数ψ来整合不同的信息场景。该研究的目的不是评估工作组的表现,而是评估模型校准的可用信息所带来的较高分位数估计的不确定性的潜在降低。

我们的结果表明,即使工作组采用新方法来更好地捕获极端事件(在我们的例子中,是用于模拟降水量的重尾分布函数),如果模型校准过程中没有集成其他信息,低频分位数估计值由于当前可用记录的长度有限,因此仍然存在高度不确定性。仅使用可用的观察结果会导致所有分位数估计值的系统性低估,并且随着返回期的增加而增加。当没有其他信息可用时,采用不同的方法(即用样品校准工作组) 
)经过测试并产生了稍微好一点的结果,尽管它重新调整了CV的高值(由样本变异性解释)。

当输入数据有限时,在模型校准中纳入附加信息的重要性已得到证明。此外,根据区域情况校准工作组
比使用总体 xi 提供了更好的结果,这是一个明显的优势,因为后者仅限于 WG 和年最大日降水量区域研究共享相同分布函数的研究。

由于参数 xi 对较低分位数的敏感性,这些值导致低频分位数的高估,而较高分位数并没有显着降低估计的不确定性。

此外,气候极值被证明是分位数估计不确定性的一个关键因素,这对于低频分位数来说更为明显,这证明在这些类型的气候下,特别需要在工作组校准过程中整合额外的信息(即干旱和半干旱气候),其中大部分年降雨量集中在短暂的极端事件中,例如西班牙地中海沿岸的情况。

最后,与纳入附加信息时获得的减少相比,在分析不同样本长度时,没有发现估计不确定性显着减少,这意味着整合年度最大日降水量的区域研究比输入数据系列提供了更多信息30或更长 60 年。

这些发现表明,独立于工作组,仅依赖当前或短期和中期的可用观察结果可能会导致分位数估计值的系统性低估,特别是那些与低概率相关的估计值;因此,在估计低频分位数时,特别是在干旱或半干旱气候下,显然需要在工作组的校准过程中纳入更多信息。在这项研究中,已经证明,整合年最大日降水量的区域研究是解决现有观测信息缺乏的良好做法,在减少较高重现期分位数估计的不确定性方面提供了令人满意的结果。

发布日期:2024-02-02