新闻资讯

使用机器学习算法预测涡轮机发电量,以化石燃料替代可再生能源

一、简介
可再生能源 (RES) 在减少世界碳足迹方面变得越来越重要(Caglayan 等人,2019)。传统化石燃料的替代品包括风能(Wang等,2018;Dai等,2019)。例如,欧洲国家大幅增加新建海上风电场的数量。截至 2017 年,全球新建海上风电容量的 80% 位于欧盟国家(Caglayan 等,2019)。
海上风电场比陆上风电场拥有更多的风源、豪华的建筑位置以及更高的风电发电能力(Wang et al., 2019)。因此,风力涡轮机行业经历了从陆上风力涡轮机向海上风力涡轮机的稳步转变。同时,由于其运行环境不可预测以及海上风力发电机的故障,人们越来越关注提高海上风力发电机的性能。目标是降低新安装的可再生能源收集的能源成本(Chen 等人,2018 年;Yin 和赵,2019 年)并提高能源效率(Castellani 等人,2017 年))。准确的功率预测很困难,但对于风力涡轮机来说至关重要,因为它可以降低运营成本(Wang et al., 2017),这对于风电场从陆上向海上过渡至关重要(Arun Kumar et al., 2019)。
许多学者,如 Patak 等人。(Pathak 等人,2021)、Chudari 等人。(Chaudhary 等人,2020)和 Zumar 等人。(Zameer 等人,2015)设计了使用 RES 产生预测功率的软件模型,并在预测风力涡轮机的发电功率方面取得了可接受的结果。目前正在研究使用 RES 生成预测功率的适当软件模型的开发。这些算法未能在各种风力条件下提供可接受的结果。
当今世界,短期记忆预测方法和光梯度放大机器模型很流行(Duan,2021;Singh et al.,2021)。在可再生能源领域,风力发电发挥着重要作用。近年来,产能呈指数级增长(Manobel et al., 2018)。杨等人。(杨等人,2021)领导了一个学者团队来创建预测,使用了模糊 C 均值 (FCM) 聚类算法。已经证实,基于卷积神经网络和长期记忆 (CNN-LSTM) 的新型风能预测时空相关 (STCM) 模型在提取更好的空间和时间特性方面比标准模型更成功。基于卷积神经网络和长期短期记忆 (CNN-LSTM) 的独特时空 (STCM) 操作已被创建来预测风能,提取比以前的模型更好的空间和时间特征。
工业革命导致电力消耗激增,化石燃料大量开采,能源危机迫在眉睫(赵等,2016)。全球范围内都在鼓励刺激可再生能源使用的监管活动,以帮助缓解能源问题。风能作为可再生能源最近受到了广泛关注。风能因其广泛的可用性、低廉的投资成本(美国能源部)和零碳排放而越来越受欢迎。风能有助于减少污染(Jong 等人,2016)。作为一项尽量减少温室气体排放的战略,它正在全球范围内实施。此外,用风力发电代替热能可以节省汽油费用,因为风能没有燃料支出。据世界风能理事会(Global Wind Energy Council)统计,2016年全球市场风电总装机容量达到486吉瓦。风电预计将大幅增长,最终实现零排放电力系统(Shafiee et al ., 2016 ; Tomporowski 等人, 2017 )。到 2030 年,美国能源部的可再生能源并网目标要求风能提供总能源的 20%(美国能源部,2008)。独立系统运营商 (ISO) 产生大量风电并增加风电输出。气象变量,特别是风速,对风力发电有显着影响。由于风能的不稳定和间歇性,发电量是不确定的。电力系统的运行,如配电、调度、高峰负荷管理等,受到这种不确定性的显着影响(Athari和Wang,2018)。由于风能被认为是最有前途的可再生能源之一,风力涡轮机正在世界范围内建造。2015年,欧洲风电年装机容量为12.8吉瓦,其中海上风电占总量的25%以上。到 2015 年,欧洲已建成近 142 吉瓦的风能(欧洲风能协会,2016)。虽然大量的风能将提供多种优势,但仍有许多障碍需要克服,特别是在未来的运营和维护 (O&M) 成本方面。因为运营和维护风电场占电力生产总成本的25%至30%(Milborrow,2006)。机器学习算法在各个领域都很流行(Bhattacharyya 和 Vyas,2021;Bhattacharyya 和 Vyas,2022)。
2. 研究算法
2.1. 额外的树
集成学习技术使用极其随机的树。它构建决策树的集合。在树构建过程中,选择随机决策规则。只有分割值的随机选择与随机森林方法不同。
2.2. 随机森林回归 (RFR)
RFR 是一种将方法组组合在一起的技术。它提高了测试的准确性,同时降低了存储、培训和从多种方法得出结论的成本。RFR 是一种著名的回归模型,它同时使用一组模型。在这个模型中,许多决策树都经过训练,这就是它被称为“森林”的原因。RFR 的输出是每个预测树的平均值。使用装袋和随机子空间方法来制作它。当您打包或使用引导时,您可以在不同的数据集上训练每个学习者。在 RFR 中,数据用于同时构建多个树。没有一棵树依赖于另一棵树。因此,它被称为并行过程(Gupta et al., 2021)。RFR 的主要好处是训练时间更少且准确
 
其中K是为引导样本生成的单独回归树的数量,x是输入向量,h k ( x ) 是K 个回归树做出的预测的平均值。
2.3. 光梯度增强机
与随机森林一样,光梯度增强机方法使用决策(弱)树。光梯度机方法和随机森林的区别在于梯度强化方法中树是一棵接一棵地被教导的。每个子集树主要使用前三个子集错误预测的数据进行训练。这使得模型较少关注易于预测的问题,而更关注复杂的问题。Leoberman 观察中强化梯度的主要思想是,强化可以解释为适当成本函数上的优化算法(Barros 等人,2021)。考虑了可再生能源中的光梯度增强机算法(Park et al., 2020;Singh et al., 2021;顾等人。2019年;崔和许,2020;哈特等人,2000)。在许多监督学习问题中,输出变量y和输入变量x的向量通过某种可能的分布相关。

我们将我们的方法限制为简化形式,因为在每个阶段为任何损失函数L选择适当的h函数通常是计算机优化的挑战。目标是使用最陡的着陆步骤(功能性斜坡下降)来解决这个最小化问题。

2.4. 梯度提升
通过增加树集成中的梯度,每次迭代时模型中都会包含新树以弥补缺陷。当数据集的特征变化很大时,通常会使用这种模型。另一方面,AdaBoost 依靠梯度来识别缺陷。另一方面,梯度增强模型更能抵抗异常值。广义的 AdaBoost 梯度提升似乎可以容纳许多损失函数。回归模型中经常使用诸如“Huber”和“绝对”损失函数之类的损失函数。这些损失函数比平方损失函数更能抵抗异常值。梯度增强回归器使用 Huber 损失函数(Chaibi 等人,2021)作为计算其损失的参数。除了差分损失函数(即本例中的“偏差”)和期望值之外,还可以考虑购买培训设备(其中)。

2.5. 决策树
DTR 使用 Quinlan C4.5 方法的修改版本(Quinlan,2014)。DTR 基于 CART 方法(Breiman 等人,2017)。然而,DTR 目前使用 Quinlan 的 C4.5 方法的修改版本(Quinlan,2014)。
以下是本文将涵盖的两个主要主题:
1. 节点结构:每个节点通过存储确定树结构的属性来指导预测过程。
2. 节点分裂:节点分裂标识了划分节点所需的特征和阈值。在计算等式( 13 )中的各种特征k和阈值t k的CART成本函数之后,该节点被划分为特征和阈值,以最小化成本函数。

2.6。艾达增强
当其他一切都失败时,Boosting 就会派上用场。如今,许多用户使用 XGBoost、LightGBM 或 CatBoost 来赢得 Kaggle 或 Hackathon 活动。这是使用 AdaBoost 进入 Boosting 领域的第一步,它是解决实践中最早使用的 boosting 方法之一。Adaboost 使得从众多“弱分类器”中创建单个“强分类器”成为可能。
2.7. 岭
在自变量强相关的情况下,岭回归是一种估计多元回归模型系数的技术。它已被用于各个学科,包括工程、化学和计量经济学。过度拟合是岭回归解决的一个问题,因为单独的平方误差回归无法区分重要和不重要的特征,而是使用所有这些特征,从而导致过度拟合。岭回归引入少量偏差以使模型与数据的实际值相匹配。
3. 方法
3.1. 数据准备
数据(https://www.kaggle.com/datasets/alexmoskvin1/windturbinescada)包含85,066行×10列的数据特征如下所示:
风速、功率、风向角、rtr_rpm、桨距角、发电量、轮毂温度、环境温度、塔底环境温度、故障时间。
数据记录时间为2020年3月1日00:00:00至2020年12月31日23:50:00。
3.2. 进化过程
在十倍的交叉验证中(Malakouti 和 Ghiasi,2022;Malakouti 和 Ghiasi,2022),该模型在几轮中使用各种数据点进行评估和训练。大多数人在尝试预测某些事情并想了解模型在现实情况下的效果如何时都会使用它。我们使用交叉验证技术,60% 的数据用于训练,40% 用于验证和测试。
4 结果与讨论
残差图用于测试 OLS 线性回归模型的假设。拟合值或其他变量显示在x轴上,而其余值则绘制在y轴上。拟合回归模型时,必须查看其余图表。图 1至图 7给出了额外树、随机森林、光梯度增强机、梯度增强回归器、决策树、Ada Boost 和岭的预测功率和实际功率的图表。

众所周知,随机森林算法在预测风机发电功率时所分配的误差大部分接近于零。比较额外树算法和随机森林算法的性能,额外树算法的误差更接近于零。随机森林算法需要 340 秒才能运行。
众所周知,lightgbm算法在预测涡轮机发电功率时所分配的大部分误差接近于零。比较extratree算法和lightgbm算法的性能,extratree算法的误差更接近于零。lightgbm算法运行时间为53秒。
众所周知,决策树算法在预测风机发电功率时所分配的误差大部分接近于零。比较额外树算法和决策树算法的性能,额外树算法的误差更接近于零。决策树算法需要 5.8 秒才能运行。
众所周知,梯度增强回归算法在预测涡轮机发电功率时所分配的大部分误差接近于零。比较 Extra 树算法和梯度提升回归器算法的性能,Extra 树算法的误差更接近于零。梯度增强回归算法需要 92 秒才能运行。
众所周知,在与Extra tree算法的性能比较时,Ada Boost算法在预测涡轮机发电功率时所分配的误差被分配了更多的值。Ada Boost 算法需要 39 秒才能运行。
众所周知,在比较 Extra 树算法的性能时,岭算法在预测涡轮机发电功率方面的误差被分配了更多的值。岭算法需要 35 秒才能运行。

5. 结论
由于化石燃料的减少以及化石燃料发电的污染,可再生能源应该被不可再生能源取代。因此,在不远的将来,我们将看到可再生能源产能被化石燃料发电厂产能取代。本文研究了一个风电场。借助额外的树、光梯度提升机、梯度提升回归器、决策树、Ada Boost和山脊发电进行预测。不到一分钟的时间,我们就可以通过光梯度升压机准确预测风电场的产能。光梯度增强机算法准确度高,执行时间比其他算法少。表 1 证明了这一说法。最后一句话。在所有算法中,额外树算法的结果最好。与其他算法相比,额外树和光梯度增强机算法获得了最好的结果,并且这两种算法的优异结果。他们的执行时间也很短。根据这篇文章,我们可以安全地用化石燃料发电厂的生产能力取代风电场的生产能力,或者在化石燃料发电厂旁边使用它,而不必担心风逃逸的性质,因为我们可以很好地预测它。

发布日期:2024-03-01