新闻资讯

用于植物胁迫检测的成像传感器和人工智能的进展

介绍
植物表型分析涉及测量和研究植物特征(即表型性状),例如生长、发育以及对环境刺激和病原体的反应[ 1 ]。准确的表型分析对于植物育种和了解环境对植物生长和产量的影响至关重要[ 2 ]。随着世界人口的增长,确保充足和可持续的农作物生产已成为一项紧迫的挑战。此外,植物胁迫对植物生长、发育和生产力产生不利影响,对作物生产构成重大威胁。
早期检测和准确诊断对于有效管理和预防植物胁迫至关重要[ 3 ]。人工智能(AI)和成像传感器技术的进步已显示出准确识别和预测植物胁迫症状的潜力[ 4 ]。图像传感器与人工智能的结合可以克服目视检查等传统方法耗时、昂贵且主观的局限性。这些限制刺激了人工智能的发展和采用,彻底改变了植物胁迫识别领域。AI 可以对植物图像进行快速、客观的分析,甚至在可见症状出现之前就能够进行早期胁迫识别 [ 5]。这使农民能够及时有效地做出反应,减少作物损失并提高农业生产力[ 6 ]。
成像传感器已显示出早期胁迫识别的前景,因为它们可以快速、非破坏性且有效地对植物进行成像,记录表型性状的细微变化[ 7 ]。最近,红、绿、蓝 (RGB) 成像传感器已成为研究人员易于使用且实用的解决方案。RGB 传感器捕获反射光的可见光谱,并可以检测植物反射的红、绿、蓝光水平。信息更丰富的是,光谱成像提供了有关非生物和生物应激源引起的生化和生理变化的详细信息[ 8 ]。通过在多个波长下成像,RGB 和光谱传感器可以识别肉眼无法辨别的植物组织变化 [ 9 ]。
人工智能和成像传感器的结合有可能减少农药的使用,提高作物生产力,并通过识别和精确诊断植物胁迫症状来加强全球粮食安全[ 10 ]。人工智能和成像传感器技术的成功实施取决于克服障碍,例如创建精确且有弹性的人工智能算法,能够有效管理植物图像的复杂性和多样性[ 10 ]。
尽管人工智能和成像传感器的最新进展在识别植物胁迫方面取得了长足进步,但人工智能仍然面临着一系列普遍的挑战。例如,波动的环境条件以及不同的植物反应给准确诊断和分类应变或伤害症状带来了困难[ 11 ]。另一个核心问题是人工智能模型训练和评估任务所需的多样化、顶级数据集明显缺乏。此外,事实证明,像高光谱相机这样的高端成像传感器很难广泛部署,不仅因为其成本高,而且技术复杂——尤其是在资源有限的环境中[ 12]。进一步的挑战也与 RGB 传感器有关,因为虽然它们更容易访问和简单,但它们相对稀疏的光谱数据不足以对植物胁迫引起的生理并发症进行详尽的分析 [ 12 ]。因此,这些挑战凸显了持续研究和开发的必要性,以优化传感器技术和人工智能算法,使其更易于获取、可靠且有效地应用于各种农业应用。
在这里,我们提出了系统文献综述(SLR),全面概述了人工智能和成像传感器技术的当前趋势和进展。SLR 是一种识别、比较和总结解决特定问题的研究结果的既定方法,正在成为计算机科学中非常流行的工具 [ 13 ]。SLR 遵循严格且明确的指导方针,使研究人员能够系统地收集有关特定主题的论文,整合所提供的信息并确定进一步的研究机会。因此,与典型的文献评论相比,SLR 具有更高的准确性 [ 14]。我们的 SLR 研究了用于研究植物胁迫的成像传感器的趋势、所使用的人工智能算法以及为评估这些系统的有效性而创建的数据集。我们的审查检查了与这些技术相关的限制和困难,并强调了进一步研究的潜在途径。首先,我们确定了构成整个单反基础的研究问题:(a)图像传感器和人工智能的当前趋势是什么?(b) 检测植物胁迫存在哪些限制?(c) 哪些人工智能算法已用于对压力症状进行分类?其次,我们使用谷歌学术进行了范围界定审查,使用“植物胁迫”、“植物成像”和“人工智能”等通用关键词搜索相关论文。第三,我们使用范围界定审查的结果开发了可编程机器人,可以详尽地搜索 4 个数据库,即 Springer、ScienceDirect、PubMed 和 Web of Science,以使用这些搜索词找到最相关的研究。第四,我们使用 OneSearch 和可编程机器人访问所有 4 个数据库并搜索新的专业关键词,包括“RGB 成像”、“高光谱成像”、“监督学习”等。最后,我们在 AI 辅助下手动审查每篇输出论文ASReview 并将它们放入 Zotero 云数据库中。总而言之,这款单反相机指出了使用人工智能的植物成像传感器的当前缺陷,并提供了有关识别植物胁迫症状的最新进展的宝贵见解。使用这些搜索词找到最相关的研究。第四,我们使用 OneSearch 和可编程机器人访问所有 4 个数据库并搜索新的专业关键词,包括“RGB 成像”、“高光谱成像”、“监督学习”等。最后,我们在 AI 辅助下手动审查每篇输出论文ASReview 并将它们放入 Zotero 云数据库中。总而言之,这款单反相机指出了使用人工智能的植物成像传感器的当前缺陷,并提供了有关识别植物胁迫症状的最新进展的宝贵见解。使用这些搜索词找到最相关的研究。第四,我们使用 OneSearch 和可编程机器人访问所有 4 个数据库并搜索新的专业关键词,包括“RGB 成像”、“高光谱成像”、“监督学习”等。最后,我们在 AI 辅助下手动审查每篇输出论文ASReview 并将它们放入 Zotero 云数据库中。总而言之,这款单反相机指出了使用人工智能的植物成像传感器的当前缺陷,并提供了有关识别植物胁迫症状的最新进展的宝贵见解。我们使用 ASReview 在 AI 辅助下手动审核每篇输出论文,并将其放入 Zotero 云数据库中。总而言之,这款单反相机指出了使用人工智能的植物成像传感器的当前缺陷,并提供了有关识别植物胁迫症状的最新进展的宝贵见解。我们使用 ASReview 在 AI 辅助下手动审核每篇输出论文,并将其放入 Zotero 云数据库中。总而言之,这款单反相机指出了使用人工智能的植物成像传感器的当前缺陷,并提供了有关识别植物胁迫症状的最新进展的宝贵见解。
人工智能和图像传感器
人工智能的最新进展归功于机器学习(ML)和深度学习(DL)算法的快速发展以及数据处理和计算能力的改进[ 15]。因此,人工智能已应用于各个研究领域,包括识别和控制植物胁迫。人工智能研究激增的一个关键因素是,最近现代植物成像传感器提供了大量关于应激症状的高质量数据,人工智能算法可以使用这些数据。在本节中,我们将深入探讨成像传感器和人工智能在识别植物胁迫症状中的作用。具体来说,我们将探讨成像传感器和人工智能之间的协同作用,成像传感器如何实现精确而全面的数据收集,以及人工智能算法如何分析数据并做出准确的预测。
成像传感器当前的趋势和局限性是什么?
对于处理捕获的光的电子设备,必须使用成像传感器将光转换为电子信号[ 16 ]。成像传感器很常见,存在于智能手机和数码相机等各种电子设备中,用于捕获图像和视频。成像传感器的发展随着时间的推移经历了逐渐的演变。RGB 或颜色传感器是一种用于捕获可见光谱(400 至 600 nm)数字图像的设备。它包含 3 个基色通道:红色、绿色和蓝色,组合后可创建彩色二维图像。RGB 传感器通常用于遥感中的各种用途,例如监测植物叶子颜色或纹理的变化 [ 17]。选择 RGB 传感器是因为其高分辨率和颜色深度,这非常适合对生长、植物着色和形态测量进行详细视觉分析至关重要的应用。因此,RGB 成像是研究界最流行的传感器。它们在受控(温室和生长室)和现场环境中的成本效益和多功能性使其成为预算和适应性为关键考虑因素的研究的热门选择。此外,RGB 传感器对不同作物类型和环境条件的适应性使其成为农业环境中最通用的工具。
为了分析植物图像并提取特征(例如颜色信息和植物形状等表型特征),研究人员使用图像处理方法。图像处理需要检查图像中存在的图案和变化(边缘、线条或斑块)以检测植物结构的修改[ 18 ]。例如,基于颜色的算法通常用于识别与压力相关的叶子色调、饱和度或亮度的变化[ 19 ]。此外,对 RGB 图像进行纹理分析,以检测叶子纹理的差异,这可以作为压力存在的指标 [ 20]。集成颜色和纹理分析提供了一种经济有效且非侵入性的方法来识别植物胁迫症状。然而,尽管 RGB 传感器得到了广泛的应用,但它仍存在一些限制其适用性的局限性。对于图像处理算法来说,叶子颜色或纹理的非生物变化可能并不明显[ 12 ]。此外,RGB 传感器还受到照明条件、阴影和反射等外部因素的限制,这些因素可能会影响这些传感器的精度 [ 21 ]。
为了克服 RGB 传感器的局限性,光谱成像传感器已成为许多研究人员的首选,因为它们可以跨多个窄光谱带获取和评估数据,从而更好地了解植物的生理学 [ 22 ]。光谱成像检查植物的光谱特征,从而能够识别使用 RGB 传感器无法辨别的化学和生物特性。光谱传感器使用超出可见光谱(300 至 900 nm)的波长捕获图像,对图像中的每个像素都具有高光谱分辨率,从而提供植物整个电磁频谱的全面概览[ 23]]。通过检查植物的光谱轮廓,光谱传感器可以检测健康指标的变化,例如叶绿素浓度或水含量,而 RGB 传感器无法辨别这些变化。此类信息有可能识别初始阶段的压力并监测其随时间的进展[ 24 ]。尽管成本和数据处理要求较高,但光谱成像的选择通常取决于深入分析的需要。因此,光谱传感器特别有利于深入分析在胁迫下表现出微妙生理变化的特定作物。然而,光谱成像不太容易受到照明和反射的外部变化的影响[ 25] 因为数据是在特定波长下采集的,不易受到这些因素的影响 [ 21 ]。尽管光谱传感器具有优势,但这种类型的成像更昂贵,特别是具有高光谱分辨率(900 至 2,500 nm)的传感器[ 21 ]。此外,光谱成像会生成大量数据,需要专门的软件进行处理和分析。即使使用专门的软件,该过程也可能很费力,并且需要数据分析方面的专业知识[ 8]。诸如此类的挑战通常是研究人员选择 RGB 传感器的原因,即它们的成本效益、更简单的操作要求以及与智能手机和数码相机等常用设备的兼容性。尽管如此,光谱成像是研究植物胁迫反应的一项强大技术,特别是与人工智能算法和地面实况数据相结合时。因此,光谱成像的选择通常围绕深入分析的需要,而不考虑其更高的成本和数据处理要求。
尽管光谱成像取得了进步,但研究人员偶尔会转向针对特定实验要求定制的更专业的传感器。其中,荧光成像作为一种独特而强大的成像传感器脱颖而出。该传感器擅长检测特定波长(250 至 700 nm)下植物结构和生化属性的细微变化,使其对于识别胁迫反应特别有效[ 8 ]。研究人员利用荧光成像根据荧光发射的变化来区分受胁迫和未受胁迫的植物,这些荧光发射可以转化为光合作用反应[ 26]。然而,荧光成像中一个值得注意的考虑因素是暗适应的需要。植物通常需要在黑暗中适应一段时间才能确保准确的荧光测量,因为环境光会影响荧光信号[ 27 ]。这一要求可能会增加实验设置的时间和复杂性,限制该方法在某些研究背景下的便利性和适用性。荧光成像在可以管理暗适应条件的受控环境中尤其重要,尽管其成本较高且需要专门的操作要求[ 27]。尽管荧光成像能够有效地揭示胁迫引起的植物生理学变化,但其应用并不像基于 RGB 或光谱的传感器那样广泛。因此,荧光成像的使用源于多种因素,包括其高成本,这限制了其可及性并限制其主要用于资金充足的研究项目。此外,荧光传感器的特异性意味着它们仅适用于某些情况,特别是在提取特定荧光特征至关重要的情况下。因此,荧光成像在植物胁迫检测中的使用虽然在特定情况下非常有效,但由于这些实际、财务和程序方面的限制,仍然不如 RGB 常见。
对于热传感器的使用也可以这样说。热成像或红外传感器是检测和测量物体或表面发出的红外辐射以根据温度变化创建图像的设备[ 28 ]。与传统 RGB 传感器检测的可见光不同,热成像传感器在红外光谱(7 至 14 μm)内工作,通过测量植物发出的红外辐射来监测植物胁迫[ 29]。这些传感器提供了独特的视角,使研究人员能够检测植物温度的变​​化,这可以表明水分胁迫、疾病或其他肉眼不可见的生理变化。热成像在大规模农业监测与温度相关的胁迫方面特别有价值,早期发现胁迫因素可以及时干预并改善作物管理[ 30]。尽管热成像有其优点,但它在植物胁迫研究中的使用并不像 RGB 或光谱传感器那么频繁。原因之一是热成像设备的复杂性和成本。高质量的热传感器往往价格昂贵,因此不太容易获得。此外,热成像需要特定的专业知识来准确解释数据,因为温度读数可能受到湿度和风等环境条件的影响[ 3​​1 ]。这种增加的复杂性意味着热成像对于研究人员来说并不总是最实用的选择,特别是在控制环境变量具有挑战性的现场TR中[ 32]。此外,热成像虽然可以有效检测与温度相关的应激指标,但可能无法提供全面了解植物健康所需的全面数据。RGB 和光谱传感器能够捕获更广泛的数据(包括颜色和光谱反射率),提供更全面的植物状况视图。这些传感器可以检测颜色和反射率的细微变化,这些变化表明各种应激因素,包括营养缺乏、害虫侵扰和疾病存在,而这些因素并不总是可以通过热成像来辨别。因此,许多研究人员选择 RGB 或光谱成像传感器,因为它们可以提供更通用、更详细的植物健康分析,适合更广泛的研究应用。
关于在植物胁迫研究中使用卫星成像,可以进行类似的观察。从装有 RGB 等各种传感器的轨道卫星捕获的卫星图像以及多光谱和热特征为研究人员观察广泛的环境变化和评估大面积植物健康提供了无与伦比的视角[ 33 ]。卫星图像在记录干旱、森林砍伐或虫害等事件方面特别有用,提供有助于生态保护工作以及宏观层面农业实践管理的关键数据[ 34]。尽管有这些好处,卫星成像对于详细的植物胁迫研究仍处于起步阶段,特别是与航空和地面 RGB 或光谱传感器相比。卫星成像的主要限制是其空间分辨率[ 35 ]。虽然最近的进步大大提高了卫星图像的分辨率,但它们通常无法与地面传感器捕获的精细细节相匹配[ 35 ]。使用卫星图像的另一个挑战是数据采集的频率[ 36]。卫星立交桥可能并不总是与某些研究所需的具体时间保持一致,从而导致数据收集方面的差距。这种时间限制在植物胁迫研究中至关重要,因为变化可能会迅速发生,并且需要非常频繁地监测才能进行准确分析。此外,卫星图像可能会受到云层等大气条件的影响,云层可能会阻碍地球表面的清晰视野[ 36]。这个问题增加了不可预测性,限制了用于连续监测目的的卫星数据的可靠性。因此,虽然卫星成像为大规模环境监测提供了宝贵的见解,但在重点植物胁迫研究中,它通常被 RGB 或光谱成像提供的更详细和频繁的数据所补充或次要。
LiDAR(光检测和测距)是另一种类型的成像传感器,越来越多地用于监测植物胁迫。LiDAR 传感器的工作原理是向物体发射激光脉冲并记录反射返回所需的时间,从而构建有关物体形状和结构的详细 3 维 (3D) 点云。激光雷达特别擅长捕捉植物的结构特性,例如冠层高度和叶面积指数,从而告知干旱或疾病等应激源的存在[ 37 ]。最近的研究表明,激光雷达成像传感器的点云数据可以成功揭示植物的结构不规则性,从而在使用传统成像技术注意到压力之前提供早期压力指标[ 38]。尽管有这些优点,但由于多种原因,激光雷达的使用还不是很频繁。首先,激光雷达设备(尤其是高精度模型)的成本可能很高,这使得许多研究项目难以使用它。其次,虽然激光雷达擅长捕获结构数据,但它无法提供有关植物颜色或光谱特性的信息,而这些信息对于识别各种应激症状至关重要。第三,LiDAR系统的操作和数据处理可能很复杂[ 39],因为其解释需要专门的软件和 3D 数据分析方面的专业知识。最后,激光雷达的复杂性可能会阻碍需要简单快速的数据分析方法的研究人员,尤其是在效率至关重要的大规模研究中。虽然激光雷达提供了对植物和植被物理结构的独特见解,但其在植物胁迫研究中的应用通常仅限于详细结构信息至关重要的特定研究。这些研究经常得到 RGB 或光谱成像技术提供的更全面的数据的补充。然而,未来可能会看到激光雷达数据与人工智能算法的更多集成,以提高其检测和分析植物胁迫的有效性,特别是在结构变化是关键指标的领域。
最后,近年来,通过多模式方法整合来自各种成像传感器的数据已成为综合植物胁迫分析的有前景的策略[ 40]。多模态方法结合了 RGB、光谱和其他成像传感器的各个方面,以捕获植物健康状况的更完整的图像表示。通过使用多种成像传感器,研究人员将有更多种类的特征(表型特征)可供选择,从而增强分析过程并鼓励研究人员专注于使用混合方法来处理多模式数据集。然而,多模态方法存在许多挑战,因为与数据合并相关的复杂性各不相同,同时需要能够有效分析捆绑数据集的复杂算法,这可能会大大增加计算要求,因此多模态方法可能具有挑战性。因此,在提供更丰富的分析的同时,
AI当前的趋势和局限性是什么?
人工智能是指模拟人类智能的程序,使机器能够执行推理、学习、感知和决策[ 41]。人工智能有多个子学科,例如机器学习、深度学习、自然语言处理和计算机视觉。人工智能算法用于分析广泛的数据集并检测可用于开发预测的模式。人工智能处理和分析来自各种成像传感器的数据的能力对于植物胁迫检测至关重要。先进的人工智能算法,特别是机器学习和深度学习算法,旨在适应传感器数据固有的可变性。为了减轻传感器变化带来的挑战,采用了标准化预处理技术。这些技术(例如标准化、校准和降噪)对于准备用于人工智能分析的传感器数据至关重要。它们有助于减少数据集之间的差异,使人工智能模型能够专注于相关的植物胁迫指标。例如,可以训练深度学习模型来识别和调整影响图像质量的照明或大气条件的变化,从而确保跨不同数据集进行一致的分析。在人工智能的众多分支学科中,机器学习是目前最流行、最常用的学科之一。人工智能学习过程分为监督学习和无监督学习。在监督学习中,算法从数据集中的标记示例中学习。这些示例包括输入数据,例如植物图像或光谱测量值,以及指示成像植物是否表现出对特定胁迫的耐受性或敏感性迹象的相应标签。机器学习是目前最流行和最常用的机器学习之一。人工智能学习过程分为监督学习和无监督学习。在监督学习中,算法从数据集中的标记示例中学习。这些示例包括输入数据,例如植物图像或光谱测量值,以及指示成像植物是否表现出对特定胁迫的耐受性或敏感性迹象的相应标签。机器学习是目前最流行和最常用的机器学习之一。人工智能学习过程分为监督学习和无监督学习。在监督学习中,算法从数据集中的标记示例中学习。这些示例包括输入数据,例如植物图像或光谱测量值,以及指示成像植物是否表现出对特定胁迫的耐受性或敏感性迹象的相应标签。42 ]。监督学习算法分析这些标记的示例,以识别输入数据和胁迫之间的模式,例如响应于对照或干旱胁迫条件的植物高度变化。然后监督学习概括这些知识,使其能够对看不见的数据做出预测。另一方面,无监督学习涉及探索未标记的数据集,其中计算机不知道与特定植物性状相关的数据是否是在胁迫或控制条件下收集的。无监督算法专注于识别数据的内在结构、识别模式或相似性,旨在将相似的特征聚集在一起[ 42]。这允许仅基于数据的特征来发现特征之间的关系。无监督学习可以识别植物胁迫数据集中的隐藏模式,并为胁迫反应的结构和多样性提供有价值的见解[ 43 ]。监督学习和无监督学习都是关键的人工智能原则,通常决定研究人员可以或不可以使用哪些算法进行分析。
ML 允许计算机通过学习来提高给定任务的性能,而无需显式编程 [ 44 ]。它涉及向算法(例如支持向量机 [SVM] 或人工神经网络 [ANN])提供数据,并允许它们从经验中学习和改进,使其成为动态且适应性强的人工智能子学科。作为人工智能中最受欢迎的子学科,由于大型数据集可用性的增加、计算机功能的增强以及新颖算法的出现,机器学习的使用量激增[ 45 ]。成像传感器在很短的时间内产生大量数据集,促进了人工智能的使用[ 5]。此外,机器学习彻底改变了植物成像中的数据分析过程,这主要是由于日益复杂的算法的出现。健康和压力植物的图像可以促进机器学习算法的训练,从而提供准确识别压力相关症状的能力。机器学习还提供实时分析数据的能力,为研究人员提供有关作物健康状况的及时信息。一般来说,使用机器学习进行植物胁迫检测通常需要研究人员使用专为非专家设计的用户友好的软件应用程序。这些应用程序允许研究人员轻松上传他们的成像数据,并让 ML 模型分析他们的图像(针对压力症状)。这种用户友好软件的一个例子包括流行的 PlantCV [ 46] 库,即使没有计算机科学和人工智能背景的研究人员也可以分析 RGB 和光谱成像数据。然而,尽管机器学习有很多优点,但这些算法需要大量的训练数据集才能做出准确可靠的预测。如果训练数据不足,机器学习生成的预测可能不准确[ 47 ],这可能导致错误的应力分类[ 48 ]。此外,机器学习算法对输入变化也很敏感,包括图像质量和照明条件的变化,从而导致准确性和可靠性降低。
深度学习是机器学习的一个子学科,它使用深度神经网络 (DNN) 来解决复杂问题。DNN 是具有复杂的互连节点排列的 ANN [ 49 ]。DNN 的架构受到人脑结构和功能的启发,使它们能够模拟处理和分析信息的能力 [ 50 ]。DNN 按层次结构分为多个层。每层的任务是获取不同的特征(表型特征)并允许各种类型的输入数据(例如数字、文本或视觉)。DNN 可以获取复杂的数据模式,使它们适合处理复杂的数据集 [ 51]。特征提取,即从复杂的植物图像中提取表型特征(例如冠层结构)是机器学习中常见的挑战,因为它无法自动提取这些特征。这通常需要研究人员在分析之前对数据进行预处理。为了克服这一挑战,深度学习有助于通过算法从植物图像中自主提取特征,提高收集表型性状的效率和精度[ 52]。此外,与机器学习模型不同,研究人员缺乏可选的用户友好软件来简化他们的分析过程。这是因为深度学习模型需要更多的计算资源来进行训练,并且通常需要一些技术理解来调整算法以适应其成像数据。为了应对这些挑战,研究人员经常进行跨学科合作,汇集计算机科学的专业知识来处理深度学习的技术方面。这种方法可以让深度学习在植物逆境研究中更有效地应用,利用各个学科的优势来推进该领域的发展。
在植物成像中,卷积神经网络(CNN)已被用来估计和分类与压力相关的症状(例如,田间图中较浅的颜色)。如前所述,ML 很难从图像中的背景噪声中提取特征 [ 53 ],而 CNN 可以绕过特征提取的复杂性。生成对抗网络也已成为生成植物合成图像的替代深度学习方法,使研究人员能够人为地增加数据集的大小并提高预测和分类模型的效率[54 ]]。此外,人工智能模型越来越多地被开发来集成来自多种传感器类型的数据,例如组合 RGB、热和光谱数据。这种集成可以对植物胁迫进行更全面的分析,利用每种传感器类型的优势并补偿其各自的局限性。尽管深度学习的前景令人兴奋,但其使用仍然存在一些限制。深度学习算法需要大量高质量的数据,其中包含有压力图像和无压力图像,获取这些数据既费力又昂贵。深度学习还需要大量的计算资源,需要专门的硬件,即强大的图形处理单元来训练大型数据集以及计算机科学专家。实际上,55 ]。然而,人工智能模型处理传感器变化的稳健性正在不断增强。采用数据增强和迁移学习等技术将模型暴露于各种条件下,从而提高其泛化不同传感器数据的能力。这在植物胁迫检测中尤其重要,因为环境因素会极大地影响传感器读数。尽管存在这些挑战,人工智能的持续进步可以解决这些限制,并进一步改进用于植物胁迫识别的机器学习和深度学习算法[ 48 ]。
此外,对于植物胁迫检测中的人工智能算法,算法的性能很大程度上受到训练数据质量的影响。有效的人工智能模型依赖于多样化、大型且具有代表性的数据集;有限或有偏见的数据阻碍了不同植物物种和胁迫条件的概括。确保数据集的可重复性对于人工智能模型的可靠性和适用性至关重要。标准化的数据收集和预处理方法对于保持数据集的代表性和再现性、解决数据噪声、缺失值和数据集平衡至关重要。交叉研究的可比性、现实世界的适用性、数据集的可访问性和伦理考虑对于推进人工智能在植物表型组学中的应用至关重要。此外,人工智能算法被设计得灵活且稳健,适应不同的农业环境和作物类型。它们可以管理不同环境条件下传感器数据的变化,从而提高人工智能在各种农业应用中的精度。这种适应性使人工智能模型能够识别和调整土壤类型、气候和作物品种等因素,从而增强人工智能在检测植物胁迫方面的效用,并为可持续农业实践提供见解。
单反方法论
为了确定植物表型分析中成像传感器和人工智能的操作方式,我们按照系统评价和荟萃分析指南的首选报告项目进行了 SLR [ 14]。我们设计了一个详尽的调查策略,其中包含一个三阶段过程,用于搜索、收集和分析选定期刊存储库中已发表的植物成像和人工智能结果。SLR 的局限性包括研究生研究或会议论文等灰色文献的潜在遗漏,以及对研究人员纳入和排除标准的选择偏见以及仅限于英文发表的作品。尽管已知 SLR 系统存在诸如缺乏相关细节和结果可重复性等局限性,但 SLR 已成为一种在进行新研究之前巩固现有实证研究知识的行之有效的方法 [ 13 ]。
研究问题
为了进行彻底的文献检索,我们首先提出了一系列研究问题,以明确通过 SLR 寻找的信息。以下研究问题也为 SLR 及其后续获取相关论文奠定了基础:
1.    
使用成像传感器和人工智能识别植物胁迫症状的研究现状如何?自 2006 年以来这一特定领域的进展如何?
2.    
哪些人工智能算法可以分析从成像传感器获得的数据来识别植物胁迫并对其进行分类?
3.    
当前人工智能和成像传感器技术在识别植物胁迫症状方面存在哪些局限性?可以采取哪些策略来提高其有效性?
审查搜索策略
系统审查和荟萃分析指南的首选报告项目是每个 SLR 的重要组成部分,为进行审查过程提供了框架[ 14 ]。该 SLR 包含 3 阶段方法(图1)从4个期刊库(以下简称数据库)获取相关研究。每个阶段的目标是提取相关研究论文(以下简称研究),并将其分解为后续阶段的信息。从先前阶段获得的知识应用于连续的迭代中,从而在后续阶段发现更多相关的研究。我们的 SLR 方法通过保证对每个数据库进行全面、详尽的审查,实现高效的分析性审查。第一阶段是初步范围界定审查,使用有影响力的关键词来收集信息。第二阶段是一个完整的搜索过程,使用自动化机器人系统地探索专门的关键字并创建一系列专门的信息。最后一个阶段,即第 3 阶段,是对第 2 阶段确定的所有研究的分析审查。

图。1。该 SLR 中使用的 3 阶段搜索策略概述。第一阶段的重点是初步范围界定审查。第二阶段的重点是系统审查和捕获研究结果。最后,第三阶段的重点是对主要研究队列的分析和回顾。
第 1 阶段 - 范围审查
我们 SLR 的第一阶段是使用学术搜索引擎 Google Scholar 进行范围界定审查 [ 56]。本次范围审查旨在调查植物胁迫中使用的基于图像的表型分析,并确定哪些数据库包含最相关的研究。我们使用一组预先确定的通用关键词来搜索谷歌学术,该关键词保持通用,涵盖了植物胁迫、人工智能和成像技术领域。例如,我们将“生物应激”与“机器学习”相结合,在谷歌学术中创建了单个搜索字符串。第 1 阶段的目标是确定第 2 阶段使用的效果最佳的关键字。学术文章以可移植文档格式 (PDF) 从 Google Scholar 检索,并系统地存档在外部数据库中。每次搜索的结果都适当记录在电子表格中,以保留第一阶段所有研究的记录。简而言之,第一阶段审查:(a) 通过出版物提供的关键词,(b) 相应的数据库,(c) 使用的植物成像传感器,以及 (d) 研究中列出的人工智能算法。我们的范围界定审查选择了 4 个数据库(Springer、ScienceDirect、PubMed 和 Web of Science),以及第 2 阶段的纳入和排除标准。此外,第 1 阶段生成了新的专业关键词汇编,例如“高光谱成像”、 “荧光成像”和“支持向量机”,随后在第二阶段使用。
第 2 阶段 - 使用可编程机器人进行系统审查
Phase 2 构成了该 SLR 的核心,并使用 OneSearch 作为其关键搜索引擎。OneSearch 是一个成熟的学术数据库,可以以搜索字符串组合的形式提供更多细节。一般来说,SLR 需要在多个数据库中手动进行详尽的搜索。为了简化搜索过程并减少数据库搜索中的人为错误,我们使用开源 Python 库 PyAutoGUI [ 57 ] 开发了可编程机器人。我们的自动化机器人系统通过两步过程连续检索搜索结果,以获得每次搜索后发现的研究总数,并将每项研究记录在 Zotero 数据库中 [ 58 ]。
迄今为止,使用人工智能实现重复性 SLR 任务的自动化一直是[ 59 ]所评论的正在进行的研究的一个目标,但据我们所知,这款 SLR 是第一个提出能够以出色的速度自主执行整个搜索过程的可编程机器人。细节。这些机器人是使用 Python 作为编程语言创建的,因为它易于使用并且包含许多用户创建的库(本手稿中使用的所有代码都可以在 GitHub 上免费获得,网址为https://github.com/Walshj73/data-processing-机器人git。我们使用 Python 库 PyAutoGUI 来自动执行基本任务并系统地控制鼠标和键盘。每个机器人都是在使用计算机终端执行的 Python 脚本中实现的。每个 Python 脚本都包含一个我们称为“bot”的类。这个“机器人”使用特定位置在计算机显示器上使用基于像素的格式执行其命令。因此,“机器人”的操作取决于主机的显示分辨率。对于这款单反相机,我们使用了标准分辨率为 1,920 × 1,080 的计算机显示器。但是,我们的搜索机器人可以使用任何像素分辨率。用户必须向机器人提供他们想要交互的对象的 x 和 y 像素坐标。一旦机器人了解了物体的位置,它就可以开始执行其指令。我们的脚本包含 3 个循环,导致整个脚本在达到某个点后重新运行。第二阶段的专业关键词分为 3 组:与植物胁迫、成像技术和人工智能相关的关键词。每个组在机器人脚本中都有一个循环,并迭代该组中的总关键字。由于机器人不间断地执行许多任务,因此出错的风险随着时间的推移而增加。为了克服这种风险,我们的机器人具有作为“检查点系统”的错误检查功能,允许机器人在错误发生之前恢复到之前的保存状态。“检查点系统”为机器人提供了独立性,使它们能够在没有人为干扰的情况下广泛工作。成像技术和人工智能。每个组在机器人脚本中都有一个循环,并迭代该组中的总关键字。由于机器人不间断地执行许多任务,因此出错的风险随着时间的推移而增加。为了克服这种风险,我们的机器人具有作为“检查点系统”的错误检查功能,允许机器人在错误发生之前恢复到之前的保存状态。“检查点系统”为机器人提供了独立性,使它们能够在没有人为干扰的情况下广泛工作。成像技术和人工智能。每个组在机器人脚本中都有一个循环,并迭代该组中的总关键字。由于机器人不间断地执行许多任务,因此出错的风险随着时间的推移而增加。为了克服这种风险,我们的机器人具有作为“检查点系统”的错误检查功能,允许机器人在错误发生之前恢复到之前的保存状态。“检查点系统”为机器人提供了独立性,使它们能够在没有人为干扰的情况下广泛工作。允许机器人在发生错误之前恢复到之前的保存状态。“检查点系统”为机器人提供了独立性,使它们能够在没有人为干扰的情况下广泛工作。允许机器人在发生错误之前恢复到之前的保存状态。“检查点系统”为机器人提供了独立性,使它们能够在没有人为干扰的情况下广泛工作。
我们的机器人使用 OneSearch 和专门的关键字数据集。尽管如此,研究人员可以修改代码以适应其他数据库搜索引擎,例如 Google Scholar。这可以通过向机器人提供新的像素坐标和更新的搜索指令列表来实现。此外,我们使用开源软件开发了脚本。因此,我们的机器人脚本可以轻松定制以用于其他研究工作。例如,对分子生物学和在任何生物体中使用基因编辑感兴趣的研究人员可以轻松编辑我们的可编程机器人脚本并创建自己的 SLR。
可编程机器人执行简单的指令集。在我们的例子中,这些说明重点是使用 OneSearch 执行搜索。搜索可以产生 3 种可能结果之一:(a) 发现相关研究的积极结果,导致机器人将结果(特别是发现的研究数量)记录到电子表格中,并将所有研究存档到 Zotero 数据库中;(b) 搜索成功,但未找到任何研究,导致机器人将结果(即数值为零)记录到生成的电子表格中。由于未找到任何研究,机器人将继续进行下一次搜索;(c) 由于发生错误而导致检索失败。在这里,机器人将使用其“检查点系统”恢复到内存中较早保存的状态,使其能够重新运行之前的任务。
使用专门的关键字数据集,我们的机器人精心构建关键字组合,从而能够构建精确的搜索字符串。我们从关注植物胁迫的单个关键词开始,称为“根键”(例如非生物胁迫),作为第一个组合术语。在第二阶段的初始阶段,我们使用了 6 个“根密钥”和 4 个数据库,导致了 24 次查询。接下来,机器人检索直接链接到专注于植物成像传感器的根键的关键字,称为“父键”(例如RGB成像传感器),我们使用“AND”和“OR”等运算符将其与“根键”组合。机器人通过连接 6 个根键和 56 个“父键”执行 2,016 个搜索查询。最后,专注于人工智能,我们创建了术语“子密钥”(例如,监督学习)直接连接到“父密钥”并子连接到“根密钥”。“子键”是我们 SLR 搜索过程的最后一层。最终,我们的可编程机器人在 4 个数据库中组合了 6 个“根密钥”、56 个“父密钥”和 14 个“子密钥”,产生了 28,224 次搜索,极大地简化了第 3 阶段的分析。
第 3 阶段 - 分析和审查
在第 3 阶段,我们首先分析了第 2 阶段的重复研究结果,并使用 Zotero 自动删除任何重复研究。然后,剩余的研究以逗号分隔值 (CSV) 文件格式导出并保存到本地存储设备。接下来是人工智能驱动的单反工具 ASReview [ 60],用于导入每个 CSV 文件进行评估。ASReview 的使用简化了审查流程,减少了评估每项研究所需的时间。ASReview 专为与 SLR 配合使用而开发,包括采用 ML 算法的智能分析,以帮助研究人员评估其结果。我们使用 ASReview 中的默认算法和参数来筛选每项研究的相关性。ASReview 软件对研究从最相关到​​最不相关进行排序。然后,我们根据下面定义的纳入/排除标准对研究进行了手动审查。最终数据集被重新导出到一个新的 CSV 文件,我们根据所使用的数据(即成像传感器的使用)、所采用的方法(即人工智能的类型)和生成的结果对每项研究进行严格评估(即算法性能)。
纳入和排除标准
为了获得一流的 SLR,我们必须确定一项研究是否相关。我们使用一组预定的标准评估了第 3 阶段编制的所有研究,包括文档类型(例如期刊文章和会议记录)、出版年份和内容类型。我们将研究分为纳入(可接受)和排除(不可接受)如下:
纳入标准
•    
该研究于 2006 年至 2022 年期间发表。
•    
该研究确定了植物胁迫、分类、量化和预测,包括与害虫相关的损害。
•    
该研究使用图像传感器进行分析,包括RGB、光谱等。
•    
该研究包括某种形式的人工智能,例如机器学习或深度学习算法以及监督和无监督方法。
排除标准
•    
该研究发表于 2006 年之前或 2023 年之后。2023 年初发表的新研究不考虑入选并自动删除。
•    
该研究并不关注植物胁迫领域。
•    
该研究不使用成像传感器或成像相关数据集,而是依赖于手持传感器。
•    
该研究没有使用人工智能,只关注统计方法。
•    
该研究是案例研究或文章评论论文。
此外,我们使用 OneSearch 的内置配置纳入了一些次要标准,以方便过滤研究,即:
OneSearch 配置
•    
该研究可以是书籍章节、会议论文集或期刊文章。
•    
该研究以英语撰写。
•    
这些研究从“全文”中检索关键词,而不仅仅是从“摘要或摘要”中。
结果与讨论
可编程机器人的使用增加了相关研究的数量
这款 SLR 旨在调查成像传感器的当前趋势以及使用人工智能来解释植物胁迫相关症状。我们采用可编程机器人的新 SLR 策略使用“根”、“父”和“子键”字符串从 4 个选定的数据库中检索了总共 2,704 项研究(图2)。经过 3 个严格的数据搜索阶段后,我们确定了 262 项研究,这些研究对使用人工智能和植物成像识别植物胁迫症状做出了重大贡献。

我们观察到 4 个数据库检索到的最终结果数量 (262) 存在差异,因为 ScienceDirect 和 Web of Science 发现研究数量相对较少。ScienceDirect 中发现的 122 项研究中,只有 33 项经过了分析过程,因为 90 项被认为不相关。在使用 Web of Science 找到的结果中,只有 30 个被认为是相关的。另一方面,从 Springer 数据库中获得了 974 项研究,其中 101 项被选择进行最终分析。ScienceDirect 的检索率低于其他 3 个数据库 (12%),其中 PubMed 为 37%,Springer 为 38%。ScienceDirect 中的数量较低可能是由于数据库的内容(即其期刊)主要关注实验植物生物学或成像传感器的技术方面。最后,专注于使用人工智能和植物成像识别压力相关症状的研究超出了大多数 ScienceDirect 期刊的范围。另一方面,Springer 和 PubMed 的最终研究检索数量最多。这一结果可能可以通过隶属于 BioMed Central 的广受认可的《植物方法》杂志来解释,该杂志是发表许多有关人工智能和成像传感器论文的主要平台。我们观察到 Web of Science 发现了高度相关的研究,但 494 项研究中的 93% 被其他 3 个数据库之一检索为重复项而被丢弃。隶属于 BioMed Central,该中心是发表许多有关人工智能和成像传感器论文的主要平台。我们观察到 Web of Science 发现了高度相关的研究,但 494 项研究中的 93% 被其他 3 个数据库之一检索为重复项而被丢弃。隶属于 BioMed Central,该中心是发表许多有关人工智能和成像传感器论文的主要平台。我们观察到 Web of Science 发现了高度相关的研究,但 494 项研究中的 93% 被其他 3 个数据库之一检索为重复项而被丢弃。
与跨多个研究领域进行的其他 SLR 相比,我们的 SLR 产生的相关研究数量明显更多。通常,SLR 检索不到 1,000 项研究,缩小到不到 100 项相关研究 [ 61 – 63 ]。然而,我们的 SLR 成功地从 2,704 项研究中识别出了 262 篇相关出版物,这比通常通过人工审查找到的数量要大得多。这一结果可归因于我们实施了三阶段审查策略和可编程机器人的使用,这明显提高了我们搜索过程的效率。因此,我们的研究结果强烈表明,可编程机器人可以有效地增加已识别的相关研究的数量,从而防止潜在的相关研究被忽视。
2020年以来植物胁迫分析对人工智能的需求更大
我们的 SLR 审查了 2006 年以来发表的 262 项相关研究(图3)。我们可以观察到人工智能在 2017 年初出现的趋势,从 2019 年开始出现明显激增,从 26 项研究增加到 2020 年的 65 项研究,并在 2022 年增加到 72 项出版物,这使我们推测这一趋势将持续到 2023 年及以后。我们还观察到 2020 年的出版物较少,尽管趋势线表明 2021 年应该有更多的研究。从 2020 年的 65 项研究略有下降到 2021 年的 61 项,很可能是由于 COVID-19 大流行,因为许多研究人员被迫暂停工作或远程工作。

有趣的是,我们观察到 2010 年之前没有发现任何结果,可能是因为图像传感器的价格和维护费用高昂,难以获取。相反,研究人员选择了破坏性表型分析。尽管 2011 年和 2012 年发表的有关人工智能和成像传感器的研究很少,但该领域取得了相当大的进展 [ 8 , 64 ]。例如,Mewes 等人。[ 64 ]使用固定在飞机上的高光谱映射器。他们提出了光谱角映射器 (SAM) 和支持向量机来识别小麦中的白粉病。文章反思了传感器的光谱范围,能够在近红外和短波红外频率下成像,这在当时是一个突破[ 64 ]。马莱因等人。[[8 64]] 还使用 SAM 检测甜菜叶中的尾孢叶斑病、白粉病和叶锈病。他们同样使用了高光谱传感器,但在温室条件下进行。尽管 2019 年之前人工智能和成像传感器的使用很少,但已发表的论文显示,尽管存在与成本相关的挑战,但该领域仍取得了进展。2017年之后,成像传感器的成本大幅下降,使得更多的研究小组能够进行无损表型分析并实施人工智能算法。例如,Nagasubramanian 等人。[ 65 ]测试了带有高光谱成像传感器的深度CNN来检测大豆中的木炭腐烂,使用的是2011年所见的相同的Pika XC高光谱线传感器[ 8,]。这一观察结果表明,研究人员在成像传感器中使用了类似的技术,但使用了更现代的人工智能算法 [ 64 , 65 ]。综上所述,我们的结果(图3)表明 2020 年发表的论文数量激增,这可归因于成像传感器的可负担性,以及由于深度学习技术的发展和大规模人工智能的出现而导致的人工智能的爆炸式增长。神经网络,导致表型研究的增加。
开源数据集正在引发一场数据革命
自 2019 年以来发表论文数量激增的另一个原因可能是公开数据集,由于开源出版物的推广,这些数据集在研究人员中变得流行。我们发现大约三分之一的研究 (36.4%) 使用公开的数据集来进行研究。这包括来自 Kaggle 或Data.gov等开源存储库的数据集。以下是该群组中出现的一些最常见的公开可用数据集的汇编列表:
•    
PlantVillage:公开可用的数据集,包含 50,000 多张健康和患病作物叶子的图像,这些图像按多种植物物种和疾病分类[ 66 ]。它广泛用于开发和测试植物病害诊断中的人工智能算法,已成为农业人工智能研究的基石资源。
•    
PlantDoc:该数据集包含 13 个植物物种和多达 17 类疾病的总共 2,598 个数据点 [ 67 ]。
•    
稻叶病害数据集:该数据集包含 120 张感染病害的稻叶的 .JPG 图像。每张图像根据疾病类型分为 3 类,每类 40 张图像 [ 68 ]。
•    
木薯叶病分类:包含在乌干达定期调查期间收集的 21,367 张木薯叶病标记图像的竞争数据集 [ 69 ]。
•    
大豆(大)数据集:该数据集包含 19 类健康和不健康大豆图像。该数据集共有 307 个实例和 37 个特征 [ 70 ]。
•    
CGIAR 农作物病害计算机视觉:该公开数据集包含 876 张用于训练的图像和 610 张用于测试的图像,可用于小麦锈病的识别[ 71 ]。
PlantVillage 数据集于 2015 年推出,现已成为使用最广泛和最受认可的公开数据集之一。PlantVillage 的诞生是为了推进移动疾病诊断的研究,但它已在许多研究中用于训练和评估新型人工智能算法 [ 72-74 ]。例如,一项研究使用轻量级 CNN,而另一项研究则使用 MobileNet-V2 架构的预训练版本来研究生物应激 [ 75, 76]]。大多数使用公开数据集的研究都是最近发表的,这表明开源数据集是 2020 年以来出版物激增的关键因素。这些发现得到了 58 项使用深度学习的研究的支持,这些研究采用了 PlantVillage 数据集,增强了开源软件在推进基于深度学习的植物胁迫研究方面的有效性。最终,我们可以推测,2015 年之前的研究有限可能是由于缺乏公开可用的图像数据集。
光谱成像成为焦点并成为植物成像的新兴选择
在这台单反相机中,我们记录了 198 个 RGB 成像传感器的实例,使其成为 262 个研究中最受欢迎的传感器(图4)。我们预计会出现这样的结果,因为 RGB 成像传感器比光谱传感器更容易使用且更便宜 [ 77 ]。平均而言,低成本 RGB 成像传感器的购买价格不到 100 欧元,使研究人员能够对植物进行成像。Raspberry Pi 相机模块是研究人员通过将其插入 Raspberry Pi 计算机来创建图像传感器的流行选择 [ 78 ]。在现场条件下演示了使用 Raspberry Pi结合深度 CNN 算法对秋葵尾孢叶斑进行成像的示例 [ 79]。另一种流行的 RGB 选项是智能手机摄像头,由于其像素分辨率高并且不需要以前的专业知识,因此越来越多地用于植物成像。

虽然许多研究使用 RGB 传感器,但我们还发现 52 项研究采用高光谱传感器,18 项研究使用多光谱传感器。我们观察到,从 2019 年开始,光谱传感器开始逐渐增加。造成这些结果的一个可能原因是光谱传感器非常昂贵,许多研究人员可能缺乏必要的财务资源,导致他们选择更便宜的替代方案(RGB 成像)。这些传感器还需要熟练的技术和专门的软件,以及只能通过高级订阅才能获得的分析工具,这限制了它们的使用。开源库也存在,但仍处于开发的早期阶段。例如,SPy [ 80 ] 和 hsda [ 81 ]] 需要进一步开发来处理光谱图像并包括用户友好的功能。尽管存在这些挑战,光谱成像在用于发现其他成像传感器可能不易观察到的与压力相关的症状时是一种强大的工具。我们推测,2020年以来使用高光谱传感器的研究数量较多,主要是由于高光谱数据的复杂性,这需要人工智能掌握其生物学意义,并且与前几年相比成本较低(图5) 。

从我们的 SLR 回顾的 262 项研究中,我们观察到将人工智能与荧光、热成像、卫星成像和激光雷达等各种成像技术相结合的研究有限的趋势。尽管具有潜力,但与 RGB 和光谱传感器相比,这些技术与人工智能工具的集成较少。
• 荧光成像:在这些研究中,只有 2 项研究将荧光传感器与人工智能结合使用。例如,一项研究利用脉冲幅度调制叶绿素荧光成像系统 FluoCam FC800 对干旱胁迫下的拟南芥植物进行成像 [ 82 ]。该研究部署了线性判别分析和k近邻(KNN)等多种人工智能算法来动态监测干旱条件下sos基因引起的光合指纹[ 82 ]。总之,作者发现线性判别分析和 KNN 在基于叶绿素荧光数据区分基因型方面都达到了 95.0% 的高精度 [ 82]。因此,表明使用动态叶绿素荧光成像和人工智能算法来有效监测和分类植物对干旱胁迫的反应的潜力。
• 热成像:四项研究将热传感器与人工智能结合起来。一个值得注意的例子涉及一项使用 RGB 和热传感器来监测白粉病胁迫的番茄植物的研究 [ 83 ]。研究使用 SVM 分类器得出结论,通过结合热图像和 RGB 图像的信息,可以高精度识别感染O. neolycopersici的番茄植株,准确度超过 90% [ 83 ]。
• 卫星成像:在 5 项研究中将卫星成像与人工智能结合使用。一项著名的研究选择测试高空间分辨率多光谱卫星图像(特别是 SPOT-6 传感器)在区域范围内检测和绘制冬小麦白粉病的能力 [ 84 ]。为了实现这一目标,作者使用 SAM 来帮助从卫星成像数据中检测和绘制白粉病地图。高分辨率多光谱卫星影像数据的制图精度为78%,kappa系数为0.55,这表明高分辨率多光谱卫星影像数据在农作物病害监测方面具有实用潜力[ 84 ]。
• LiDAR:我们的综述中只有一项研究使用了LiDAR 技术与AI 的结合。这篇研究文章重点介绍了使用地面激光扫描 (TLS) 与 ML 算法相结合来检测和分类油棕榈种植园基部茎腐病的严重程度 [ 85 ]。通过使用 TLS,作者捕获了 3D 点云数据,并对每个点云进行预处理,以提取不同高度的树冠切片、树冠面积、叶状角度和叶状数量等特征 [ 85 ]。最终,作者将这些特征与 ML 算法(例如内核朴素贝叶斯)相结合,产生了 85% 的准确率和 0.80 的 kappa 系数 [ 85 ]。因此,证明了 TLS 和 ML 在预测早期基部茎腐病感染方面的有效性。
我们的研究结果凸显了这些先进成像技术在人工智能集成植物胁迫研究中的利用不足。虽然成本和特定的技术挑战(例如荧光成像中需要暗适应)可能会限制其应用,但我们综述中的示例证明了它们在识别压力症状方面的有效性。这些实例表明,人们越来越认识到这些技术给该领域带来的价值,尽管速度缓慢,但有可能导致未来研究中更广泛的采用和创新。
非生物胁迫研究仍然是未知领域,潜力尚未开发
这种 SLR 的一个不足为奇的结果是缺乏针对非生物胁迫的研究。虽然我们发现几项研究选择关注非生物应激(5%),但绝大多数研究关注的是生物应激源。造成这一结果的一个可能原因是使用 RGB 成像传感器来捕获与疾病症状(例如变色或病变)相关的特征的流行。正如 198 项研究所反映的那样,这使得 RGB 成像成为对生物胁迫植物进行成像的快速而精确的工具。另一方面,非生物胁迫对 RGB 成像产生更微妙的影响,需要对数据进行更复杂的检查来解释这些反应(例如,生长发育不良、叶面积减少)。为了克服非生物胁迫数据解释的挑战,我们的结果表明研究人员选择了先进的工具,例如热、高光谱、或荧光成像传感器。例如,干旱胁迫会导致枯萎和生长减少,需要使用 RGB 成像对生长和结构进行纵向分析。然而,热成像传感器可以轻松检测到气孔导度和叶片温度的变化。86 ]。
尽管 RGB 成像在非生物胁迫中存在挑战和局限性,但一些研究已经有效地使用了这些传感器。例如,一篇发表的论文在田间条件下针对大豆、玉米和秋葵,展示了最先进的 DNN(例如 Inception V3)如何预测干旱症状 [ 87 ]。在此 SLR 中,5 项研究使用 RGB 成像来记录叶子的颜色变化,从而能够检测和量化营养失衡 [ 87 , 88 ]。大多数非生物胁迫研究使用光谱传感器来应对各种胁迫因素(例如盐度、热量和干旱)。例如,高光谱成像和支持向量机算法被用来检测草莓植物的早期热和水分胁迫[ 89]。总的来说,使用成像传感器(特别是光谱传感器)和人工智能的非生物胁迫研究仍处于起步阶段。然而,我们的结果强调了该领域在理解和预测环境对植物的影响方面尚未开发的潜力[ 82 , 89 ]。
人工智能正在彻底改变我们分析植物胁迫的方式
在这里,我们剖析了不同人工智能算法的使用及其随时间推移的采用趋势(图6 ))。为了促进有关研究和人工智能算法各自使用的数据收集,我们在每份出版物中只记录了一种深度学习算法。此 SLR 的一个关键结果是对使用 ML 或 DL 的研究进行了细分。我们发现 115 项研究使用了 ML,而 135 项研究专门选择了 DL,这表明 DL 已成为识别植物胁迫症状的流行选择,从 2019 年的 9 项研究增加到 2022 年的 45 项研究。在 262 项初步研究中,146 项结合使用 DL使用另一种算法,对应于一小部分使用机器学习和深度学习来创建新的、更复杂的模型的研究,展示了研究人员如何弥合这两个领域之间的差距,并以有趣的方式做到这一点。例如,一些研究使用 ML 进行特征提取(例如,植物高度),使用 DL 进行分类任务(例如,敏感或耐受品种)。当使用 SVM 等 ML 算法对 DNN 提取的特征进行预测时,反之亦然。

从我们的结果中,我们可以得出结论,深度学习算法是当今最常见的,其中 CNN 在深度学习架构中占据首位。这并不奇怪,因为 CNN 通常用于图像分类和分割任务,因为它们擅长从视觉数据中捕获特征。例如,研究人员使用 AlexNet 和 VGG-16 来识别玉米和橄榄叶部疾病 [ 90 , 91 ]。AlexNet和VGG-16代表传统的CNN架构;尽管如此,我们可以观察到越来越多地使用更新的架构(例如 MobileNet、YOLO 和 DenseNet)来识别芒果和苹果叶病以及小麦锈病 [ 92 – 94]。毫不奇怪,在使用 DL 的 145 项研究中,RGB 传感器占了 140 项(96%),这是因为 RGB 图像能够以低成本捕获复杂的图案和微妙的细节。例如,研究人员使用智能手机结合多种算法(包括 InceptionV2、MobileNetv2-YOLOv3 和自结构化 CNN)来检测植物病害 [ 95 – 97]。有趣的是,我们发现光谱成像数据集并不常用于深度学习模型。这有两个主要原因。首先,深度学习算法通常需要大量标记数据才能有效学习和泛化,这可能具有挑战性且耗时,而且开源标记数据集并不常见。其次,深度学习模型(例如 CNN)可能需要大量计算,并且需要大量计算资源进行训练。尽管如此,鉴于深度学习研究的快速加速,我们可以预测,深度学习在光谱数据中的使用很快就会大幅增加。
我们的结果表明机器学习算法在该领域被广泛采用。我们观察到 SVM(84 项研究)、ANN(52 项)和随机森林(28 项)是最常见的 AI 算法。SVM 已成功应用于各种研究任务。SVM 是用于分类和回归分析的监督机器学习算法。SVM 表示n维空间中的数据,其中n对应于数据集中特征的数量(表型性状),因此在成像研究中非常有价值,研究人员一天内可以获得数十个性状。最后,尽管 SVM 算法很简单,但它能够预测某个特征与其他特征在压力反应方面的相关性。例如,SVM 的修改版本用于研究水稻叶部病害,能够以 98.63% 的把握检测 5 种不同的病害 [ 98 ]。SVM 算法还与决策树、逻辑回归、朴素贝叶斯、ANN 和长短期记忆算法结合使用,利用热成像技术检测葡萄霜霉病的早期发作[ 99]]。这些算法使作者能够以 81.6% 的准确度区分单个葡萄叶子是否受到感染。他们确定一天中拍摄图像的最佳时间是上午 10:40 至 11:30 [ 99 ]。
人工神经网络已被广泛使用(52 项研究)。人工神经网络是模仿人脑生物神经网络的结构、功能和学习能力的数学模型。它们由人工神经元组成,共同处理信息并做出决策。每个人工神经元接收来自另一个神经元的输入,使用称为激活函数的数学函数处理这些数据,并将所得信号传输到其他神经元。监督学习可用于训练 ANN,其中网络从输入和输出对的集合中学习。例如,马丁内斯-马丁内斯等人。[ 100 ] 使用 ANN 结合主成分分析来估计菜豆叶斑病的严重程度 [ 100]。主成分分析和 ANN 的结合促进了 RGB 分割,从而可以进一步检测和分类图像。反向传播神经网络和多层感知器等改进的人工神经网络已在多项研究中得到应用。例如,使用无监督学习的前馈神经网络来分类和预测何时对棉花根腐病症状进行治疗[ 101 ]。
其他人工智能算法,如随机森林、KNN 和决策树也得到了广泛的应用。基于回归的方法包括回归和判别分析模型,例如逻辑回归、弹性网络回归以及偏最小二乘判别分析的各种实现。例如,基于回归的方法已被用于对有症状叶子中 5 种植物病害的严重程度进行分类,方法是使用来自 PlantVillage 数据集的 RGB 图像,对多个物种(如甜椒、大豆、小麦和马铃薯等)进行分类 [ 102,103]。回归模型在人工智能中的应用呈上升趋势,其使用量从2006年至2021年的3项研究增加到2022年的10项研究,这表明基于回归的方法可以对植物胁迫进行综合评估。
我们的 SLR 得出结论,无监督学习已被零星使用,因为我们只发现了 5 个无监督学习研究来预测压力反应。这些模型不适合预测植物胁迫症状,因为监督学习模型可以直接从图像中学习歧视性信息并预测特定的胁迫相关模式。然而,无监督方法可以识别植物胁迫症状,并且如果目标图像数据集未标记,则可以成为有用的工具。无监督方法包括聚类算法,例如将数据集分为多个组的 k 均值。Savian 等人的工作就是一个例子。[ 104]],其中使用热成像和多光谱成像来检测猕猴桃藤蔓衰退综合症。通过使用 k 均值和层次聚类对温度数据进行聚类,研究人员可以提前一年预测疾病爆发,准确率达到 71% [ 104 ]。
总而言之,我们可以得出结论,人工智能正在彻底改变植物胁迫分析和预测,我们应该了解每个成像传感器的人工智能算法明显崩溃背后的原因。我们的 SLR 发现使用 DL 架构的研究严重依赖 RGB 传感器(140 项研究),而只有 6 项使用光谱成像和 DL。相比之下,有 76 项研究在光谱传感器中使用了 ML(占所有 ML 研究的 66%)。我们还表明,SVM、SAM 和决策树等算法在处理光谱数据中变得非常流行。然而,这一结果确实提出了一个问题:为什么机器学习算法更频繁地用于光谱数据集。我们推测光谱成像需要复杂的模型来识别特征(例如叶绿素含量),而机器学习模型简化了结果的解释,为决策提供明确的规则。相比之下,以其黑盒性质而闻名的深度学习模型阻碍了其预测背后的生物学意义。光谱成像数据集(特别是开源数据集)的可用性有限,是深度学习模型使用率低的另一个原因,深度学习模型需要大量标记数据集来学习和做出准确的预测。目前,有限的可用光谱数据受益于使用支持向量机或随机森林等机器学习算法来提取与压力相关的关键特征并快速提供准确的预测。未来,我们推测,随着光谱数据变得更加丰富和易于获取,情况将会发生变化,从而使深度学习能够展示其在光谱成像和预测准确性方面的全部潜力。

结论和未来方向
我们使用 3 阶段审查策略和可编程机器人来彻底检查 2006 年至 2022 年(含)期间人工智能和成像传感器在植物胁迫分析(非生物和生物)方面的使用情况。通过这项突破性的分析,我们在 4 个数据库(Springer、ScienceDirect、PubMed 和 Web of Science)中发现了 2,704 份已发表的手稿,这些数据库专门使用成像传感器和人工智能来解释数据。该单反的价值输出是当前单反策略平均输出的两倍以上。让我们能够检索 262 项经过精心整理和分析的相关研究。
我们的 SLR 首先提出了 3 个研究问题,现在我们可以清楚地回答这些问题。首先,我们询问了“用于植物逆境分析的成像传感器和人工智能的研究现状?” 我们观察到 2015 年之前的出版物短缺,2019 年首次激增(26 项研究),2020 年增加到 65 项,2022 年增加到 72 项。通过探索这个研究问题,我们发现了生物应激研究的偏见(95% 的研究) )。这一事实可归因于由于疾病病变的坏死和褪绿性质而“容易”检测视觉症状。我们的结果还承认开源成像数据集在推进深度学习研究和更准确的预测方面做出了巨大贡献。因此,我们预测,由于开源光谱数据集可用性的扩展,深度学习将大大增加。
其次,我们问,“目前哪种成像传感器和人工智能在植物胁迫分析中最受欢迎?” 我们发现 RGB 传感器是最流行的方法(192 项研究)。然而,自 2020 年以来,高光谱成像(52 项研究)取得了快速进展。我们的分析还显示,DL 是目前最流行的算法(145 个实例),VGG-16、MobileNet 和 Inception V2 等网络得到了广泛的使用。尽管如此,我们也可以承认 ML 算法的广泛使用,例如 SVM (84)、ANN (82) 和随机森林 (28)。总而言之,我们预计光谱传感器将在非生物胁迫中得到更多使用,其中高光谱成像在温室条件下处于领先地位。相比之下,多光谱成像在现场试验中将变得更加频繁。至于未来的AI趋势,我们相信网络的结合将会变得司空见惯。我们还推测,将进一步探索迁移学习,将从一种人工智能算法学到的应激症状知识转移到另一种人工智能算法,从而实现不同植物物种之间的导航预测。105 – 107 ]。
第三,我们问:“植物逆境研究中成像传感器的新兴趋势是什么?” 我们发现,虽然 RGB 和光谱传感器在该领域占据主导地位,但其他成像技术(例如荧光、热成像、卫星和激光雷达成像)尽管目前范围有限,但正在越来越多地得到探索。荧光成像具有突出植物光合作用变化的独特能力,与人工智能算法集成后,其应用可能会增加。未来的研究可能会探索使用人工智能更准确地解释荧光信号,从而能够检测微妙的压力指标,并可能导致更灵敏和更具体的压力检测系统,有助于早期疾病识别。热成像虽然目前受到其高成本和复杂性的限制,在人工智能辅助灌溉管理和疾病预测方面具有潜力。可以开发先进的人工智能模型来更有效地解释热数据,帮助精确识别大型农业景观中的缺水和害虫侵扰。卫星成像有望从人工智能的进步中受益匪浅,特别是在大规模监测干旱和热浪等非生物胁迫因素方面。卫星数据与人工智能算法的整合可以更准确、更及时地预测环境压力对作物健康的影响,从而有助于全球粮食安全工作。LiDAR 技术能够提供详细的结构信息,与 AI 结合可以增强植物 3D 表型分析的用途。
最后,我们问:“当前用于植物胁迫分析的成像传感器和人工智能算法存在哪些局限性?” RGB 传感器因其低成本和相对简单的技术知识要求而成为开发新深度学习模型的主要方法。尽管如此,我们还是证明了光谱传感器作为植物胁迫分析的有前途的工具的能力,尽管目前数据集稀缺,这可能会导致预测能力受到限制。我们的结果揭示了 DL 用于光谱分析的利用率较低(6 项研究),而 ML 被证明在预测压力反应方面更受欢迎(76 项研究)。深度学习应用受到限制的另一个解释是,除了标记数据集的可用性有限之外,还需要大量的计算资源。108、109 ]。​ 此外,随着当前 LiDAR 和 3D 成像的进步,我们预计将更多地使用具有更复杂架构的 DL 来分析压力症状 [ 85 ]。总之,我们的 SLR 概述了当前最先进的人工智能和成像传感器在植物胁迫分析中的应用。

发布日期:2024-04-01