新闻资讯
介绍
全球气候条件的变化使得林业必须选择更具抵抗力的树木基因型[ 1 , 2 ]。探索种群内变异性可能是长世代周期树种适应未来气候的关键第一步。欧洲赤松是分布范围最大的植物之一,在不同的气候条件下自然生长,形成不同的生态类型 [ 3 , 4 ]。一些生态类型由于能够抵抗各种环境胁迫,可能更适合特定地点的造林[ 5 , 6 ]。根据表型选择耐药个体可能并不可靠[ 7] 由于环境影响;相反,选择必须基于经过适当设计后的遗传估计。
高通量表型分析 (HTP) 已广泛应用于作物科学 [ 8 , 9 ];然而,在林业方面,还需要更多的研究和验证才能被采用[ 10 , 11 ]。HTP 的使用是由于需要了解植物性能和生长对环境胁迫和病理因素的反应,并为各种育种方案提供解决方案 [ 8 , 12 ]。管理大规模表型数据仍然是植物育种和功能基因组学的主要瓶颈之一[ 11 , 13 ]。
植被 350 至 2,500 nm [可见光到短波红外 (VSWIR)] 反射率数据包含有关叶子化学成分的宝贵信息,例如光合色素 [ 14 – 16 ]、含水量 [ 17、18 ]和结构化合物 [ 19] – 22 ] 对应于植物生理状态 [ 23 – 26 ],以及生长参数 [ 27 ] 在生长期 [ 28 , 29 ]随叶片物候变化]。因此,源自幼苗高光谱反射率的叶片功能性状可能成为苗圃中评估幼苗质量的有力工具。我们假设一些影响光学响应的叶子功能性状是特定于种源的;因此,如果可以通过 VSWIR 反射数据追踪幼苗的来源,高光谱表型分析可以避免种子来源可能的适应不良。即使在收集繁殖材料的认证站中,由于数十年的人工再生,实际来源和真正的生态特征仍然存在不确定性[ 30 , 31]。使用高光谱反射率检测叶子功能性状的另一个好处是可以预测幼苗在胁迫下的表现,这可以帮助识别不适合部署的幼苗。使用光学叶子数据,可以监测苗圃中的幼苗感染情况[ 32 ]。
自 20 世纪 90 年代初以来,已经使用光谱辐射计对高光谱反射率进行了精确的实验室和现场测量,涵盖从可见光 (VIS) 到近红外 (NIR) 到 SWIR 的光谱 [ 33 ]。所得反射率捕获有关叶子或冠层特性的信息:光谱的 VIS 部分(300 至 700 nm)的反射率主要响应色素含量 [ 34 ];NIR(750 至 1,350 nm)反射率受到叶子内部结构 [ 35 ] 或冠层结构 [ 36 ] 和水分含量 [ 37 ] 的影响。可见光和近红外之间反射率的急剧增加称为“红边”(RE),通常由 680 至 750 nm 的波长范围定义[38 ],并且已知可指示氮水平和应激,例如[ 24,25,39 ]。SWIR 光谱区域可细分为 SWIR1(1,350 至 1,800 nm)和 SWIR2(2,000 至2,400 nm),这里的反射率取决于叶子的水和结构化合物的含量[ 40-42 ]。
多光谱[ 43 ]或高光谱光学传感器[ 44 ]可以检测冠层水平的叶子光学特性和叶绿素含量。这种方法通常应用于使用卫星、机载或无人驾驶车辆传感器的遥感研究。尽管具有空间分辨率的高光谱相机可以在实验室条件下使用,但不具有空间分辨率的光谱辐射计仍然可以用于检测叶子的生理特性,而无需劳动密集型图像分割[ 45],基于图像的光谱测量的主要瓶颈。这些光谱辐射计可以在现场或实验室条件下使用接触式或非接触式方法。常用的现场光谱辐射计配备有光纤电缆(OC)和可选的可连接设备,例如带有内部光源的接触探头(CP)[ 21 , 42 ]。每种测量方法都有不同的光源和传感器几何形状,在速度、省力和现场可操作性方面具有特定的优势。这些测量方法获取的反射率数据并不完全兼容,因此,它们经常相互比较:OC 与 CP [ 37,46,47 ]。
CP 设计用于测量最佳覆盖其整个视场 (1 cm 2 ) 的平面叶片(在叶片水平)的反射率。在均匀覆盖视野的平面叶片中,CP 测量既简单又快速。然而,对于针叶树来说,接触式测量需要解决诸如针重叠和针之间的间隙比例等问题,这使其成为一个具有挑战性且耗时的过程[ 48 ]。尽管如此,一些研究已经通过 CP 在芽样品上测量了针的光学特性 [ 49 ],堆叠在一层 [ 46 , 50 ] 中,或固定在定制的积分球支架中 [ 48 , 51 , 52 ]。
配备有连接到 OC 的 CP 的光谱辐射计使我们能够获得双锥反射系数 (BCRF) [ 53 ]。使用 OC 在外部光源(即太阳光或人造光源)下远距离测量物体和白色面板,我们获得半球形圆锥形反射系数 (HCRF)。BCRF 关注圆锥立体角内有限范围的入射光,而 HCRF 考虑来自整个半球的光,在我们的例子中是环境天空照明 [ 53 , 54 ]。反射率量 BCRF 和 HCRF 均表示为与在给定设置中测量的白色参考面板的反射率相关的相对值。
叶子的内部结构影响其光学特性,由配备 CP [ 55 ] 或积分球 [ 56 ] 的光谱辐射计测量。然而,小枝、树枝或树冠形态(可能是生态型特有的)不会影响 CP 光谱信号。OC 单独可用于近端/冠层高光谱反射率测量,以产生可重复的结果,尽管它非常容易受到环境光和大气条件的影响 [ 54 ]。在稳定光照条件下,OC 方法的主要优点是与 CP 方法相比速度相对较高,并且视场较大(取决于与被测物体的距离)。
此外,OC 反射率采集可以测量小型植物的冠层水平。因此,光谱信息还涉及来自冠层结构的信号和 CP 测量无法获得的幼苗的其他形态特征。使用具有 VSWIR 反射率的机器学习 (ML) 算法对样本进行预测和分类是科学界已知的,包括林业中的各种应用。值得注意的是,反射率数据已用于在物种级别对树木进行准确分类 [ 57 , 58 ]。最近,新兴研究成功地使用反射光谱在物种水平上对植物类群进行分类,即种间杂种 [ 59 , 60]和单一物种的当地种群[ 42 ]。然而,缺少在 ML 背景下检测各种针叶树幼苗种群/生态型的 BCRF 和 HCRF 的比较案例研究。
在本研究中,我们比较了使用 OC 与 CP 对源自 3 个种子园的 3 个当地种群的赤松幼苗进行快速高效的手动 HTP 的潜力。具体目标是 (a) 证明这两种方法对于解开 3 个欧洲赤松幼苗种群内的表型和潜在遗传变异都是可行的;(b) 评估哪些光谱区域(从 VIS 到 SWIR)对群体区分最敏感;(c) 基于 CP (BCRF) 和 OC (HCRF) 获得的反射系数,通过 2 个选定的 ML 算法 - [随机森林 (RF) 和支持向量机 (SVM)] 预测给定的幼苗来源。
材料和方法
研究地点和植物材料
该研究使用来自 3 个种子园的 1 年生(第二个生长季节)樟子松 ( Pinus sylvestris L.) 幼苗进行:来自捷克共和国的 Plasy (P)、Třeboň (T) 和 Děčín (D)。总共测量了 1,788 株幼苗,其中 746 株来自普拉西,750 株来自特热邦,292 株来自杰钦(图1 ))。幼苗在 60 个个体的花盆中培育。在一个种植园中,总是只有来自一个种子园的幼苗,并且单个半同胞家庭共享相同的细胞系。反射系数测量于 2021 年 9 月 7 日至 10 日在捷克共和国比尔森的 Sofronka 植物园进行,所有幼苗均在此生长。值得一提的是,发芽后第一个冬季(2021年季节)幼苗群体的死亡率存在差异(表1)。以德辛人口为代表的高地松树生态型的死亡率最高。此外,与 Plasy 和 Třeboň 种群的幼苗相比,Děčín 种群的幼苗平均高度较低。
反射系数的测量
为了对 1,788 棵欧洲赤松幼苗进行光谱数据评估,我们使用了 ASD FieldSpec 4 Wide-Res 便携式光谱辐射计(英国 Malvern Panalytical Ltd.)。反射系数的测量范围为 350 至 2,500 nm,CP 的积分时间为 8 ms,OC 的积分时间为 34 ms。三个传感器覆盖光谱辐射计范围,在 1,000 和 1,800 nm 范围内变化。光谱辐射计配备了 OC 和可连接的 CP(ASD 植物探针,Malvern Panalytical Ltd.,英国)。在所有幼苗中,使用CP测量叶级BCRF,并通过OC获得整苗HCRF。两种方法均以相同的顺序对幼苗进行测量,以确保连续 4 天内测量个体的序列准确匹配。在两种光谱采集方法中,每 15 分钟和/或在入射辐射变化后记录大约 99% 反射率的白色面板的反射率因子,并随后用作白色参考。用于将原始数据校准为反射率的白色光谱面板(SphereOptics,Herrsching am Ammersee,德国)的反射率在 1,800 nm 范围内达到 98% 至 99% 反射率,并进一步在 94% 至 98% 之间变化。
叶面 BCRF 测量
BCRF 是指通过与 CP 耦合的 OC 收集的反射通量的比率,其中入射通量仅限于圆锥体立体角。入射通量仅包括来自特定方向范围的光,在我们的例子中,是 CP 内部的集成光源(氪卤素灯泡)[ 53 ]。
叶子水平的接触测量不依赖于天气条件。在整个测量的光谱范围内,将针推到不反射的黑色表面,以最大限度地减少背景光谱噪声或传输的辐射[ 46 ]。针被布置成覆盖视野。每次测量均记录 25 次扫描,作为防止过热的保护措施。
冠层水平 HCRF 测量
HCRF 是指通过 OC 收集的反射通量与整个半球的入射通量之比。在这种情况下,入射通量包含来自环境天空照明各个方向的光。反射通量是通过裸 OC 在特定圆锥立体角内测量的[ 53 ]。
冠层水平反射系数测量是在晴朗的天空条件下收集的,呈现稳定的入射光。重复测量白色面板并用于校准到最接近的时间反射率,从而考虑光照条件下的短期变化和太阳光照的昼夜变化。我们将黑色非反射纸模板应用到幼苗底座上,以消除记录信号中的土壤反射。对于每次测量,OC 指向幼苗顶芽的最低点(即垂直放置),高度约 5 厘米。OC的视场角为25°,因此整个苗木都包含在视场内,并且背景被有效地最小化。获得的每次测量均记录 50 次连续 ASD 扫描的平均值。
数据处理与统计分析
数据预处理
由于 HCRF 光谱中存在明显的噪声(图1),我们去除了近红外(1,350 至 1,430 nm)和短波红外(1,800 至 1,970 nm 和 2,380 至 2,500 nm)区域的反射率,这些区域受到大气气溶胶和散射的强烈影响。当处理在太阳照射下获取的场光谱时,类似的光谱范围去除是一种常见的做法 [ 59 , 61 ]。此外,我们通过标准正态变量(SNV)转换 BCRF 和 HCRF 进行连续分析[ 62 ]。为了使所有光谱在强度方面具有可比性,SNV 方法将每个光谱从其自身平均值中减去,然后除以其自身的标准差。
统计分析
为了进行统计分析,使用了R 软件版本 4.0.4(R Core Team 2021)的本机函数和 R 版本 4 [ 63 ] 的 ASReml 库。
在 ASReml 软件中,我们进行了 Wald 测试来比较我们研究中的生态型和种群。Wald 检验是使用增量 Wald 统计量的伪方差分析。增量 Wald 检验具有渐近 χ 2分布,其自由度由可估计效应的数量给出 [ 63 ]。为了进行成对比较,我们基于上述线性混合模型预测了种子起源的位点平均值。
机器学习算法和预测
应用 RF 和 SVM 两种 ML 算法基于 VSWIR 代表性反射率数据集(光谱现象)来预测幼苗的起源种群。R软件用于实现RF和SVM。对于 RF,我们使用 randomForest 包 (v 4.6-14) [ 64 ] 中的 randomForest 函数,其中 ntree = 1,000 并保留所有其他默认参数。使用重要性函数提取各个波段对于 RF 模型的重要性。
SVM 模型使用 e1071 包 (v 1.7-3) [ 65 ] 中的 svm 函数和默认参数进行拟合。使用 BCRF 和 HCRF 的原始光谱和 SNV 转换光谱进行 ML 预测,并对预测结果进行比较。
对于 OC 和 CP,数据要么整体处理,要么按测量日分开,以检查单日光照条件下的预测是否会更加一致(主要涉及 OC 测量)。我们使用了 100 次迭代的交叉验证方法,将观察结果随机分为训练 (90%) 和测试 (10%) 子集。然后我们报告了不同输入数据的预测平均准确度。
结果
基于叶和幼苗水平反射因子 BCRF 和 HCRF 的种群分化
通过混合线性模型分别测试 BCRF 和 HCRF 每个波长的幼苗根据其来源(P、T 和 D 种群)的平均反射率因子之间的差异,得出的P值如图 1 和 2 所示。2和3 )。
由 CP 测量的叶 BCRF
在CP测量的光谱区域中,所有幼苗群体的平均BCRF在两两比较中显着不同(α =0.05)(图2)。BCRF 的差异在 VIS 和 RE 中最为明显。在所有 3 个成对比较中,差异发生在 1,000 nm(传感器开关)附近,其中P值超过了 0.05 显着性阈值(在图2中,它实际上下降到了折线以下,该线表示对数阈值)规模)。与 P 和 T(图2 A)或 P 和 D(图2)之间的比较相比,T 和 D 群体的成对比较在所有光谱区域中表现出较小的总体差异B)。此外,在 RE 之前的狭窄区域中,它们的差异并不显着(图2 C)。
OC 测量的整苗 HCRF
在OC测量方法的情况下,所有幼苗群体的HCRF平均值在VIS和RE以及大部分NIR和SWIR的成对比较中显着不同( α = 0.05)(图3)。在所有 3 个比较中,报告的P值在 1,000 nm(传感器开关)和 1,500 nm 附近的区域均超过了 0.05 显着性阈值 ( α = 0.05)。SWIR2(超过 2,000 nm)波长的成对比较显示出明显的幅度变化(图3 A 至 C)。成对比较没有检测到 SWIR1(1,430 至 1,970 nm)中 T 和 D 之间存在任何显着差异,而 SWIR2 中的这些差异接近临界水平(图3 C)。
叶子和冠层、BCRF 和 HCRF、幼苗群体中不同模式的检测
总体而言,所有 3 个幼苗群体的叶片和冠层 BCRF 和 HCRF 数据的两两比较P值在 VSWIR 光谱范围(350 至 2,500 nm)保持相似的趋势。然而,在可视化这些趋势时,我们在P值模式中遇到了一些差异(图4) 。磷在所检查的光谱区间的很大一部分中,BCRF 的成对比较值比 HCRF 更接近于零。对于 BCRF,差异的显着性在 VIS 中最为明显,红色区域(接近 660 nm)有所减少。就 BCRF 和 HCRF 的重要性而言,RE 是第二高峰。在 NIR 中,随着传感器开关 (1,000 nm) 的变化,比较的显着性降低,并且低于 BCRF 和 HCRF 的显着性。在该区域,BCRF 和 HCRF 的模式略有不同,但相关性值得怀疑。在1,100和1,400 nm之间的光谱带中,基于3个群体的BCRF和HCRF的所有成对比较都表现出显着差异。在 1,500 nm 附近,与 BCRF 相比,HCRF 群体的成对比较不显着。群体比较中 BCRF 和 HCRF 之间的P值出现在 SWIR(1,430 至 1,970 nm)中。与 HCRF 的P 值相比,BCRF(1,500 至 1,800 nm)的 P值明显接近于零。在超过 1,970 nm 的 SWIR 中, BCRF 的P值也更接近于零,且幅度比 HCRF 更小。尽管存在这种观察到的差异,HCRF 和 BCRF P值在 1,970 nm 以外的短波红外范围内均显着。
使用 ML 算法根据反射系数区分幼苗群体
我们通过比较预测的准确性来评估所选机器学习算法分离群体的能力。我们总结了原始和 SNV 标准化冠层 HCRF 和叶子 BCRF 的RF 和 SVM 精度(表2 )。准确度(以百分比表示)表示给定方法将幼苗正确分配给相应起源群体的概率。我们在基于原始整苗 HCRF 的模型中获得了最高的准确度。第 1 天,幼苗的 HCRF 被分配到正确群体的概率达到 83% (RF)。从 CP 测量的 BCRF 获得相对较差的结果(54% 至 68%,取决于测量日期和转化) 。第 2 天 BCRF 预测的最大准确度为 68%。
无论使用哪种数据或 ML 算法,SNV 转换都会导致准确性的整体提高。值得注意的是,当包括这两天时,HCRF (6%) 的预测改进比 BCRF (1% 至 2%) 更明显。这一总体趋势在 HCRF 的第一天被打破,其中 SNV 造成的差异达 10%。同样,SNV 转换后,BCRF 第 1 天的预测准确性有所提高 (5%)。测量日之间的不一致将进一步讨论。
特定光谱区域对于幼苗群体射频分离的重要性
使用 RF 模型的每个波长的重要性值记录了 BCRF 和 HCRF 通过 RF 预测幼苗起源的能力为何不同的另一个支持证据(图5 ))。在这两个反射量中,重要性在 VIS 和 RE 中显示出相似的峰值。对于BCRF来说,幼苗种群预测的重要波长大多局限于VIS和RE中的这些波长。相比之下,HCRF 在 NIR(900 至 1,200 nm 和 1,100 至 1,200 nm)和 SWIR(1,450 至 1,520 nm、2,000 至 2,020 nm 和 2,280 至 2,380 nm)中显示出更多重要的光谱区域。BCRF 和 HCRF 之间对射频预测非常重要的频谱间隔数量的差异可能与基于 HCRF 数据的射频模型的更高预测精度密切相关。SNV变换不同程度地提高了RF和SVM的预测能力,这也反映在重要性值的模式中(图S1)。
讨论
在过去的十年中,高光谱表型分析经常应用于评估幼苗对干旱[10]、污染[66]的敏感性以及各种病原体引起的疾病的早期检测[ 32,67,68 ]。光谱反射率能够使用 ML 算法有效生成具有大量样本(包括时间序列)的多元数据集,非常适合区分幼苗条件,ML 算法是高光谱数据分析不可或缺的工具 [ 69 , 70 ]。还有越来越多的证据表明,高光谱数据包含有关种间和种内遗传变异的信息[ 42,60 ]和植物谱系的系统发育史[ 71 ]。在本研究中,我们证明了高光谱反射率区分欧洲赤松幼苗个体种群的能力。比较了两种测量反射系数的方法——叶/针——CP 的 BCRF 和 OC 的整苗 HCRF 测量。测试了 ML 分类器(RF 和 SVM)的性能。我们的目标是研究 BCRF 和 HCRF 对于幼苗实际部署的好处和局限性。我们的目的是将它们分为相似的组,以促进在具有不同生态要求的地点进行有效的造林,而不存在潜在的适应不良的风险。
基于叶BCRF和幼苗HCRF的幼苗群体分化
BCRF 揭示了测量光谱范围内所有研究人群之间一致的、统计上显着的差异( α = 0.05)(图2)。种群之间的差异在与光合色素含量相关的区域的光谱的可见光部分中最大。在所有成对总体比较中,RE 的显着性达到峰值。我们将 BCRF 群体间差异的最大值解释为遗传背景(局部适应)的证据,并得到 Čepl 等人报告的 RE 针光谱反射率可遗传变异峰值的支持。[ 72 ]。
所研究的人群在 BCRF 中以及近红外和短波红外区域中也存在显着差异。考虑到在光谱黑色背景上扁平的针堆叠的接触测量,它们在近红外中的光学特性主要受其内部解剖结构的影响。叶肉细胞间隙的体积和表面决定多重散射并影响叶级反射率,如红云杉和东部铁杉所示[ 73 ]。BCRF使用近红外检测种群差异的原因可能是基于它们叶肉结构的差异,这应该在未来通过针解剖分析来解决。SWIR 光谱区叶片光学特性的主导因素是水分含量 [ 74]和结构聚合物。施万宁格等人。[ 75 ] 对应于木质素、纤维素或其他芳香族化合物的总结光谱波长或光谱范围:1,170、1,143、1,188 至 1,195 nm、2,280 至 2,340 nm 和 2,330 nm [ 75 ],与 [ 33、76 ]和[ 77 ]。这些特定波长在我们研究的人群之间也表现出显着差异。
与色素含量变异类似,植物水分管理变异与遗传控制下的局部适应有关[ 78 ]。因此,短波红外反射率区域的种群间差异可能与植物水分管理和结构化合物积累的遗传差异有关。我们没有进行破坏性分析来测量针的功能性状,因为幼苗已用于进一步的表型实验。
OC 获得的全苗 HCRF 在幼苗群体之间产生了与从 CP 获得的叶 BCRF 相似的成对差异。在平均 HCRF 的情况下,与 BCRF 类似,在整个 VSWIR 中,所有幼苗群体在成对比较中均存在显着差异 ( α = 0.05)。SWIR1 和 SWIR2 中幼苗群体的 HCRF 成对比较显示的显着性远低于 BCRF。在较长的 SWIR2 中,成对比较(P × D 和 T × D)的 HCRF 显着性表现出明显的幅度。然而,与较短波长相比,SWIR2 的P值显示出更强的波动,这可能是由于与噪声水平相比信号强度相对较低。
仍然需要通过排除噪声最大的近红外光谱带来考虑水蒸气的影响[ 59 , 61 ]。由于针状水含量强烈改变 NIR 和 SWIR 中反射率曲线的形状和大小 [ 74 , 79 , 80 ],如果从我们的数据集中删除光谱带(特别是在 1,390 和 1,890 nm 附近),有关水含量的信息就会丢失。 )。结果表明,来自不同樟子松种源的幼苗的干旱反应和水分管理各不相同[ 81 – 83]。因此,排除嘈杂的水吸收光谱区域可能会限制来源之间的区分能力。然而,其他信息丰富的水体特征可以区分 850 至 1,500 海里区域的生态型/种群。现场测量的 HCRF 的这些局限性可能会限制育种应用。挪威云杉的几个生长性状(高度、直径和树冠长度)与近红外和短波红外光谱区域的针反射率密切相关,可能在间接选择中有用[ 84 ]。
总而言之,BCRF 和 HCRF 可用于确定常见花园实验中代表幼苗群体之间的差异。除了两种应用的反射系数采集方法之间所描述的差异外,两种方法在解释上有一些相似之处:D 群体的 VIS 光谱区域中的平均 BCRF 和 HCRF 低于 T 和 P。 D群体可能归因于较高的吸收。D群体可能不太适应我们的试验条件,即低地气候和环境条件,但其BCRF和HCRF并没有表明叶绿素含量较低。
相比之下,在 NIR 后期和 SWIR 内,Děčín 幼苗的 BCRF 和 HCRF 相对较高,表明含水量的变化可能与适应不良有关。在欧洲范围内,欧洲赤松的高度生长和抗逆性之间存在权衡(抗逆南方种源,生长较慢[ 82 ])。因此,育种者很难根据幼年阶段的高度来选择优良后代,因为 Seidel 和 Menzel [ 81 ] 证明,较高和较重的欧洲赤松幼苗更容易因干旱而死亡。主要原因是生态型之间的生长动态存在显着差异,并且幼体材料与树种轮作年龄之间的相关性普遍较低[ 85]。
冠层生物量对反射系数测量的影响
幼苗生物量、形态和针密度或分枝是影响反射系数测量的附加特征。一方面,在测量 BCRF 时,将针压平在黑板背景上进行测量;因此,冠形态的影响被消除。另一方面,HCRF 是从上方对完整的幼苗进行测量的;因此,针的叶角分布及其密度影响反射率。这些影响在出处比较和机器学习预测中显而易见。根据树冠内垂直位置所给予的光照,成年针叶树有明显的阳针和阴针分化[ 86 , 87 ]。然而,幼苗高度太小,针无法以这种方式区分。
使用 ML 基于反射系数预测人口起源
根据比较 BCRF 和 HCRF 优越结果的 RF 分类性能,可以得出结论,影响 HCRF 数据的幼苗形态对分类精度有显着贡献。RF 预测从高方差数据和包含幼苗形态差异信息的数据中获得了更高的准确度。当这些参数受到控制或限制时,如在叶级 CP 数据中,正确起源预测的概率会降低。因此,OC (HCRF) 从整棵幼苗获得的数据在预测 3 个赤松种群方面具有更高的准确性。
之前已经使用了几种机器学习算法来根据亚种水平的遗传变异来区分植物类群。卡文德-巴雷斯等人。[ 42 ]在BCRF上应用偏最小二乘判别分析来区分单个橡树品种的当地种群。事实证明,相同的算法可以有效地对两种同时出现的仙女木物种之间的杂交进行分类[ 60 ]。SVM 算法已用于与当前案例类似的案例研究,区分柽柳种间杂种和纯种 [ 59 ]。SVM 的分类性能在Tamarix上获取的 BCRF 和 HCRF 上进行了测试插条。然而,总体生产商的分类精度略有不同(BCRF 和 HCRF 分别为 92% 和 96%)[ 59 ]。作者还测试了另一种机器学习算法随机梯度提升,它具有相对较高的分类精度(BCRF 和 HCRF 分别为 91% 和 93%),并声称随机梯度提升比 RF 分类器更适合小样本数量。
BCRF 和 HCRF 在预测精度方面的差异如上所述,并通过从 RF 推断出的每个波长的“重要性值”(即权重因子)进一步记录。遗憾的是,对于每个 ML 算法(包括 SVM),都无法获得有关对分类模型有显着贡献的波长的信息。在使用 HCRF 的 RF 分类中,对每个波长的重要性进行了评估,并在所有光谱区域(包括 NIR 和 SWIR)中给予相对较高的评级。相比之下,基于 BCRF 的重要性峰值仅限于 VIS 和 RE 区域。切普尔等人。[ 72 ]描述了RE在遗传变异背景下的重要性,这与我们的发现相符。
同样,卡文德-巴雷斯等人。[ 42 ] 报告了优先在 VIS 和 RE 中使用偏最小二乘判别分析对橡树种群进行分类的重要波长;NIR 和 SWIR 光谱区域也对模型有贡献,但影响较小。上述 BCRF 和 HCRF 之间的差异可能与 RF 模型的可变预测精度有关。具体而言,1,200 nm 附近的重要峰对于 HCRF 数据来说是独特的,它们可能有助于预测 D 群体(图5)。有趣的是,这个重要性峰值分别与D 和 P 之间以及 D 和 T 群体之间的成对比较中P值的增加相一致。
最近报道了基于反射率的亚种级别的各种树木种群(纯种及其种间杂种的种群)的分类[ 42,59,88,89]。然而,预测特定种群/来源可能有利于选择合适的个体进行繁殖或重新造林。这种分类应该针对植物功能性状进行非破坏性的分类。叶级光谱学的优点显然是操作简单和相对较高的通量而不牺牲测量精度。此外,所提出的方法(OC/CP)不依赖于与基于图像的光谱学相关的复杂图像分割和像素分类。尽管许多树种的基因组学仍然有限[ 90 ],但最近植物生物学家和树木育种者可以更容易地使用单核苷酸多态性进行基因分型。目前,空间遗传学利用大尺度和窄尺度的光谱信息[91 ]。它的生态利用早在十多年前就已被预测[ 92 ]。用于育种目的的高光谱数据的遗传评估已经与基因分型工作有效地结合起来[ 93 , 94 ]。结合这两种方法将加速选择具有当地环境所需适应潜力的幼苗[ 95 ]。
局限性
每种方法固有的局限性可能会影响研究结果,并为未来的研究提供改进的机会;因此,它们将在下一节中讨论。
通过配备内部光源的 CP 测量 BCRF 可以减少由环境光条件和大气气溶胶变化引起的噪声。测量每个样品所花费的时间应根据植物材料进行调整,因为光源发出的热量可能会损坏嫩叶,特别是在需要重复测量时。这一缺点对于处理诱发干旱胁迫的研究尤其重要。在针叶树幼苗中使用 CP 的另一个限制是操作过程中顶芽受损的风险。减慢整个测量过程的原因是需要放置足够数量的针来覆盖视野,这将决定所获得信号的质量和强度。考虑到在光谱黑色背景上展平的针堆叠的接触测量,它们在近红外光谱中的光学特性主要受其内部解剖结构的影响。因此,冠形态的影响被消除。CP测量对当前条件的依赖性较小,其白参考更稳定,并且测量在时间范围内具有可比性。
在环境照明下通过裸电缆测量的 HCRF 很大程度上取决于当前的天气条件。与 CP 获得性 BCRF 相比,当光照条件稳定时,近端 OC 测量耗时更少。因此,我们可以在晴朗的日子和接近太阳正午的情况下在更短的时间内获得更一致的结果,从而减少因改变光强度和几何形状而产生的变化。光谱范围内的气溶胶吸收(尤其是 1,390 和 1,890 nm 附近)根据当前条件而变化。这些特定范围的删除是以丢失含水量信息为代价的。非接触式测量还取决于 CP 稳定的电缆的几何形状。HCRF 是从幼苗水平上方测量的;因此,反射率受到针的角度分布及其密度的影响。由于整个幼苗的近端测量取决于环境光,因此光照条件下的时间变化会影响预测。在某种程度上,通过频繁的白板归一化和仅在接近太阳正午时进行测量,可以减少光几何和强度差异的影响。59 ]。通过 OC 测量产生的信号也比通过 CP 测量的信号弱。
尽管每种反射率采集方法都有其固有的局限性,但它们都被证明对于赤松幼苗的手动 HTP 是可行的。我们可以假设机器学习预测的日常差异主要是由于传入照明的变化造成的。然而,天数之间的变化也影响了基于 CP 的 ML 预测精度。在这种情况下,这很可能归因于抽样效应——我们每天测量不同的幼苗子集。
在本研究中,我们证明可以使用反射因子(BCRF 和 HCRF)来区分 3 个不同的欧洲赤松亲本种群的后代种群。我们研究的局限性在于缺乏传统植物生理学方法确定的针叶色素、干物质、含水量和形态(针叶密度)幼苗性状的支持生物物理测量。该研究是在指定用于抗旱实验的幼苗上进行的;因此,无法对幼苗进行取样。然而,我们获得了每棵幼苗的精确高度,并且种群的后代在平均高度上存在显着差异。然而,几项类似设计的研究表明,光谱反射率可能比多个叶子性状产生更好的分类[ 42,89 ]。
结论
本研究支持新出现的证据,即叶子和冠层反射光谱可用于区分种群间变异性,从而代表高通量植物表型分析的宝贵工具。使用反射因子和机器学习算法在普通花园或苗圃实验中检测各种针叶树幼苗基因型是一种新颖的方法,可以为未来有效的苗圃实践提供重要工具。
本研究针对赤松幼苗进行,这是一种具有极大空间分布和表型可塑性的生态和经济重要森林树种。事实证明,两种反射系数测量方法都可以检测 3 个当地种群(以 3 个果园为代表)的幼苗之间的差异,从而分离出在所有情况下都与特热邦和普拉西良好区分的 Děčín 种群的平均 BCRF 和 HCRF。基于 RF 和 SVM 算法的分类模型使用 HCRF(还包括树冠结构信息),与 BCRF 相比,正确预测相应种群的概率更高。HCRF 非接触式测量速度更快,并且包含形态信息,从而提高了预测模型的准确性。
高光谱反射率对于育种计划越来越重要,因为测量反射率因子可用于简单且无损的遗传评估。本研究的主要信息是,当表型分析装置负担不起时,手动高光谱表型分析可以为苗圃提供有效的工具。