新闻资讯

下一代环境风险评估缺失的基因组资源

介绍
传统的剂量反应毒性测试是监管生态毒理学的基本组成部分,也是体内量化顶端危害的首选方法。(1)然而,传统剂量反应毒性测试作为“金标准”的教条受到质疑,因为忽视了对生物变异性的考虑,缺乏测定稳健性,以及参与此类测试的许多生物体的痛苦和由此造成的牺牲。此外,这种经典的体内测定方法并非旨在阐明所观察到的不良反应的机制基础,也限制了推断当前未经测试的具有类似特性的化学物质的可能结果的能力。(2,3)政治、社会和科学观念的转变促进了基于对不利影响的机械理解的新一代风险评估(NGRA)。在许多监管领域,NGRA 不断发展的主题中的基础是新方法 (NAM)。(4,5)从历史上看,NAM 旨在用于 3R 脊椎动物领域的机械危险表征。(6)最近,这些方法已超出其最初狭窄的系统发育范围,扩展到更广泛的生物体。(7)与侧重于量化顶端效应的传统测试相比,NAM 旨在表征新型和传统测试系统中的剂量反应效应。它们包含多种方法的异质集合,其中包括各种体外实验设置(例如细胞系和胚胎)、实验读数(OMIC,例如转录组学、蛋白质组学和代谢组学)以及计算机方法(例如贝叶斯网络和机器学习应用)。此外,NAM 提供了在高通量应用中实施的潜力,以大规模表征不利影响。

尽管其多样性,许多 NAM 依赖于亚有机测量数据,这些数据在整个设计、验证和解释阶段(例如,测序深度和功能注释)需要高质量的基因组信息。突出的例子使用强大的危害相关生物标志物来预测一系列研究生物体的不利影响(例如,EcoTox 芯片)(8)或表征预测定量不良反应 (qAOP)。(9)
标准生态毒理学替代物种的可用高质量基因组资源的明显好处仍然是生态毒理基因组学革命的承诺,但尚未实现。(10)从历史上看,基因组测序的高昂成本和建立全社区基因组图谱的协作努力不足,可能导致了生态毒理学替代物种的基因组景观分化。

2007年左右测序成本的大幅下降使得基因组测序得到了广泛的应用,并促进了计算分析工具的发展。现在,全球联盟通过大规模高质量基因组测序生成基因组生物多样性生物库,这可能是为监管相关替代物种开发高质量基因组图谱的机会。

为了支持开发统一的开放获取基因组图谱作为(监管)生态毒理学的全社区基因组资源,我们编制了一份当前可用的标准测试物种清单(即全球环境风险中使用的标准测试指南中提到的物种)评估)并将其与系统发育、栖息地、NCBI 的基因组资源可用性和基因组质量等信息相结合。我们使用这些数据来概述基因组资源的可用性和分布。我们希望在整个领域内推动缩小基因组资源缺口将加速向 NGRA 的过渡,并有助于促进生态毒理学全面过渡到 21 世纪。

材料和方法
2022 年春季,我们筛选了全球生态毒理学测试指南(即 OECD、OCSPP 和 ASTM),以寻找在种或属级别命名的推荐替代物种。无法明确指定监管相关物种的群落和测试生物体被排除在分析之外(例如,在属级别命名的微生物群落和分类单元)。对于所有生物体,我们记录了它们的栖息地(淡水、咸水或陆地)以及它们所属的分类群(无脊椎动物、脊椎动物、植物和藻类;数据取自 EnviroTox(14))。使用此生物体列表,我们使用基因组搜索功能搜索了存放在 NCBI 数据库中的组装基因组(搜索日期,2022 年 6 月)。对于每个物种,我们记录了组装基因组的存在或不存在以及与该资源的链接。根据 NCBI 的定义,组装的基因组包括全基因组序列、基因组图谱、染色体、组装体和注释。

对每个物种的基因组序列质量在覆盖和组装方面进行了逐步评估。首先,我们评估了可用的基因组组装是否覆盖了染色体水平,这是一个关键的质量标准。(15)其次,根据最近的指导,(15)评估每个基因组的质量指标。如果 BUSCO 评分(通用单拷贝直系同源基准)高于 90%,并且重叠群与染色体对的比率(CC 比率)低于 1000,我们将基因组定义为高质量。

为了可视化,我们根据使用 R 包rotl从开放生命树项目获得的数据,为可用的监管替代物种构建了共识系统发育。(16)为此,指导文件中的生物名称与开放树分类法中的物种名称相匹配(综合版本 v14)。(17)仔细检查匹配是否有重复的名称、重复的数据库 ID(ott 编号)、正确的分类域分配以及同义物种名称。根据外部分类数据库(世界海洋物种名录,(18)生活目录(19))。对于未解决的物种名称,如果可能的话,选择属节点或最近共同祖先的节点来构建树。使用ggtree将合成树与栖息地信息、组装基因组的可用性及其各自的质量一起可视化 (20)和ggplot2。(21)所有分析均在 R 版本 4.3.1 中完成。

结果
文章部分跳到
我们总共发现了筛选的监管指导文件中提到的 263 个生物实体(ESM表 S1)。未明确指定监管相关物种的所有实体均被排除在分析之外(总共 15 个实体:Baetis sp.、Bufo sp.、Cambarus sp.、Ephemerella sp.、Gossypium spp.、Hemigrapsus sp.、Pachygrapsus sp.。 、Paronychiurus sp.、Pteronarcys sp.、Rana sp.、Rhizobium sp.、Uca sp.、Vignasp.、微生物群落和原生动物群落),最终分析了 237 个物种(图 1)。总的来说,NCBI 提供了这 237 个物种中 100 个物种的特定基因组资源(占所有物种的 42.2%;表 1)。其中 72 个基因组在染色体水平上得到了解析,这是一个关键的质量标准(14)(ESM表 S1)。根据之前定义的质量指标,(15)由于 BUSCO 得分低于 90%(鳕鱼、贻贝和黑麦)或计算出的 CC 比率高于 1000(另外 13 个物种,ESM图 S1),16 个基因组未被归类为高质量。56 个基因组仍然是高质量的分类基因组(占所有物种的 22.6%,见表1)。


目前,大型测序计划正在对另外六个物种进行测序(达尔文生命树项目、(13)i5k,(23)Aqua-FAANG,(24)和国际杂草基因组联盟(25)),可能会产生当前分析中未考虑的高质量基因组(参见 ESM表 S3)。我们发现,现有的高质量基因组资源在大型分类群中的覆盖度不平等,其中脊椎动物的总数和覆盖率最高,其次是植物和无脊椎动物(表1)。有关植物和藻类、无脊椎动物和脊椎动物(包括分类单元名称)的系统发育基因组资源可用性的单个图可以在 ESM 中找到。

讨论
我们系统地评估了监管生态毒理学中使用的替代测试物种的基因组资源的可用性和质量。我们发现总体而言,只有不到 23% 的研究替代物种被高质量的基因组所覆盖。

自 2000 年代初基因组时代开始以来,毒物基因组学在(生态)毒理学研究中的潜在应用已经显而易见,并且被认为是迈向预测生态毒理学的合理步骤。(10)当时,基因组测序是一项耗时且成本高昂的工作,导致相关模型物种的覆盖范围稀疏且存在偏差。最近成本的下降以及第三代远程 DNA 测序和作图技术的出现正在推动高质量基因组测序的复兴。与第二代测序产生几百个碱基对长的短读段不同,第三代单分子技术产生超过 10,000 bp 的读段或映射超过 100,000 bp 的分子。这导致基因组组装质量的重大提高,使我们能够解决最具挑战性的基因组区域并生成整个染色体的端粒到端粒组装。(26)地球生物基因组等基因组测序项目(11)或达尔文生命之树(13)正在为许多已知物种生成参考基因组,作为未来生物科学和环境管理的资源。鉴于这些进展,现在可以纠正历史覆盖范围,并且可以生成高质量的开放获取的生态毒理学相关基因组图谱。为了加速这一过程,需要确定最相关的替代物种的共识清单,并组装分类学上确定的生物材料。有了这样的清单,就应该与上述测序联盟接洽并确定资助策略。鉴于这种资源对商业和非商业部门的有用性,环境毒理学和化学协会 (SETAC) 将是启动这一过程的合适论坛。我们认为这样的基因组图谱是 NAM 开发的关键拼图。基因组图谱的核心是为一组物种提供强大且一致的基因组注释。在生态毒理学背景下,这样的图谱将扩展序列比对的价值,以预测跨物种的敏感性(SeqAPASS(27))并促进在分子水平上不良结果途径的描述和表征。基于对毒性产生过程(包括保守的结果途径、解毒机制和生理反应)的详细分子理解,将毒性外推到除密切相关的物种之外的多个物种将成为可能。

除了在监管生态毒理学中 NAM 开发和验证的核心作用之外,我们相信高质量的基因组图谱将为全面了解化学应激源的影响(从分子起始事件到观察到的不良影响)提供坚实的基础。有机体水平。最近的实验和计算进展为复杂生物过程和系统(从分子到有机体)的综合观点(称为系统生物学)铺平了道路。(30,31)系统生物学的跨学科领域旨在了解生物系统,而不是孤立地研究各个组成部分。这种推理直接适用于化学引起的应激反应,并且可以支持全面了解有毒物质对生物体、种群乃至生态系统的影响。(30,31)在系统生态毒理学框架内,我们设想开发一种基于 NAM 的多工具方法,涵盖 OMIC(基因组学、单细胞转录组学、蛋白质组学和代谢组学)、高密度生物数据(细胞或生物测定)和计算机方法(毒代动力学-毒动力学 [TK-TD] 和动态能量收支 [DEB] 模型)从机制上系统地解释潜在脱靶物种中的合成化学毒​​性。在这样的多因素数据集成系统的支撑下,(32)超越简单化的毒性指标(例如 LC/EC 50值),并以机械方式了解化学应激源引起的不利影响将成为可能。这样的框架有望确保对生物组织各个层面的不利结果进行更可靠的预测,并为当今社会面临的与粮食生产和适应全球变化有关的紧迫问题加强更可持续和合乎道德的解决方案。

发布日期:2024-01-23