新闻资讯

使用牛津纳米孔测序对野鸟粪便中禽流感病毒的HA和NA基因进行测序的方法

1 . 介绍
甲型流感病毒属于正粘病毒科,具有负义单链 RNA 基因组,分为八个片段,编码至少 10 种蛋白质:PB1、PB2、PA、血凝素(HA)、NP、神经氨酸酶( NA)、M1、M2、NS1 和 NEP [1]、 [2]。哺乳动物和鸟类是甲型流感病毒感染的宿主[2] , [3] 。源自禽类的甲型流感病毒称为禽流感病毒(AIV),它感染属于13个禽目的100多种野生鸟类[4]、 [5];雁形目(涉水鸭、潜水鸭、鹅和天鹅)和鸬鹚形目(海鸥、燕鸥和滨鸟)被认为是最重要的宿主。

AIV 中有 16 种 HA 和 9 种 NA [2] , [6] , [7]。根据其对鸡的致病性,AIV可分为两类:高致病性AIV (HPAIV)和低致病性AIV(LPAIV) [8]。HPAIV 被定义为任何在实验感染中静脉内致病性指数(IVPI)> 1.2 或致死率 > 75% 的甲型流感病毒,或具有与之前的 HPAIV 相同的 HA 裂解位点基序[8]。HPAIV 的主要亚型是 H5 和 H7 [3] , [8]。

虽然病毒的致病性是基于病毒对鸡的致病性,但 HPAIV 对某些野生鸟类也具有高致病性,导致大规模死亡[9]。此外,HPAIV已从国际自然保护联盟(IUCN)红色名录中的受威胁物种中分离出来[10],例如白枕鹤(Grus vipio;VU)和白头鹤(Grus monacha;VU)[11] ],[12]。因此,高致病性禽流感病毒可能会增加受威胁物种的濒危风险,从而对生物多样性和家禽业构成威胁。

AIV 的抗原亚型可以通过血凝抑制 (HI) 和神经氨酸酶抑制 (NI) 测试进行,使用 HA 和 NA 蛋白的单特异性抗血清或针对一系列完整流感病毒的多克隆抗血清[8] 。还可以通过逆转录PCR (RT-PCR)、实时 PCR (qPCR) 以及使用 HA 和 NA 亚型特异性引物对 HA 和 NA 基因进行序列分析来确定亚型。然而,尽管已经开发出用于HA扩增的特异性引物[13]、[14],由于病毒突变,它们需要不断地审查和更新,并且必须对HA基因切割位点进行测序才能最终确定致病性。当前形势下,需要对AIV进行快速分型和病毒致病性测定,以防止HPAIV感染的传播。此外,从检测到AIV M基因的野鸟粪便样本中,AIV病毒分离率较低(43.5%;153/352)。因此,日本全国范围内对候鸟AIV的监测并未充分评估进入日本的AIV亚型[15]。为了解决与病毒突变和加速病毒亚型分型相关的问题,我们建议使用下一代测序根据HA和NA序列对AIV进行亚型分型。

Nanopore Flongle 是最便宜的下一代测序工具之一,已用于宏基因组分析[16]、小基因组的全基因组测序[17]、 [18]以及用于冠状病毒检测的扩增子测序[19]。牛津纳米孔技术(ONT)测序因其高序列错误率而受到限制[20], [21]。为了解决这个问题,Vierstraete 和 Braeckman [22]开发了 Amplicon_sorter,该程序使用 ONT 测序扩增子构建可靠的一致序列。由于甲型流感病毒的八个片段在两端具有共同的序列,因此已经报道了利用该共同序列扩增流感病毒整个基因组的方法[23]。先前的研究报告了使用 MinION [24]在人类临床样本中检测流感病毒的方法,使用 Illumina 平台在野鸟拭子中检测流感病毒的方法[25],使用 MinION [26]、[27]在野鸟粪便和拭子中以及在湿地沉积物中检测流感病毒的方法使用 Illumina 平台的液体杂交[28]。然而,关于基于HA和NA序列的AIV分型技术进展的报道却很少。因此,我们设计了一种新的 AIV 测序方法,该方法结合了使用 Flongle 的新一代测序和全基因组扩增。

2 . 材料和方法
2.1 . 材料
本研究中使用的 16 个野生鸟类粪便样本是从日本广大地区的 12 个湿地采集的(表 1 )。样本中含有AIV亚型H1至H12和N1至N9;不能考虑 H13 至 H16 亚型,因为它们以前从未在日本发现过。大约5克粪便样本被收集在离心管中并冷藏送至实验室。使用 Loopamp A 型流感病毒试剂盒(日本东京英研化学有限公司)进行逆转录环介导等温扩增(RT-LAMP)检测,检测流感 M 基因,粪便样本呈阳性。一种病毒 [15] 。根据部分或全长的分离或检测对样品进行亚型分类HA和NA基因

2.2 . RNA提取和DNase处理
用等量的磷酸盐缓冲盐水(PBS)稀释粪便以制备~50%粪便悬浮液。如下从粪便悬浮液中提取总核酸;将 250 μL 粪便悬浮液与 750 μL QIAzol 裂解试剂(QIAGEN,Venlo,荷兰)混合。然后通过涡旋将溶液与 200 μL 氯仿混合。4℃、12,000g 离心 15 分钟后,使用 EZ1 Virus Mini Kit v2.0 (QIAGEN) 提取 400 μL 上清液提取总核酸[15]。总核酸经过DNase根据制造商的说明使用 TURBO DNase (Invitrogen, Carlsbad, CA) 进行治疗。通过使用针对 AI 的 M 基因的 qPCR 确定 Ct 值来对 RNA 进行定量[32]。

2.3 . 全片段扩增和HA/NA特异性PCR(两步PCR)
所有片段扩增均通过一步 RT-PCR 进行,使用 Uni12 和 Uni13 引物[33]在 50 μL 反应混合物中进行,其中包含 25 μL 2 ×PrimeSTAR Max Premix、0.5 μL PrimeScript RTase(用于 2 个步骤)、0.5 μL 40 U/μL RNase抑制剂(Takara Bio Inc,滋贺,日本)、1 μL 50 nM 每种引物(表 2 ;Uni12 和 Uni13)、5 μL模板RNA 和 17 μL 无核酸酶水。PCR条件如下:42℃30min,94℃120s,98℃10s,30℃30s,72℃250s,40个循环。然后将一步 RT-PCR 产物用于 HA/NA 特异性多重 PCR [23]。HA/NA 特异性多重 PCR 测定在 50 μL 反应混合物中进行,其中含有 5 μL 10 × KOD-Plus-Ver.2 缓冲液、5 μL 2 mM dNTP、3 μL 25 mM MgSO 4 (Toyobo Co., Ltd.,日本大阪),0.3 μL 50 nM 每种引物(表 2;Bm-HA-1、Bm-NS-890R、Ba-NA-1 和 Ba-NA1413R),1 μL 一步 RT-PCR 产物,1 µL KOD-Plus 和 33.8 µL 无核酸酶水。PCR条件如下:94℃120s,98℃10s,57℃30s,72℃250s,35个循环。

2.4 . HA/NA 靶向一步 RT-PCR(单步 RT-PCR)
HA/NA 靶向一步多重 RT-PCR(单步 RT-PCR)检测在 50 μL 反应混合物中进行,其中包含 25 μL 2 ×PrimeSTAR Max Premix、0.5 μL PrimeScript RTase(用于 2 个步骤)、0.5 μL 40 U /μL RNase 抑制剂(Takara Bio Inc,滋贺,日本),1 μL,每种引物 50 nM(表 2;Bm-HA-1、Bm-NS-890R、Ba-NA-1 和 Ba-NA1413R),5 μL模板 RNA 和 15 μL 无核酸酶水。PCR条件如下:42℃30min,94℃120s,98℃10s,57℃30s,72℃250s,40个循环。

2.5 . 使用 Nanopore Flongle 进行扩增子测序
对多重 PCR 产物进行电泳并在 E-Gel Power Snap电泳装置(Thermo Fisher Scientific,Waltham,MA)上进行条带检查。将大约1.7和1.4kbp的条带大小视为HA和NA基因,并且将带有这些基因的PCR产物按照以下程序用于测序。

使用 0.6 倍量的 AMpure XP 珠(Beckman Coulter Inc.,Brea,CA)纯化 PCR 产物。根据 Nanopore Flongle R9.4.1(FLO-FLG001; Oxford Nanopore Technologies)制造商的说明,使用连接测序试剂盒(SQK-LSK110;Oxford Nanopore Technologies,Oxford,UK)制备文库。测序实验通过MinKNOW版本21.06.10至21.11.9进行,碱基检出设置为高精度模式。根据以下参数过滤读数:最小读数长度 ≥ 500 bp,最大读数长度 ≤ 2500 bp,读数质量 ≥ 9。进行测序以获得每个样本至少 100000 个通过过滤的读数。补充表中总结了 Flongle 运行特性和图形文件。

2.6 . 桑格测序
所有片段扩增产物均用于HA亚型特异性PCR和Sanger测序。HA 亚型 PCR 在 50 μL 反应混合物中进行,其中包含 5 μL 10 × KOD-Plus-Ver.2 缓冲液、5 μL 2 mM dNTP、3 μL 25 mM MgSO 4、0.6 μL 50 nM 每种亚型特异性 PCR 引物(表 2;针对 H1 至 H12)、1 μL 一步 RT-PCR 产物、1 μL KOD-Plus-(Toyobo)和 33.8 μL 无核酸酶水。PCR条件如下:94℃120s,98℃10s,57℃30s,72℃250s,35个循环。表 2 总结了用于 PCR 和测序的引物[34]。PCR 产物通过 E-Gel SizeSelect Agarose进行电泳、可视化和纯化凝胶。使用BigDye Terminator Cycle Sequencing Ready Reaction试剂盒和遗传分析仪3130型(Applied Biosystems)直接对HA基因的纯化PCR产物进行测序。

2.7 . 数据分析
使用 porechop 修剪称为读取的碱基,然后使用 NanoFilt [35]进行过滤,设置为“-q 11 -headcrop 75”。使用 Amplicon_sorter 组装过滤后的读数,HA 片段设置为“-min 1600 -max 1800”,NA 片段设置为“-min 1300 -max 1500”。使用 BLAST 程序将组装的 fasta 文件与 GenBank/EMBL/DDBJ 数据库中注册的流感病毒的基因组序列进行比较。HA/NA基因注释的序列中覆盖度最高的序列被认为是代表性序列。

为了检查组装方法的测序准确性,使用两种额外的基于参考的组装方法和过滤读数来确定 HA 序列。一种使用 minimap2 [36]和 bcftools [37]的基于参考的组装方法。将桑格法确定的序列作为参考序列,使用minimap2进行映射,并使用bcftools在默认设置下构建共有序列。另一个是 IRMA [38],一个基于参考的汇编软件,设置为“IRMA FLU-pacbio”。

使用 LALIGN [39]计算了通过 Sanger 方法确定的 HA 序列与使用 Flongle 和三种组装方法的新方法确定的 HA 序列之间的相似性。此外,还评估了通过我们的新方法确定的 HA 和 NA 片段的序列,以确保 CDS 的完整性。评估 CDS 确定程度的标准如下:完整:确定了CDS从起始密码子到终止密码子的序列;接近完整:起始密码子和终止密码子中的一个或全部缺失,且估计缺失序列长度小于 60 bp;部分:起始密码子序列和终止密码子序列之一或全部缺失,且缺失序列长度超过60 bp。

3 . 结果
3.1 . PCR 和桑格测序
对于所有样品,通过E-Gel Power Snap电泳在两步PCR 和单步PCR 产物中的任一者或两者中发现HA 和NA 基因的条带。将纯化的产物进行Flongle测序。此外,在使用所有片段扩增产物的HA亚型特异性PCR检测中,除了2021-1408和2021-562之外的所有样本中均发现了HA基因;带有HA基因的PCR产物进行Sanger测序。通过 Sanger 方法确定的 HA 序列总结在补充 fasta 文件中。通过qPCR测定每个样品中AI的M基因的Ct值,Ct值范围为5至未检出(表1)。

3.2 . 数据分析
对每个样品中的 1 步或 2 步 PCR 产物进行一次或两次 Flongle 测序,产生 112321-770614 个碱基检出读数和 46075-616037 个过滤读数(补充表)。所有样本的原始读取数据均存放在序列读取存档 (SRA) 中,登录号为 PRJDB13596。使用我们的方法确定了所有样本的 HA 序列,并确定了除 2019-299 之外的 15 个样本的 NA 序列。使用 Sanger 和我们的方法鉴定的 HA 亚型是一致的。通过我们的方法确定的病毒基因组序列与现有毒株的HA片段的一致性高达96.41-99.59%,NA片段的一致性高达97.82-99.65%(表3))。使用Flongle通过我们的方法确定的HA和NA片段的序列在GenBank/EMBL/DDBJ数据库中注册(LC723830-LC723848、LC764367-LC764378)。CDS评估结果显示,2022-1970年样本中除NA基因片段外的所有片段均被评估为完整或接近完整(表3)。

使用Sanger方法测定的HA片段的序列与使用Flongle测定的HA片段的序列高度相似(>98.5%;表4 )。在本研究中,在样本 2019-299 和 2019-539 中,使用 minimap2 和 IRMA 基于参考的组装方法显示出比从头组装更好的结果。在其他样本中,我们的方法和 IRMA 具有可比的结果,并且使用 minimap2 的方法比这两种方法表现更好(表 4)。

4 . 讨论
通过对粪便样本中提取的病毒RNA进行Flongle测序和全基因组扩增,我们确定了所有样本中HA的核苷酸序列和15个样本中的NA片段。PCR和Sanger法测定的HA和NA亚型结果与我们的方法测定的亚型一致。(表1、表3)。我们的方法能够使用相同的技术对 H1 至 H12 和 N1 至 N9 亚型进行测序,这表明我们的方法具有可扩展性并适用于广泛的 AIV 亚型。此外,使用Sanger方法获得的HA序列与我们的方法显示出较高的同源性(>98.5%),表明我们的方法作为测序分析的准确性很高。这些结果表明我们的方法可以有效地对粪便样本中的AIV进行测序,并对病毒的HA和NA基因进行测序和亚型分析。大多数样本中 HA 和 NA 基因片段的 CDS 评估已接近完成。我们方法的局限性是确定起始密码子和终止密码子部分的准确性可能较低并且插入缺失均聚物部分可能会出现错误。因此,为了进行更详细的分析,需要手动管理来创建更严格的序列。

在 2019 年收集的样本中观察到我们的方法确定的 HA 序列与 Sanger 测序的 HA 序列之间的核苷酸序列相似性较低的趋势 (98.5 – 98.8 %)。对年份之间评估的 Ct 值进行比较表明,2019 年和 2020 年收集的样本的 Ct 值往往略高于 2021 年和 2022 年收集的样本。由于我们的方法针对 HA 和 NA 片段的两端,因此较旧的样本可能具有两端退化了。因此,我们的方法应该使用新鲜样品进行,其中 RNA 尽可能未被降解。我们的方法表明,使用相同的技术可以直接检测粪便中的多种病毒亚型。在样本 2021-562 和 2021-1408 中,使用 Sanger 方法无法通过 PCR 检测到 HA 片段,但可以通过我们的方法检测到。使用HA通用引物被认为可以提高检测HA基因的灵敏度,但特异性会降低。相反,HA 亚型特异性引物可能具有较高的特异性,但 PCR 反应性较低,导致灵敏度较低。我们无法通过使用 Flongle 的方法对样本 2019-229 的 NA 基因进行测序。此外,所有 NA 亚型特异性 PCR[14](亚型 N1 – N9)对样本 2019-229 进行,但并非所有 PCR 都显示 NA 基因扩增。因此,我们认为,如果病毒 RNA 在粪便中被降解,某些基因可能无法检测到。

将我们基于从头组装和 Flongle 序列的方法的结果与基于参考的组装方法的结果进行比较,2020 年、2021 年和 2022 年样本的结果相似。另一方面,基于参考的组装方法在样本 2019-299 和 2019-539 中表现更好(表 4)。在基于参考的组装中,组装过程中不进行质量和长度的修剪,并且所有读数都可以用于组装,因此降解的病毒RNA被认为增强了共有序列。此外,由于使用Sanger方法确定的序列作为参考序列,因此使用minimap2的组装被认为表现良好。因此,在实践中,我们的方法或 Flongle 测序和 IRMA 组装程序组合的方法将适合 AIV 分析。此外,IRMA只能用于流感病毒、埃博拉病毒、冠状病毒等特定病毒,但从头组装方法可用于其他类型的病毒,使其具有高度的可扩展性。

已经报道了使用纳米孔技术从几乎没有异物的临床样本(例如人鼻咽拭子)对流感病毒基因组进行测序的方法[24]。克罗斯利等人。[27]还报道了使用Nanopore MinION从野鸟拭子中检测AIV;他们的方法每次运行使用一个 MinION 流动槽(每次运行 900 美元)。然而,由于其成本,该方法可能缺乏通用性。希姆斯沃斯等人。[28]报道了一种结合液相杂交和Illumina平台从湿地沉积物中检测AIV的方法。德弗里斯等人。[26]也报道了在野鸟粪便中检测到AIV,但他们的方法并没有消除由于多重检测而导致条形码不正确的问题,并且仅检查了两种HA亚型H13和H16。此外,我们使用 Flongle 的方法具有测序运行成本低(100 美元/运行)的优势。我们使用 Flongle 的方法的另一个重要特点是它不需要特殊的预处理(例如液相杂交),并且易于实施。正如其他研究人员所认可的,纳米孔测序仪的优点包括高便携性和低初始成本[26],[27]。鉴于最近禽类和哺乳动物中人工智能的爆发[40],即使在没有准备好病毒分离的实验室中,也可能有必要确定病毒序列。因此,像我们这样快速确定人工智能序列而不分离它们的方法对于防止人工智能在世界上传播非常重要。

5 . 结论
我们通过结合流感病毒两端共同位点的 RT-PCR 和廉价的下一代测序仪 Flongle,开发了一种对 AIV 的 HA 和 NA 基因进行测序的方法。该方法灵敏度高,预计适用于流感病毒的其他亚型,使其成为野生鸟类禽流感监测的有用工具。对该方法的修改有望促进其他物种病毒的全基因组分析。

发布日期:2024-03-07