新闻资讯
介绍
急性髓系白血病(AML) 是成人急性白血病的主要原因,约占所有确诊病例的三分之一,约占所有白血病相关死亡的一半(美国癌症协会)。AML 的特点是使用多参数方法,涉及形态学、免疫表型、细胞遗传学和分子突变鉴定,以促进预测、风险分层并指导临床管理。1 TP53的基因)等基因突变通常与复杂的核型相关,并且与治疗反应不佳一致相关,并预测更差的临床结果。2, 3此外,其他血液恶性肿瘤,如骨髓增生异常综合征 (MDS),同样受到分子发现的影响。4 , 5虽然携带这些突变的患者历来难以治疗,但最近批准的治疗方案和正在进行的临床试验为更有针对性的治疗方法带来了希望。这些新兴疗法的基础是在诊断过程的早期准确识别可操作的突变,以指导治疗决策。
随着下一代测序 (NGS) 越来越多地纳入常规实验室检测,在诊断血液恶性肿瘤时识别TP53突变已成为护理标准。不幸的是,由于成本高、可用性低且周转时间长,因此使用 NGS 分析进行长期监测存在局限性。鉴于这些障碍,多个小组研究了免疫组织化学(IHC) 等替代方法在识别和监测TP53突变方面的效用,其中几个小组报告了 IHC 和分子检测之间的密切相关性。6 , 7 , 8 ,9这种方法在无法立即进行分子检测的领域提供了一种快速且经济高效的替代方案。尽管 IHC 具有诸多优点,但其使用的一个限制是由于观察者内部和观察者之间解释的差异而缺乏标准化。这在疾病监测的背景下尤其重要,其中 IHC 主观解释的差异可能对患者产生重大影响。在这里,我们试图通过探索数字载玻片分析的效用来解决这一弱点,以提供一种标准化方法来识别和跟踪血液恶性肿瘤患者中的突变型 p53。
材料和方法
组织样本
经机构审查委员会 (IRB) 批准后,使用 Hedi 数据库在机构记录中识别出 2015 年 1 月至 2019 年 12 月期间获得的AML或 MDS诊断患者和 AML 组的NGS结果。总共鉴定出 118 例病例(82 例 AML 和 36 例 MDS),这些病例的特征概述于表 1。对每位患者相应的骨髓标本进行鉴定,对抽吸和环钻活检H&E 染色玻片以及辅助研究进行审查,并使用现行 WHO 标准确认诊断。10从每位患者中选择第一个诊断性骨髓样本进行进一步检查,因为它通常是具有较高水平的样本。疾病负担并且受先前疗法的影响最小。从每个病例中选择质量最高且抽吸伪影最少的福尔马林固定石蜡包埋块(切片凝块或环钻活检)进行后续IHC染色。
分子分析
我们的机构 AML 小组之前已经过临床验证,是一种基于大规模并行下一代 DNA 合成测序 (Ion Torrent) 的检测方法,针对 30 个癌症相关基因。该小组通常在诱导后第 30 天对第一个诊断样本进行检测,以建立基线分子谱,并根据每个病例的详细情况,以不同的时间间隔对后续骨髓样本进行检测。AML panel 中包含的基因以及覆盖的区域如下所示(表 2)。我们的研究中包含的病例根据TP53突变的存在、AML 组中包含的任何其他基因的突变或未发现突变的病例进行分层。
免疫组织化学染色和解释
IHC 根据标准实验室方案进行。简而言之,获得4μm厚的组织切片,脱蜡并再水化。然后使用 Tris/EDTA 目标修复溶液 (pH 9) 进行热诱导抗原修复。随后在 Dako Autotaining Link 上对 p53(Dako,克隆 DO-7,1:200)、BCL-2(Dako,克隆 124,1:100)和 MDM2(Calbiochem,克隆 IF2,1:50)进行染色48(达科)。根据先前发布的指南,根据染色的强度和丰度,对p53免疫反应性模式进行手动审核,并将其分类为“野生型 (WT)”、“错义”或“无效”。11我们将野生型染色定义为从阴性到低强度 (1+) 的异质染色。错义突变模式染色被定义为靶细胞中的同质强强度(3+)表达。无效模式定义为靶细胞中完全不存在免疫反应性。理论上,这种模式与无义突变的存在相关,无义突变导致 p53 蛋白表达减少,或产生畸形蛋白的突变,缺乏初级免疫组织化学抗体识别的表位,因此不产生免疫反应性。p53 染色由两名独立的血液病理学家进一步手动估计为阳性细胞的总百分比,而不是阳性母细胞的百分比,以便于与数字分析的载玻片进行直接比较。
数字分析
IHC 载玻片通过 P1000 全景扫描仪(3DHistech,布达佩斯,匈牙利)使用 × 20 物镜(0.24 μm/像素分辨率)进行数字扫描,以生成数字全载玻片图像 (WSI)。3DHISTECH QuantCenter 数字图像分析 (DIA) 软件的 Nuclear Quant 模块用于对免疫反应性进行计数和阈值(1+:弱,2+:中,3+:强,根据方案优化期间的核染色强度定义)根据核色原强度对细胞进行分类。为了进一步分析,我们使用了根据以下公式计算的两个参数:
1.
阳性指数(PI)=(阳性细胞数/细胞总数)
2.
强阳性指数(SPI)=(强阳性细胞(3+反应性)/阳性细胞总数)
SPI 与 PI 的不同之处在于,它仅考虑免疫反应(阳性)细胞,因为分母是阳性细胞总数,而不是阳性和阴性细胞总数。我们制定该指数是为了消除背景非肿瘤细胞的影响,例如成熟粒细胞、淋巴细胞和红系前体细胞。在随后的分析中对这两个指标进行了类似的测试。
图表准备和统计
使用 GraphPad PRISM 制作图表,所有统计分析均在该软件内进行。在适当的情况下,定量数据显示为平均值±SD。除非另有说明,否则使用双尾学生 t 检验进行比较,* 表示 p 值 <0.05。
结果
我们的研究共纳入了 118 例确诊为骨髓疾病的患者(82 例 AML 和 36 例 MDS)以及随后的分子分析。病例按诊断进行分组,并根据我们的 AML 组中确定的突变进一步分层,如表 1所示。
免疫组织化学
根据肿瘤细胞的可用性和存在情况,对每个纳入病例的凝块或核心活检进行 p53 的 IHC。然后使用详细描述的方法(材料和方法)评估 IHC 的 p53 染色模式并将其分为三个可能的类别之一:野生型 (WT)、错义或无效。由于 p53 在细胞中不是组成型表达并且会快速降解,因此染色强度本质上是可变的。因此,“WT”模式被分配给表现出可变染色强度的病例。相比之下,致癌性 TP53 突变已知属于两类之一,即所谓的显性失活突变(导致 p53 稳定性增强)和无效(功能丧失)突变,导致蛋白质表达丧失。14这些突变导致染色强度均匀增加(错义表型)或缺乏染色(空表型),从而允许根据观察到的模式进行分类。包括显示每种模式的案例示例(图 1交流)。根据 p53 染色模式对病例进行分类后,我们将这些“手动”识别的准确性与TP53突变的分子检测结果进行了比较(图 1 D)。我们发现仅通过 IHC 对 p53 的评估正确地将所有 66 个没有TP53突变的病例分类为具有 WT 表达模式。此外,52 中只有一个案例,其中TP53鉴定出的突变被错误分类为具有 WT 表达模式。具体来说,该患者的 c.854A > T、p.E285V 的变异等位基因比例为 38%。因此,我们队列中手动 p53 分类的阳性预测值 (PPV) 和阴性预测值 (NPV) 分别为 100% 和 98%。这些观察结果与其他人的观察结果一致.表明 IHC 是在分子确认之前评估 p53 突变状态的有力手段。
除了确定TP53突变的存在(为骨髓疾病提供预后和治疗价值)之外,使用 p53 染色来监测治疗反应也具有价值。为了促进这一点,人们可能会期望超越突变状态的广泛分类,转向一种高度可靠的方法,不仅可以量化 p53 阳性,还可以量化染色强度。目前,这是手动评估的,导致一位病理学家与另一位病理学家之间存在一定的差异。为了说明这一点,我们有两位经验丰富的血液病理学家(SB、SS)独立量化了所有 52 例 TP53 阳性的病例突变被分子鉴定。虽然 p53 阳性的总体印象相似,作为高度相关性的证据(图 1 E),但个体评估是可变的(图 1 F),强调了根据应用需要更标准化方法的潜在需要。
p53 染色的数字分析
数字病理学是一个快速发展的领域,具有众多的临床应用。16为了解决 p53 IHC 手动定量的固有变异性,我们开发了一种 p53 阳性数字定量方案,该方案将提供跨提供商(材料和方法)解释读数的标准化方法。我们的方法与最近出版物中使用的方法类似。17重要的是,这种方法不包括模式分析或分类尝试,而是仅基于染色的强度和丰度。使用该算法,将单个细胞评分为阳性或阴性,并根据染色强度进一步分类 (1–3+)。该过程的代表性图像如图2所示A和B。为了表达这些结果,我们根据阳性指数(PI,阳性细胞/总细胞)量化总体阳性率,并根据强阳性指数(SPI,3+阳性细胞/总细胞)量化染色强度阳性细胞)如材料和方法中所定义。为了评估这种方法的效率,我们首先将已知TP53突变病例的数字分析结果与未识别TP53突变病例的水平进行比较,发现TP53突变病例的 PI 和 SPI 均显着较高(图2C)。对于此比较,排除了被归类为具有无效表型 (n = 4) 的病例。为了进一步验证这种方法,我们评估了 AML 患者病例子集中的突变负担,并将其与 MDS 患者的突变负担进行比较,发现 PI 和 SPI 方法存在统计学上的显着差异(图 2D)。这些发现与其他人的观察结果一致,并且符合AML 的个体发育,尤其是那些由 MDS 引起的(14/36 AML 病例伴有TP53突变)。
建立了 p53 的数字分析流程后,我们接下来寻求识别可与 p53 结合使用的其他标记,以增强我们算法的准确性。为此,我们采用类似的方法通过 IHC 评估 Bcl2 和 MDM2 的频率和强度,因为这些蛋白质在恶性肿瘤中经常发生突变,并且已知可调节 p53 下游的事件。在已确定TP53突变的患者中,观察到 Bcl2 阳性率显着增加,尽管TP53突变的患者与组中其他基因突变的患者(不包括Bcl2或MDM 2 、材料和方法)表明这些增加不仅仅是由于TP53突变所致。相比之下,在任何组中均未观察到 MDM2 阳性差异。鉴于这些发现,我们接下来将 p53 阳性与 Bcl2 和 MDM2 相关联;然而,我们发现所有情况下相关性都很差。
与 p53 IHC 数字分析相关的主要挑战是确定最可靠地预测 p53 突变状态的 PI 和 SPI 阈值。为此,我们计算了 PI 和 SPI 的各种截止值的 PPV 和 NPV(数据未显示)。重要的是,我们再次排除了具有无效表型的四个病例。对这些结果的进一步分析表明,SPI 显着优于 PI,并且 SPI 的截止值为 5%,导致 PPV 为 91%,NPV 为 100%。虽然这些结果很有希望,但它们并不优于 p53 IHC 对病例的手动分类(PPV = 100%,NPV = 99%),并且需要更多的时间和精力来执行。虽然数字分析的诊断效用值得怀疑,但它可以用来增强手动分析。图3AC)。我们还评估了一个通过人工审查被错误分类为具有 WT 表型的病例,尽管分子测试中发现了TP53突变(图 3D)。重要的是,使用前面描述的数字分析和 SPI > 5% 可以正确识别这种情况。
数字病理学在疾病监测中的应用
最后,我们试图通过将其应用于临床实践中遇到的常见场景来验证该工作流程。为此,我们专注于使用 p53 IHC 的数字分析作为工具来协助 AML 患者的长期管理。我们首先将队列缩小到具有分子鉴定的TP53突变的 AML 患者 (n = 18),然后使用相同的算法方法对初始诊断骨髓和所有可用的后续骨髓 (n = 86) 的切片进行数字分析如上所述。这样做使我们能够随时间监测 p53 突变状态,而无需重复分子分析。两个此类案例的结果被纳入以证明该方法的实用性(图 4A 和 B)。最后,我们通过将每个病例的 PI 和 SPI 与疾病的直接测量值(例如TP53突变的原始细胞计数和变异等位基因分数 (VAF) (如果可用))进行比较,直接评估了数字分析的实用性(图 4 C 和 D) )。有趣的是,我们发现 PI 和 SPI对 VAF 的TP53突变负担的预测效果非常差,并且与原始细胞计数的相关性很弱。
讨论
在这项研究中,我们在其他人17最近的工作的基础上,评估了数字成像在克隆性骨髓疾病诊断检查中 p53 IHC 分析中的潜在作用。而目前识别TP53的黄金标准突变和监测治疗反应是分子分析,IHC 已成为一种更快速且更具成本效益的替代方案,在分子分析之前的诊断过程的早期阶段可能特别有用。需要强调的是,IHC 不应被提议作为分子分析的替代品,因为它缺乏此类诊断和测量残留疾病方法的分辨率和灵敏度。我们发现,p53 IHC 的手动分析使我们能够对除单个病例之外的所有 p53 突变进行正确分类,这与之前的几项研究一致,这些研究也类似地探索并证实了 p53 IHC 在各种骨髓疾病中识别高危患者的效用谁可能受益于替代化疗而不是传统化疗。7、8我们以这些观察为基础,证明即使是经验丰富的血液病理学家对 IHC 的解释也是可变的,并且 p53+ 细胞的定量在审稿人之间可能存在很大差异(图 1)。Ruzinova 等人的工作支持了这一点。6人通过 IHC 研究了 AML 中P53蛋白的表达,无需数字成像。他们的研究包括 24 例TP53突变的 AML 病例。他们通过 IHC 的手动解释仅检测到 21 例突变,其余 3 例因TP53导致蛋白质不表达的突变。虽然我们能够在所有情况下对“无效”p53 表型进行正确分类,但值得注意的是,此处执行的数字分析的一个主要弱点是它无法可靠地检测这些突变。
除了 p53 IHC 的工作外,我们还探讨了TP53突变与 BCL2 和 MDM2 水平之间的关系。虽然我们在数据集中没有发现这些蛋白质之间存在任何相关性,但我们建议可以采用与此处显示的 p53 类似的方式来监测这些蛋白质。随着新的靶向治疗药物的出现,其他蛋白质的 IHC 和数字分析将具有与 p53 类似的效用。
考虑到手动解释的局限性,我们试图通过数字分析来改进这种方法。有趣的是,使用 SPI 截止值 5%(PPV 为 91% 与 100%)时,纯数字方法的表现比纯手动方法差。值得注意的是,虽然可以考虑优先考虑 PPV 或 NPV 的不同截止值,但我们测试的任何截止值都无法接近手动分类观察到的值,其中在我们的数据集中只发生了一个错误分类。这可能是因为我们的简化方法(仅考虑 p53 染色的强度和总体百分比)无法解释人类判断需要调整的方面(即染色不良、细胞结构低或非典型细胞形态)。当然,有理由认为,结合模式识别元素的更先进的算法可以匹配甚至优于手动解释,但这些类型的机器学习方法目前超出了大多数临床实践的范围。最终,我们发现最好的方法是将每个人的优势结合起来,并使用数字分析来增强手动分类。通过利用这种辅助方法,我们能够正确分类所有 118 个测试病例中的TP53突变状态(包括最初被手动错误分类的单个病例),从而增强了最终解释的信心。
鉴于数字分析的表现并不优于手动分类,因此实施其所需的额外时间、精力和资源在紧急情况下不太可能有用。然而,数字分析的一个明显优势是,它可以显着减轻解释过程的主观性,并提供TP5的标准化定量评估3 可用于随时间变化趋势分析突变状态。IHC 人类定量的一个主要限制是,它本质上是一个近似值,通常四舍五入到最接近的十分之一百分位数或表示为一个范围,这是基于达到精确的阳性百分比的逻辑限制和人眼的限制。对载玻片上的每个细胞进行计数,精确定义阳性阈值,在所有样本中维持这些标准等)。如图 1所示,这将导致不同的结果,具体取决于审阅幻灯片的个人,甚至可能会导致个别审阅者的不同结果,具体取决于许多无法控制的“人为因素”。数字方法的优点是计算机程序每次都以相同的方式执行任务,并且具有明确定义的操作规则。因此,一旦编写了这样的程序,或者在我们的例子中,一旦定义了阳性和阴性染色阈值,这些阈值将统一应用于将来扫描的所有载玻片,因此您可以对发生的阳性率的细微变化更有信心(图4)。虽然这对于常规临床使用可能并不重要,但这种精度在临床试验中可能特别有吸引力或者用于可以在本地创建和维护 IHC 染色玻璃载片的研究应用,并在较大的机构以相对较低的成本进行数字分析。
必须承认 p53 IHC 的数字分析并非没有局限性。我们的方法在理论上与 Tashakori 等人采用的方法类似,17涉及扫描染色载玻片并以数字方式量化核染色的强度。然后必须指示计算机如何报告染色强度。这意味着必须为各个类别(阴性到 3+)分配相应的色原强度范围,然后将其应用于程序分析的所有图像。因此,分析中存在人为因素,该因素会尽早引入,然后统一应用于所有后续幻灯片。还值得注意的是,我们的协议中没有机器学习的元素,因此随着分析额外图像的时间的推移,量化的质量不会提高。因此,该技术并没有绕过与手动解释相关的许多限制,因为它只是一种更加标准化和准确的定量方法。这一点在在图 4 C 和 D 中,我们注意到数字分析的 IHC 与总原始细胞计数和分子发现之间的相关性较差,尽管我们直观地假设这些指标会相互关联。正如其他人指出的那样, 9这可能是由于许多无法通过简单染色技术评估的分子和细胞因素造成的。由于 p53 受到快速蛋白质周转的影响,导致“正常细胞”内的表达水平发生变化,因此个体突变的性质、个体内是否存在其他病理性或良性遗传变异、染色异常等,似乎阻止 IHC 准确反映突变负担。因此,目前,p53 IHC 的临床用途是在进行分子检测之前进行分类(突变与否)。作为数字病理学不太可能在获得分子结果之前进行,而且事实上不太可能在尚未进行常规分子检测的地方进行,从诊断的角度来看,它不太可能增加价值。
总而言之,我们的数据表明,p53 IHC 染色的数字分析目前在常规临床使用中并不可行,因为它具有资源密集性,并且在没有快速分析的情况下容易出现 p53 IHC 的相同缺陷。然而,我们建议它可以作为在特定用例和研究方案中标准化幻灯片解释的手段。