新闻资讯

确定在病理学和检验医学中实施大型语言模型的优先事项

介绍
随着 ChatGPT的发布,人工智能 (AI) 和大型语言模型 (LLM) 已成为经济有效地提供临床护理的潜在变革工具。尽管“希望”与“炒作”交织在一起,但医疗保健领域法学硕士的广泛发展已经在进行中。法学硕士的高影响力应用包括可以减轻面对患者的临床医生耗时的任务的方法,包括书写笔记和回复患者消息。1在病理学领域,人工智能受到关注,因为它可以提高诊断的速度和准确性,并提供更有用的预测。2为了学术病理学家为了最充分地受益于生成人工智能等新技术,我们必须设想其在我们每项主要任务中可能应用的整个范围,包括教育、临床实践和研究。

GPT代表“生成式预训练变压器”,指的是由 OpenAI 开发的一系列法学硕士,其中深度神经网络用于根据提示生成文本。虽然 GPT 可能是第一个获得国际关注的法学硕士,但作为推动流行的 ChatGPT 界面的模型,它是许多科技公司使用生成式人工智能来创建内容的更大趋势的一部分。LLM 基于 Transformer 架构,3允许它们并行处理文本输入并建模单词之间的关系。GPT 等法学硕士在大量文本数据(例如网页或书籍)上进行预训练,然后针对特定任务(例如问答、语言翻译和文本分类)进行微调。这使得它们在根据提示生成流畅且有说服力的文本方面特别有效。修改版 GPT 为 ChatGPT 提供支持,自 2022 年底以来,ChatGPT 已作为在线工具向公众开放,后续改进包括 GPT-4。

ChatGPT 已成为一股颠覆性力量,揭示了生成式人工智能促进医疗保健和科学领域发生根本性变革的潜力。在临床医学中,广泛使用的电子健康记录供应商 Epic 已经发布了用于临床护理测试的 GPT 功能,例如起草对患者消息的回复。在研究中,这些工具能够对科学写作做出重大贡献,并且期刊已经制定了有关法学硕士使用的编辑政策。Science系列期刊禁止在未经明确许可的情况下使用人工智能,而NatureSpringer Nature 系列期刊制定了一种更为温和的方法,要求在方法、致谢或文章引言中披露 LLM 的使用情况。4 , 5鉴于 ChatGPT 在为科学文章和资助申请撰写引言和背景部分方面表现出色,6 , 7可以合理地假设 LLM 将被科学和医学界广泛使用,也许超出了正式披露的范围文章和拨款申请。

GPT-3.5通过ChatGPT向公众开放后的几个月内,微软发布了一个功能更强大的LLM版本,并将其纳入其搜索引擎Bing中,这证明了互联网搜索引擎的功能正在经历快速转变。目前,我们看到通过 Azure 等云计算平台,用于医疗保健的生成式 AI 产品正在快速发展 现在提供符合 HIPAA 要求的 GPT 和 Amazon Web Services (AWS) 使用,通过 Amazon Bedrock 提供竞争的 LLM。这些工具将使医疗机构能够试验和开发法学硕士解决方案,并具有适当的安全性以确保患者隐私。因此,在不久的将来,与可用的功能相比,ChatGPT 的当前功能很可能会显得有限。

表 1提供了法学硕士可以协助或改进的病理学和检验医学常见活动的理论列表。表 1中的元素由 ChatGPT 于 2023 年 2 月生成,用于回答“大语言模块在病理学和检验医学中的应用是什么?”的问题。8虽然学术病理学家的一些集思广益可能会用许多额外的优秀用例来丰富此表,但法学硕士产生了合理的初稿。ChatGPT 等人工智能模式是否会提高学术病理学和检验医学实践的有效性和效率?

表格1。法学硕士在病理学和检验医学领域的潜在应用a .

1.
医疗报告生成:大型语言模型可用于生成病理学和检验医学的医疗报告。这些报告可以由模型自动生成,从而节省时间并减少病理学家和实验室专业人员的工作量。

2.
数据分析:大型语言模型可用于分析大量临床数据(例如电子健康记录),以识别有助于疾病诊断、治疗计划和结果分析的模式和趋势。

3.
临床决策支持:大型语言模型可以为临床医生提供决策支持,帮助他们就患者护理做出更准确、更明智的决策。例如,大型语言模型可以分析患者症状和病史,以建议潜在的诊断或治疗方案。

4.
患者教育:大型语言模型可用于开发聊天机器人或虚拟助手,帮助患者获取有关其医疗状况、治疗选择和治疗后护理的信息。

5.
质量控制:大型语言模型可用于监控实验室测试过程并识别潜在的错误来源或质量问题。这有助于提高实验室结果的准确性和可靠性。

6.
医学文献分析:大型语言模型可用于分析医学文献并提取相关信息以供临床决策。这可以帮助医疗专业人员了解最新的研究和治疗方案。

A
ChatGPT 提供的输出。7

本杂志之前的一篇文章回顾了人工智能在病理学中的应用。9上一篇文章讨论了人工智能的复杂科学、不同类型的机器学习,以及执业病理学家如何开始拥抱这一重要领域。在此,受 ChatGPT 等 LLM 应用程序极其用户友好的性质的启发,我们采取了不同的方法。虽然成为新技术的用户和很好地使用该技术之间存在区别,但成为该人工智能应用程序的用户基本上不需要培训,也不需要人工智能专业知识。因此,病理学和检验医学专家能够影响法学硕士及其应用的发展,从而最好地满足我们专业的需求和全球医疗保健。在本文中,我们选择了与学术病理学和检验医学实践相关的三个例子进行讨论,我们认为这是法学硕士在我们领域的潜在应用的“容易实现的成果”。

法学硕士可能是病理学教育的强大资产
对于学术病理学家来说,使用易于使用的人工智能工具来协助演示和讲座的发展可能代表着向前迈出的杰出一步。最近的评论讨论了人工智能在医学教育中的应用。10 , 11ChatGPT 等 LLM 应用程序在病理学教育中的新颖之处在于其易于使用。作为练习,我们将重点关注向病理学和检验医学系一年级助理教授提出的挑战,他被要求为该系的教育使命做出贡献。因为我们的理论教师是一名血液病理学家,所以主题将是贫血。为了解决他/她的挑战,助理教授打开 ChatGPT 并输入查询:“为医学院关于贫血原因的讲座提供大纲。” 响应如表2所示。12

表 2 . ChatGPT 概述了医学院关于贫血原因的讲座。

1.
简介:A. 贫血的定义 B. 了解贫血原因的重要性 C. 讲座概述

2.
贫血概述:A. 红细胞及其作用 B. 血红蛋白及其重要性 C. 贫血的症状和体征

3.
贫血的分类: A. 小细胞性低色素性贫血 B. 正细胞性正色素性贫血 C. 大细胞性贫血

4.
小细胞低色素性贫血的原因: A. 缺铁性贫血 B. 慢性病性贫血 C. 地中海贫血 D. 铁粒细胞性贫血

5.
正细胞正色素性贫血的原因: A. 慢性肾病 B. 溶血 C. 失血 D. 骨髓衰竭 E. 血红蛋白病

6.
大细胞性贫血的原因: A. 叶酸缺乏 B. 维生素 B12 缺乏 C. 骨髓增生异常综合征 D. 酗酒

7.
结论: A. 讲座总结 B. 早期诊断和管理的重要性 C. 未来研究方向

本讲座可以补充案例研究和视觉教具,例如图表、图像和幻灯片,以进一步说明贫血的各种原因。


A
ChatGPT 提供的输出。12

与人类生成的轮廓相比,与法学硕士无关,输出有多种优势。首先,快速完成所需的大纲。输出提供了一个起点,教师可以在此基础上进行构建和改进。如果教师在没有法学硕士合作的情况下编写讲座,则讲座可能包含不会被考虑的主题。最后,也许最重要的是,当法学硕士用于医学讲座大纲开发时,人类监督和管理是“内置的”,因为法学硕士只是创建草稿,任何不准确之处都可以由细心的讲师在扩展内容时纠正。必须强调人工审核的重要性,因为像 ChatGPT 这样的 LLM 申请可能容易出现“幻觉、13在与经验不足的学习者共享信息之前,人工审核可以缓解这个问题。

法学硕士可以为 MyChart 等患者门户中的实验室和病理报告提供有用的注释
《21 世纪治愈法案》(Cures Acts)的信息封锁条款要求通过患者门户等方式几乎立即发布电子健康信息(EHI),包括医院实验室检测结果,这导致了传统医疗保健信息的重大转变。医疗保健提供范式。14虽然医疗保健界在很大程度上赞成向患者发布实验室结果,并了解患者轻松获取和控制其健康信息的好处,但仍提出了15 个值得注意的问题。16 , 17 , 18一个重要的担忧是,患者在收到未经面向患者的医生预先筛选和解释的医院实验室结果时可能会感到焦虑。使用 LLM 应用程序代表了一种潜在的重要策略,可以为MyChart 和其他患者门户中的异常实验室结果提供有用的注释,以便患者更好地理解所提供的信息。

随着解剖病理学报告的广泛自动发布,患者门户中结果注释的重要性确实可能会增加。从患者的角度来看,病理报告可能比异常的实验室检查结果更难以理解。在最终的病理学报告中,特定领域的术语至关重要,以便最好地为诊断和治疗计划提供信息;然而,对于不熟悉特定疾病实体的患者来说,相同的语言可能难以理解甚至误导。为了测试法学硕士是否可以促进患者访问门户中解剖病理学报告的翻译,我们上传了假设的血液病理学报告向 ChatGPT-4 报告并要求法学硕士提供六年级阅读水平的摘要和患者教育材料(表 3)。19所提交的报告是对骨髓的分析,显示了浆细胞肿瘤的证据,可能因覆盖的反应性多型骨髓浆细胞增多症而变得复杂。病理学家了解如何将骨髓分析报告中的详细注释与其他测试结果一起使用,以构成该患者所需的诊断检查。20 , 21 日ChatGPT 对报告的解释值得注意,因为它过滤了对执业病理学家和肿瘤学家重要的细节,但仍然为患者提供了他/她需要的基本信息。

表3。ChatGPT 通过提供六年级阅读水平的分析来协助解释复杂的病理报告。

假设报告-最终诊断:外周血涂片和骨髓、右后髂嵴、抽吸涂片、凝块和核心活检:可能是浆细胞肿瘤,总骨髓细胞结构中浆细胞占 15-25%;进行性三系造血、巨核细胞生成障碍、原始细胞<5%;见评论。
评论:通过手动抽吸计数,骨髓抽吸物显示出保留的进行性三系造血、分散的非典型巨核细胞和增加的浆细胞,占完整有核细胞的约 20%。核心活检是正常细胞的(40-50%),但包含 CD138 免疫染色(〜15-25%)突出显示的非典型浆细胞的局灶性松散聚集体,没有通过原位杂交或免疫染色确定的轻链限制的明确证据。流式细胞术显示异常的浆细胞群,仅在一部分浆细胞中存在异常的 CD56 和 CD117 共表达。不可能通过染色来确定这些细胞是否表达 kappa、lambda 或两者的混合物。尽管总体形态学和免疫表型研究结果表明存在潜在的浆细胞肿瘤,该过程可能被反应性骨髓浆细胞增多症或两个克隆群体(双克隆丙种球蛋白病)部分掩盖。建议进行血清蛋白电泳。还建议进行临床相关性以及与待决细胞遗传学研究的相关性。
GPT4 的输出:
诊断:医生发现您很可能患有一种称为浆细胞肿瘤的疾病。这是一种骨髓中一种称为浆细胞的特定细胞过度生长的疾病。医生发现骨髓中大约 15-25% 的细胞是浆细胞。
他们还注意到骨髓中的一些其他变化,例如制造血液和血小板的细胞的不同生长模式。然而,他们没有发现大量非常年轻、正在发育的细胞(称为原始细胞),这种细胞有时可能表明某些类型的血癌。
医生使用特殊测试(如染色和流式细胞术)来了解有关骨髓中浆细胞的更多信息。一些浆细胞表现异常并表达某些标记物,但测试无法证实一些重要的细节。
因此,医生建议进行更多检查。他们建议进行一项测试来检查血液中的蛋白质,并进行另一项测试来检查细胞的基因组成。
患者教育材料:
更多地了解您体内发生的情况会很有帮助。骨髓位于骨骼内,就像血细胞的工厂。这包括红细胞(携带氧气)、白细胞(抵抗感染)和血小板(帮助凝血)。
在你的情况下,浆细胞可能过多。浆细胞是一种白细胞,可以产生抗体来帮助您的身体抵抗感染。但如果它们长得太多,就会引起问题。这种情况称为浆细胞肿瘤,最常见的类型称为多发性骨髓瘤。
医生可以使用许多不同的测试来了解骨髓中发生的情况。这些包括特殊染色、流式细胞术、基因测试和血液蛋白测试。每项测试都会提供更多信息,以便医生可以综合了解整个情况并找到帮助您的最佳方法。
重要的是要记住,这份报告只是弄清楚正在发生的事情的第一步。您的医生正在努力了解情况,以便为您提供最好的护理。如果您有疑问或疑虑,请随时与您的医疗团队联系。他们随时提供帮助!
当然,将人工智能工具融入临床实践需要深思熟虑,并且并非没有重大风险。需要进行广泛的微调和验证,以确保法学硕士通过 Mychart 等患者访问门户提供适当的患者摘要。至少在最初阶段,法学硕士得出的摘要在发布给患者之前需要由临床医生进行审查。因此,为 LLM 衍生的摘要选择最高价值的用例并将 LLM 工具插入工作流程中的正确位置对于确保临床医生审查是一个无缝过程至关重要。医生审查法学硕士生成的声明的最合适时间可能是临床医生在签署发布之前审查初始报告时,但机构特定的工作流程和治理需要确定进行此审查的适当位置。尽管医生审查可能会导致轻微的延误,LLM 生成的患者门户声明仍然可能对患者非常有帮助,并且是节省医生时间的绝佳方法。当我们开始测试解决方案并研究其影响时,将确定法学硕士在临床护理中的最高价值用例。

法学硕士可以提高医院实验室和病理工作流程的效率
也许与医学法学硕士相关的最令人兴奋的机会之一是工作流程的改进。与其他医生一样,病理学家通常会选择自己的专业领域,以便对患者的健康产生积极影响。令人沮丧的认识是,必须将一定的精力投入到与患者护理仅间接相关的活动中。最近的文献及其与临床医生倦怠的关系引起了很多关注。临床医生倦怠文献主要关注面向患者的临床医生、他们使用的工具(例如电子健康记录(EHR))和行政活动(例如获得事先授权)的影响。22 , 23与其他活动相比,面向患者的医生花在患者身上的时间已被直接检查并且令人担忧。24其他研究重点关注临床医生在下班后花在病例记录上的时间。25影响病理学家和检验医学临床医生健康的因素受到的关注较少。与临床医生倦怠文献的发现相关的逻辑假设是病例报告记录以及与 EHR 和实验室信息系统的交互等活动可能会对病理学家的健康产生负面影响。任何能让病理学家花更多时间制定诊断、减少图表审查或记录观察结果和结论的机会,都将提高效率,并且在我们看来,也能提高病理学家的福祉。

利用法学硕士的一个重要机会可能是简化尸检服务的工作流程。利用法学硕士提供丰富而复杂的数据的出色总结的能力,法学硕士可用于在进行尸检之前快速审查和总结冗长的患者图表。这些总结将增强病理学家应用的其他活动,以集中尸检检查,以便结果尽可能有用。然而,在尸检病理学家对法学硕士提供的临床病史摘要产生一定程度的信任之前,需要减少个人直接图表审查的工作量,广泛的验证和法学硕士的完善是必要的。临床试验。

法学硕士将文本抽象并重新格式化为任何所需模板的能力可以与粗略检查和组织学幻灯片审查期间的实时转录相结合。等公司已经在市场上推出类似的临床护理应用程序,但尚未开发用于临床护理病理学家。法学硕士还可用于跟踪病例的要素,从最初的图表审查到基本组织学、免疫组织化学,以及其他可能指出的辅助测试。例如,在与法学硕士合作时,当您通过听写或写作向其提供文本时,您可能还会针对您提供给它的内容提出具体的总结性问题,例如“我缺少此尸检模板的哪些元素?” 或者,“我订购了哪些污渍?” 通过这种方式,法学硕士申请将充当尸检病理学家的“合作伙伴”。

确保法学硕士在病理学领域的安全和道德使用
当法学硕士以令人信服的方式呈现非事实信息时,该过程通常被称为“幻觉”。人们普遍认为,随着法学硕士变得更加复杂,这个问题将会得到缓解。虽然 GPT-4 会犯错误,但它也能够在人类或其他法学硕士的帮助下发现错误。1然而,目前,在我们完善这些工具以改变我们的日常工作时,人类监督仍然至关重要。26

法学硕士带来的风险不仅限于幻觉现象,还包括许多与非生成人工智能相同的风险。由于 ChatGPT 是使用互联网进行训练的,因此互联网上存在的偏见可能会转化为其功能和输出。例如,文献中已经确定法学硕士可能会遭受与性别和种族相关的偏见。27此外,机器学习模式的偏差可能与数据缺失、样本量不足以及基础数据偏差有关,所有这些都会导致算法输出存在缺陷。28如果培训日期遥远,法学硕士中的偏见和错误就会被放大,从而导致过时的回答。ChatGPT 等工具目前不提供其输出的参考,尽管未来的版本可能会提供参考,这是法学硕士社区的一个活跃的研究领域。29

警惕法学硕士输出的偏差在科学研究和医疗保健领域同样重要。FDA 的监管环境正在不断发展,因为它和其他监管机构的目标是确保人工智能工具在临床医学中值得信赖。截至本文撰写时,FDA 已批准临床化学领域的6 种支持 AI/ML 的医疗设备,血液学领域的 15 种医疗设备,微生物学领域的 6 种医疗设备,以及解剖病理学领域的 4 种医疗设备。30随着生成人工智能进入病理学和检验医学等领域的临床实践,我们需要采取更全面的方法来确保我们开发出符合道德的、强大的工具。同样,当我们开发用于病理学和实验室医学的生成人工智能工具时,我们需要密切关注不断变化的监管环境,以确保我们合规。因此,我们认为对于病理学和检验医学领域的思想领袖来说,了解法学硕士、其在学术病理学中的潜在应用及其局限性非常重要。这将使该领域能够确定改进和部署这些人工智能模式的优先事项,并推进我们在临床实践、研究和教育方面的使命。

结论
法学硕士有望彻底改变许多行业的文本处理方式。病理学和检验医学是法学硕士申请可能会显着增强的领域。虽然已经发现了法学硕士在医学实践中的应用存在许多风险,但这些问题可以通过额外的法学硕士培训、训练有素的临床医生的监督以及强大的验证和质量监控来减轻。鉴于我们在诊断测试验证和质量监控方面的丰富经验,我们完全有能力成为这些新颖工具的早期采用者,并帮助制定安全使用生成式人工智能的标准。学术病理学家我们鼓励病理学部门和病理学专业协会立即采用这项技术,以指导其发展和安全且合乎道德的部署,以便我们可以充分发挥其潜力并改善我们作为学术病理学家的职能。

发布日期:2024-01-18