2026-06-22

《自然》杂志近日刊登了关于自主医疗AI智能体能力的重要研究成果,其中两个独立的AI模型在患者的全程管理中展现了关键作用,涵盖了从诊断到治疗决策的各个环节。这两个系统分别是德国海德堡大学医院开发的MIRA以及谷歌公司开发的AMIE。目前,它们的表现已达到或超越了人类内科医生的水平,预示着对话式AI工具在疾病管理领域巨大的应用潜力。

德国海德堡大学医院提出的MIRA,是一个能够接入独立电子病历系统以获取患者数据的AI模型。该模型在一项针对500多例急诊科临床病例的真实世界数据评估中得到了检验。评估显示,MIRA在与患者AI智能体进行互动并收集信息后,其生成的回应能够与临床记录中的病史信息相吻合。MIRA能够从超过85000种选项中进行选择,以规划诊断性检测、解读检测结果以及制定治疗计划,包括药物处方、手术安排和入院流程。其平均诊断准确率为87.8%,相较之下,由六位跨学科医生组成的专家团队的准确率为78.1%。研究团队在结论中强调,未来需要进一步的研究来提升准确性,并验证其在真实世界研究中的泛化能力。

谷歌团队则发布了AMIE,这是一个经过优化以支持临床管理和对话的、基于大型语言模型的系统。该模型能够进行连续推理,处理多次就诊的数据,从而跟踪疾病的进展和治疗的反应。AMIE利用谷歌的Gemini技术分析从患者那里收集的信息,并确保其输出结果与最新且相关的临床实践指南以及药物目录(包含经批准且临床首选的药物列表)保持一致。

在一项虚拟临床检查研究中,AMIE与21名全科医生进行了比较,研究覆盖了100多个就诊场景,涉及五个医学专科领域,这些场景的设计旨在反映英国国家卫生与临床优化研究所的指导方针和《英国医学杂志》的最佳实践指南。在推理和管理能力方面,AMIE的表现与全科医生相当;而在治疗和检查的精准度、对临床指南的遵循程度以及基于指南制定管理方案的合理性方面,AMIE均超越了医生。在最新推出的药物推理基准测试中,AMIE在处理复杂病例时也表现优于医生。研究团队指出,AMIE的出现标志着利用对话式AI工具辅助医生进行疾病管理迈出了重要一步。

大型语言模型在临床应用方面已展现出令人振奋的进展,但此前它们往往专注于特定任务。然而,患者的临床管理需要一个多维度的综合方法,包括深入了解病史、进行恰当的检查、准确诊断、规划治疗方案、确定药物剂量、安排手术流程,以及在多次就诊中监测治疗效果。如果AI智能体能够胜任这些任务并实现有效的管理,它们将能成为人类医生的得力助手,承担起日常繁琐的工作,甚至可能有助于缓解全球许多地区内科医生短缺的难题。