微软近期宣布了一项医疗领域的人工智能突破,开发出一款名为“微软人工智能诊断协调器”(MAI-DxO)的工具,据称在诊断复杂疾病方面的成功率远超人类医生,达到四倍之多。这一创新被视为加速医疗诊疗进程的重要一步。
该工具由微软新成立的人工智能健康部门研发,该部门由前DeepMind联合创始人穆斯塔法·苏莱曼领导,成员大多来自他曾参与创立的DeepMind研究院。苏莱曼目前担任微软人工智能的首席执行官,他表示,MAI-DxO是部门成立以来的首个重要研究成果。
苏莱曼在接受采访时透露,此次试验标志着向“医疗超级智能”迈进的重要一步,有望解决医疗系统长期存在的人员短缺和患者候诊时间过长等问题。MAI-DxO的核心是一个协调器,能够创建五个分工明确的智能体,组成虚拟专家组,通过相互协作和“辩论”,共同制定诊疗方案。
为了验证其性能,研究人员让MAI-DxO学习了《新英格兰医学杂志》上发表的304份复杂病例研究,这些病例详细记录了医生解决难题的过程。通过一种名为“辩论链”的新技术,人工智能推理模型能够逐步说明其解决问题的思路。测试结果显示,与OpenAI的o3推理模型配合使用时,MAI-DxO成功解决了85.5%的病例。
相比之下,在相同条件下进行测试的经验丰富的人类医生,成功率仅为约20%。值得注意的是,测试中医生不允许查阅教科书或向同事请教,否则他们的成功率可能会有所提升。尽管如此,微软的这一成果仍然令人瞩目。
据悉,这项技术有望很快被部署到微软的Copilot人工智能聊天机器人和必应搜索引擎中,这两个平台目前每天处理约5000万次健康咨询。苏莱曼表示,微软正朝着实现远超人类表现的AI模型迈进,这些模型将更快、更便宜,且准确率高出四倍。
在苏莱曼取得这项研究成果之前,DeepMind已在人工智能相关的医疗保健领域取得了显著成就。谷歌实验室负责人戴密斯·哈萨比斯去年因在人工智能揭示生命奥秘方面的贡献,与他人共同获得了诺贝尔化学奖。
微软与OpenAI的关系也备受瞩目。微软已向OpenAI投资近140亿美元,并拥有其技术的独家使用权和销售权。然而,双方在未来合作条款上存在分歧,目前正处于激烈的博弈中。尽管如此,苏莱曼表示,微软对于MAI-DxO使用的四种“世界级模型”持中立态度,并认为真正的差异化在于其聚合协调器。
前DeepMind健康部门负责人多米尼克·金去年末加入微软,他表示,MAI-DxO的表现超越了以往任何技术,并有机会成为医疗服务的新入口。在试验中,该程序还显著减少了正确诊断所需的检查项目,在某些情况下可节省数十万美元。
然而,金也强调,这项技术仍处于早期阶段,尚未经过同行评审,也未准备好在临床环境中使用。心脏病学家埃里克·托波尔对这项研究表示赞赏,认为它首次为生成式人工智能在医学领域提升准确性和节约成本的潜力提供了证据。尽管这项工作并非在真实的医疗实践环境中完成,但其开创性意义不容忽视。
麻省理工学院科学家戴维·桑塔格也对这项研究表示振奋。他认为,研究的重要性不仅在于它更贴近医生的实际操作方式,还在于它对底层方法论中的潜在问题进行了严谨的处理。不过,桑塔格也提醒说,对微软的研究成果需持审慎态度,因为参与研究的医生在诊断时不得借助任何工具,这可能无法真实反映临床实践。
托波尔和桑塔格都认为,在大规模推广前,下一步应是在临床试验中将微软系统与医生为真实患者治疗的结果进行对比,以获得对成本的严谨评估。这样才能更准确地评估该系统的实际应用潜力和成本效益。