ITBear旗下自媒体矩阵:

谷歌医疗AI再发力:MedGemma 1.5升级多模态,MedASR助力减轻医生文书负担

   时间:2026-01-14 18:16:24 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日在医疗人工智能领域迈出重要一步,正式推出新一代开源医疗大模型MedGemma 1.5及专为临床场景设计的语音识别模型MedASR。这一双模型组合不仅拓展了医疗AI的技术边界,更通过开源策略为全球医疗创新注入新动能。两款模型均基于脱敏临床数据训练,在确保隐私合规的前提下,向全球开发者与研究机构免费开放。

作为Gemma系列的医疗专项升级,MedGemma 1.5突破传统文本处理框架,首次实现多模态医疗数据融合。该模型在保留原有病历分析、文献解读能力的基础上,新增对X光、CT等医学影像的语义理解功能。通过整合影像描述性文本与视觉特征,模型可辅助完成初步筛查与诊断推理,例如识别肺部结节特征或分析骨折影像细节,使临床决策支持从单维度文本交互升级为全流程智能辅助。

同步发布的MedASR则聚焦解决医疗场景中的效率痛点。针对医生文书工作耗时长的行业难题,该模型通过深度优化医疗领域声学模型与语言模型,实现医患对话、手术记录等专业语音的高精度转写。测试数据显示,模型在复杂医疗术语识别准确率上达到98.7%,转写效率较传统方式提升4倍以上,生成的文本可直接导入电子病历系统,显著减轻临床文书负担。

开源策略成为此次发布的核心亮点。谷歌医疗AI团队表示,两个模型均采用MIT许可协议,允许商业机构免费使用与二次开发。此举与前期通过HIPAA认证的Gemini医疗助手形成战略协同,构建起从底层技术到合规应用的完整生态。医疗机构可基于开源框架快速部署远程诊疗系统,初创企业能低成本开发专科辅助诊断工具,学术团队则获得研究医疗AI模型可解释性的基础平台。

技术专家指出,多模态融合与开源生态的双重突破,标志着医疗AI进入成熟应用阶段。MedGemma 1.5的影像理解能力与MedASR的语音处理技术形成互补,覆盖诊疗全流程的关键节点。而开源模式通过降低技术门槛,将加速AI在基层医疗、公共卫生等资源薄弱领域的渗透,推动全球医疗体系向智能化、均等化方向演进。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version