ITBear旗下自媒体矩阵:

谷歌发布MedGemma 1.5与MedASR,升级医疗影像与语音识别能力

   时间:2026-01-14 20:49:48 来源:鞭牛士编辑:快讯 IP:北京 发表评论无障碍通道
 

AIPress.com.cn报道

1月14日消息,谷歌宣布推出升级版医疗多模态AI模型MedGemma 1.5,以及全新的医疗语音识别模型MedASR,为开发者提供开放、可扩展的AI工具,用于医疗影像解读、电子病历处理和语音病历转写。

MedGemma 1.5在原有MedGemma 1的基础上,提升了文本、医疗记录和二维影像分析能力,并新增对高维医疗影像的支持,包括CT、MRI和全片病理图像。MedGemma 1.5优化了胸部X光系列图像分析、解剖结构定位和医疗实验室报告数据提取等功能,在内部基准测试中表现出明显性能提升。

配套发布的MedASR模型则专为医疗语音转文本场景设计,可将医疗口述内容准确转换为文字,同时可与MedGemma 1.5结合,用于高级医疗推理和应用开发。与通用ASR模型相比,MedASR在胸部X光病历转写任务中的错误率降低约58%,在多专业语音转写任务中的错误率降低约82%。

MedGemma 1.5及MedASR均以开放方式提供给研究和商业用途,开发者可通过Hugging Face或谷歌云Vertex AI进行下载、训练及应用开发。谷歌还启动了MedGemma Impact Challenge黑客马拉松,提供10万美元奖金,鼓励开发者探索医疗AI创新应用。

谷歌提示用户,这些模型可作为开发者构建医疗AI应用的起点,但需要经过适当验证、调整或开发者自定义修改后方可用于实际医疗场景。模型输出不应直接用于临床诊断或病患管理。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version