百川智能近期宣布推出其医疗领域的增强大模型Baichuan-M2,该模型在HealthBench基准测试中取得了60.1的高分。值得注意的是,Baichuan-M2以32B的参数规模,超越了OpenAI的gpt-oss120b模型(得分57.6),以及其他多个世界领先的开源大模型,如Qwen3-235B、Deepseek R1和Kimi K2。
回溯至今年年初,百川智能率先在行业内发布了“AI患者模拟器”,通过真实数据创建了涵盖不同年龄、性别和症状的上万个虚拟患者,并模拟了数百万次的诊疗过程。基于这一创新范式,百川智能开源了Baichuan-M1,这是业内首个医疗增强模型。
经过七个月的技术迭代,百川智能升级了患者模拟器,并引入了端到端的强化学习机制。这一改进使得Baichuan-M2在HealthBench等评测标准上取得了更为显著的突破。
为了满足医疗领域用户对于隐私保护的严格要求,百川智能对Baichuan-M2进行了深度轻量化处理。量化后的模型精度几乎不受影响,能够在RTX4090显卡上单卡部署。与DeepSeek-R1 H20的双节点部署方式相比,这一方案的成本降低了57倍。Baichuan-M2针对国产主流芯片进行了开发和适配,使得大多数医疗机构能够利用现有硬件条件实现快速部署。
针对急诊、门诊等需要快速交互的场景,Baichuan-M2的MTP版本基于Eagle-3架构进行了优化,在单用户场景下实现了74.9%的token处理速度提升。