百川智能近日推出新一代循证增强医疗大模型Baichuan-M2 Plus,同步升级旗下应用百小应并开放API接口。这款基于循证医学框架构建的模型,在医疗可信度、知识溯源能力等方面实现突破性进展,成为全球首个通过多国医师资格考试认证的医疗专用大模型。
与传统大模型"博学但不可靠"的特性不同,Baichuan-M2 Plus构建了六层证据金字塔体系。该系统从4000万篇医学期刊论文起步,整合系统评价、临床指南、专家经验、科普知识及真实世界数据,形成覆盖原始研究到实践反馈的完整证据链。这种分层架构使模型回答从"可能正确"升级为"有据可循",在核心医疗场景中达到资深临床专家的可信水平。
技术层面,模型采用PICO医学问题框架(人群、干预、对照、结局),将自然语言查询转化为结构化医学问题。当处理"老年OSA患者使用CPAP能否改善高血压"这类复杂问题时,系统会自动在高等级证据库中检索,优先匹配随机对照试验(RCT)和系统评价,同时评估研究质量、样本量等关键指标。这种检索方式较传统RAG技术精度提升3倍,有效解决医学语义理解不足和文献可靠性辨识困难两大难题。
多维度评测显示,该模型医疗幻觉率较通用大模型降低75%,在病史分析、诊断思路等核心场景中达到临床专家水准。在国际权威认证方面,M2 Plus以97分通过美国执业医师资格考试(USMLE),与GPT-5并列全球榜首;中国执业医师资格考试取得568分,超越所有公开测试的主流大模型;在日本、英国等国高级医师职称考试中准确率超85%,展现跨文化医疗场景的适应性。
目前,接入新模型的百小应应用已在各大应用商店完成更新,网页版(ying.ai)同步上线。通过标准化API接口,医院信息化部门、互联网医疗平台及医疗AI开发者可将循证推理能力嵌入服务场景,显著提升AI医疗解决方案的专业性。百川智能表示,此次升级标志着医疗大模型从"可用"向"敢用"的关键跨越,为严肃医疗场景的AI应用树立新标杆。