上海人工智能实验室近日宣布,全球首个基于“通专融合”架构的万亿参数科学多模态大模型——Intern(书生)-S1-Pro正式开源。这一突破性成果不仅刷新了科学智能领域的参数规模纪录,更以卓越性能跻身全球顶尖行列,标志着科学发现方式正从“工具辅助”向“智能驱动”全面升级。
该模型采用创新的混合专家架构(MoE),内部集成512个虚拟“学科专家”,面对具体问题时仅需激活8个最相关专家进行协同分析。这种“精准点将”机制使万亿级参数模型仅需调用2%的算力(约220亿参数),即可完成复杂数理逻辑推理。实验室负责人特别指出,模型通过引入“傅里叶位置编码”技术重构时序编码器,实现了对科学数据密度的动态适应——既能捕捉天文学中极其微弱的信号,也能处理生命科学领域百万级实验数据,如同拥有同时观察“沙粒细节”与“沙丘轮廓”的双重视觉。
在基础学科能力验证中,该模型展现出跨学科综合优势。国际数学奥林匹克(IMO-Answer-Bench)和国际物理奥林匹克(IPhO2025)测试显示,其解题能力达到竞赛级水准。更引人注目的是,在SciReasoner等跨学科评测中,模型表现优于多数闭源商业模型,成功构建起覆盖化学、材料、生命、地球、物理五大领域的100余个专业任务矩阵。从解析分子结构到预测理化性质,从逻辑推理到捕捉数据因果关系,模型已具备支撑前沿科研的完整能力链。
技术自主性是该项目的另一大亮点。研发团队通过“路由稠密估计”等策略实现计算芯片负载均衡,结合算法与系统协同创新,突破了超大规模模型训练的效率瓶颈。在硬件层面,模型与昇腾计算生态深度适配,从底层算子优化到上层训练框架形成完整技术栈。近期与沐曦芯片的联合研发,更进一步夯实了国产算力基础,为构建开放共享的科学智能基础设施提供关键支撑。
目前,包含语言、多模态、强推理模型的书生系列开源体系已吸引全球数十万开发者参与。实验室宣布将持续推动全链条开源与免费商用,通过降低科研门槛促进全球学术与产业协作,共同塑造开放高效的科学人工智能新生态。











