北京大学EvoPhys团队近日在人工智能领域取得突破性进展,其研发的5D世界模型EvoPhys-World在斯坦福大学WorldScore公开评测中登顶“世界生成”赛道。该模型以人类为中心,突破传统AI在物理世界交互的局限,实现了从“可观看”到“可操控”的跨越式发展。值得注意的是,这项前沿研究全程基于国产摩尔线程MTT S5000全功能GPU完成训练,标志着我国在自主算力支撑高水平AI研究方面迈出关键一步。
传统AI模型在物理世界的应用长期面临“浅交互”瓶颈,而EvoPhys-World通过创新架构设计,将第一视角人类观察与手部动作作为核心交互接口。该模型从海量无标注人手视角数据中自主学习,构建了包含“万物孪生引擎”与“世界操控策略”的双重体系,形成从环境生成到动态操控的完整闭环。这种设计使AI不仅能生成逼真场景,更能理解物理规则并实现复杂操作,例如精准抓握、书写轨迹预测等深度交互行为。
支撑这项突破的算力底座来自摩尔线程旗舰级产品MTT S5000。这款专为大模型训练设计的全功能GPU,通过计算单元协同优化与原生FP8多精度训练技术,为长时序交互数据建模提供稳定算力。配套的MUSA软件栈展现出强大适应性,其分布式训练框架、高效卡间通信机制及软硬件协同优化能力,成功支撑起扩散式生成与多模态时空建模的复杂需求。在长达4万小时的训练过程中,系统保持了卓越的稳定性与扩展性。
实测数据显示,MTT S5000在集群扩展方面表现优异。从单机8卡扩展至20节点160卡时,训练吞吐量维持近线性增长,弱扩展效率达90%,这一指标与国际主流产品处于同一水平。在相同实验条件下,国产算力平台在训练吞吐量、多机扩展效率等核心指标上,与国际竞品基本持平。更关键的是,基于MTT S5000训练的模型在生成质量上达到国际先进水平,其输出的第一视角操作视频在物体抓握、书写笔迹、物理反馈等细节表现上,与使用国际主流产品训练的模型难分伯仲。
这项成果的背后,是国产软硬件生态的深度协同。摩尔线程与北京大学构建了从模型研发到算力部署的全链路闭环:MUSA软件栈提供从算子开发到分布式训练的全栈支持,MTT S5000集群保障大规模并行计算的稳定性,最终通过开源生态赋能开发者社区。这种协作模式不仅解决了科研团队的算力瓶颈,更为国内具身智能领域提供了自主可控的技术路径,显著提升了从实验室创新到产业落地的转化效率。
作为该项目的算力支持方,摩尔线程通过“灯塔计划”为前沿科研提供专项扶持。该计划面向全球科研机构开放优惠算力资源及工程支持,重点助力具有原创价值的AI项目突破资源限制。EvoPhys-World的成功验证了国产芯片在支撑高水平AI研究方面的可行性,为国内科研团队使用自主算力平台树立了标杆案例。随着MUSA软件栈生态的不断完善,国产GPU正在从基础训练支撑向全流程赋能演进,为AI技术创新提供更坚实的底层保障。











