摩尔线程近日宣布,其旗舰级AI训推一体全功能GPU MTT S5000已成功完成对智谱新一代大模型GLM-5的全流程适配与验证。这一成果基于SGLang推理框架实现,标志着国产GPU在高性能AI计算领域取得重要突破。
MTT S5000作为专为大模型训练与推理设计的智算卡,采用第四代MUSA架构"平湖",单卡AI算力最高可达1000 TFLOPS,配备80GB显存及1.6TB/s显存带宽。该设备完整支持从FP8到FP64的全精度计算,卡间互联带宽达784GB/s,为GLM-5的部署提供了坚实的硬件基础。
通过MUSA架构的广泛算子覆盖与生态兼容能力,摩尔线程团队成功打通了模型推理全链路。特别值得注意的是,MTT S5000的原生FP8加速能力得到深度释放,在保持模型精度的前提下,显存占用显著降低,为GLM-5的高性能推理提供了关键技术支撑。
作为GLM系列的最新成果,GLM-5定位为顶尖Coding模型,其整体性能较前代提升20%。该模型的核心优势在于Agentic Engineering能力,不仅具备深厚的代码生成功底,更能处理复杂系统工程和长程Agent任务,实现从需求分析到应用部署的端到端开发流程。
此次适配验证表明,MTT S5000可充分满足大模型推理的严苛要求。其硬件架构与GLM-5的软件特性形成完美配合,为金融、科研、智能制造等领域的高性能AI应用提供了新的解决方案。随着国产GPU生态的持续完善,此类技术突破将推动AI计算向更高效、更经济的方向发展。









