智谱近日宣布,其新一代开源旗舰模型GLM-5.2正式上线并开源。在Code Arena这一全球百万用户参与盲测的前端开发评估系统中,GLM-5.2凭借卓越表现荣登全球可用模型榜首。与此同时,摩尔线程宣布其AI训推一体全功能GPU智算卡MTT S5000已完成对GLM-5.2的Day-0极速适配,标志着双方在AI硬件与模型协同优化领域取得重要突破。
据技术团队介绍,此次适配基于摩尔线程自主研发的SGLang-MUSA推理引擎与TileLang-MUSA算子编程语言,通过模型结构重构、关键算子深度优化及全栈部署验证,实现了GLM-5.2在MTT S5000上的高效高精度推理。该解决方案特别针对超长上下文处理场景进行专项优化,充分释放了硬件性能潜力。
在超长上下文支持方面,MTT S5000展现出显著优势。其硬件原生FP8加速能力配合单卡1000 TFLOPS稠密算力,结合80GB超大显存与1.6TB/s带宽,可稳定处理百万token级上下文。通过MUSA工具链的深度优化,模型在长序列场景下的首Token生成时间(TTFT)显著降低,特别适用于AI编程辅助、检索增强生成(RAG)及长文档分析等需要实时交互的应用场景。测试数据显示,该方案在长输入Prefill阶段的吞吐量较同类产品提升40%以上。
针对GLM-5.2强化的编程与智能体能力,摩尔线程构建了完整的优化体系。通过原生算子定制、TileLang-MUSA编程模型优化及SGLang-MUSA推理框架协同,在保持模型精度的前提下,将推理吞吐提升35%,同时将响应延迟压缩至行业领先水平。这种软硬件协同优化模式,为金融、医疗、科研等领域需要复杂工作流支持的智能体应用提供了高效推理基础设施。
目前,GLM-5.2已通过多平台开源发布,开发者可通过以下渠道获取完整模型资源:GitHub(https://github.com/zai-org/GLM-5)、Hugging Face(https://huggingface.co/zai-org/GLM-5.2)及ModelScope(https://modelscope.cn/models/ZhipuAI/GLM-5.2)。此次开源包含模型权重、推理代码及优化工具链,支持商业应用与二次开发。









