人工智能领域迎来重要进展,智谱公司正式发布并开源其最新模型GLM-5。该模型在国际权威评测平台Artificial Analysis的榜单中表现亮眼,位列全球第四,同时在开源模型中排名第一,标志着我国在智能体工程领域取得突破性成果。
据技术团队介绍,GLM-5实现了从代码生成到系统化工程思维的跨越式发展。相较于传统模型专注于代码片段生成,新模型构建了完整的Agentic Engineering框架,能够深度理解复杂工程逻辑,在多步骤任务规划、工具链协同等场景中展现显著优势。这种进化使得模型在处理真实开发需求时更具实用价值。
在多项基准测试中,GLM-5展现出卓越性能。编程能力测试方面,该模型在SWE-bench-Verified和Terminal Bench 2.0分别取得77.8和56.2的开源模型最高分,超越Gemini 3 Pro等国际主流模型。在涉及联网检索、工具调用等综合能力的BrowseComp、MCP-Atlas测试中,同样占据开源模型首位。复杂场景测试中,τ²-Bench和Vending Bench 2的评估结果也验证了其领先地位。
国产化适配成为该模型的重要特色。研发团队与华为昇腾、摩尔线程、寒武纪等七家国内算力供应商展开深度合作,完成从芯片架构到推理框架的全面优化。这种适配能力确保模型可在不同技术路线的国产硬件上高效运行,为金融、制造、能源等关键领域的自主可控应用提供技术支撑。
技术文档显示,GLM-5采用混合架构设计,在保持参数规模可控的同时,通过动态注意力机制提升长文本处理能力。其训练数据覆盖多语言编程规范、工程文档和实时网络信息,使得模型既能生成符合编码规范的代码,又能理解业务场景中的非结构化需求。这种设计理念有效解决了传统模型"重生成轻理解"的缺陷。
开源社区对GLM-5的发布反应热烈。开发者指出,该模型提供的工程化接口和预训练模块显著降低了智能体开发门槛。特别是在需要多工具协同的复杂场景中,模型自带的规划执行框架可减少60%以上的代码量。目前已有多个开源项目基于GLM-5构建自动化运维、智能客服等应用原型。












