智谱近日正式发布并开源新一代大模型 GLM-5,在编程与智能体(Agent)能力领域实现重大突破。该模型在全球权威评测榜单 Artificial Analysis 中位列开源模型首位、全球第四,其真实场景编程体验已接近行业标杆 Claude Opus 4.5,尤其在复杂系统开发与长程任务执行方面展现显著优势。

技术架构层面,GLM-5 通过三项核心创新构建能力基座:参数规模从 3550 亿(激活 320 亿)扩展至 7440 亿(激活 400 亿),预训练数据量增长 24% 至 28.5TB;全新研发的 "Slime" 异步强化学习框架支持超大规模模型训练,配合异步智能体算法实现长程交互学习;首次集成 DeepSeek 稀疏注意力机制,在保持长文本处理能力的同时降低 40% 部署成本。这些升级使其在 SWE-bench-Verified 和 Terminal Bench 2.0 基准测试中分别取得 77.8 和 56.2 的开源模型最高分,超越 Gemini 3 Pro 等竞品。
在智能体能力维度,GLM-5 创下多项开源纪录:在 BrowseComp(联网信息理解)、MCP-Atlas(多工具任务执行)和 τ²-Bench(复杂场景规划)评测中均获第一;模拟自动售货机经营的 Vending Bench 2 测试中,其账户余额达 4432 美元,经营策略与 Claude Opus 4.5 持平。这些能力使模型具备真正的 Agentic Ready 特性,可自主完成目标保持、资源管理和多步骤依赖处理等复杂任务。

实际应用场景中,GLM-5 已展现强大生产力价值。开发者利用该模型开发出横版解谜游戏、论文版 "抖音" 等可上线应用,相关案例已收录至官方案例库;通用助手 OpenClaw 接入 GLM-5 后,可实现网站搜索、资讯整理、代码编写等 7×24 小时自动化服务;全新推出的 Z Code 编程平台支持需求拆解、多智能体协作、调试部署全流程,用户甚至可通过手机远程指挥桌面端完成工程任务。在办公领域,该模型可直接将文本素材转换为 docx、pdf、xlsx 等格式文件,支持生成产品需求文档、教案、财务报表等复杂文档。
值得关注的是,GLM-5 的线上服务得到国产芯片集群的强力支撑。目前该模型已完成与华为昇腾、摩尔线程、寒武纪等 7 家国产算力平台的深度适配,通过底层算子优化实现高吞吐、低延迟运行。为应对 GLM Coding Plan 的全球需求爆发,官方同步升级服务套餐:Max 用户即刻可用,Pro 用户将在 5 日内获得支持,并推出 AutoGLM-OpenClaw 飞书集成、Excel 原生插件等专属权益。
该模型现已在 Hugging Face 和 ModelScope 平台开源,采用 MIT License 协议。此次发布标志着大模型技术从 "代码生成"向 "工程交付"的关键跃迁,其开源策略将加速 Agentic Engineering 生态的构建与发展。











