国产大模型赛道在2026年春节期间爆点频出。继 DeepSeek 成为现象级产品后,智谱 AI 的新一代大模型 GLM-5 也揭开了神秘面纱。 这一动作直接引爆资本市场,智谱股价近期大涨 200%,总市值冲至1500亿港币,达 IPO 时的3倍之多。
马甲曝光:神秘模型“Pony Alpha”即为 GLM-5
前几日,全球模型服务平台 OpenRouter 上出现了一款代号为 “Pony Alpha” 的匿名模型,因其代码编写能力直逼 Claude Opus 而引发全球热议。
身份确认:该模型的系统提示词自曝为 GLM 身份。
“指纹”识别:网友通过验证 GLM 家族特有的逻辑 Bug(如输入“锅内倒入植物油烧热”得到特定异常答案),几乎可以断定其归属。
核心黑科技:复用 DeepSeek 架构,参数翻倍
GLM-5在技术路线上选择了与DeepSeek-V3相同的稀疏注意力架构 (DSA),这被视为一种极具性价比的演进策略。
规模跨越:总参数量高达 745B,是前代 GLM-4.7的2倍。
计算效率:拥有256个专家,每次激活8个(约44B 激活参数),稀疏度仅为5.9%。
长文本与多模态:支持最高 202K token 的上下文窗口。 同时,针对2026年的市场需求,GLM-5强化了视频理解等多模态能力,补齐了此前DeepSeek纯文本架构的短板。
行业影响:部署门槛进一步降低
由于采用了 DSA 架构,GLM-5可以直接复用 vLLM、SGLang 等主流推理框架的现有优化方案。 这意味着企业级用户在部署该模型时,技术门槛和算力成本将大幅降低。
在国产 AI “偷家”海外大模型的浪潮中,智谱凭借 GLM-5的强悍表现,再次证明了其在模型性能与工程实现上的顶尖实力。











