ITBear旗下自媒体矩阵:

智谱 GLM-5 意外“泄露”?复用 DeepSeek 架构性能炸裂,市值狂飙 200% 坐稳国产 AI 顶流

   时间:2026-02-11 10:49:03 来源:CHINAZ编辑:快讯 IP:北京 发表评论无障碍通道
 

国产大模型赛道在2026年春节期间爆点频出。继 DeepSeek 成为现象级产品后,智谱 AI 的新一代大模型 GLM-5 也揭开了神秘面纱。 这一动作直接引爆资本市场,智谱股价近期大涨 200%,总市值冲至1500亿港币,达 IPO 时的3倍之多。

马甲曝光:神秘模型“Pony Alpha”即为 GLM-5

前几日,全球模型服务平台 OpenRouter 上出现了一款代号为 “Pony Alpha” 的匿名模型,因其代码编写能力直逼 Claude Opus 而引发全球热议。

身份确认:该模型的系统提示词自曝为 GLM 身份。

“指纹”识别:网友通过验证 GLM 家族特有的逻辑 Bug(如输入“锅内倒入植物油烧热”得到特定异常答案),几乎可以断定其归属。

核心黑科技:复用 DeepSeek 架构,参数翻倍

GLM-5在技术路线上选择了与DeepSeek-V3相同的稀疏注意力架构 (DSA),这被视为一种极具性价比的演进策略。

规模跨越:总参数量高达 745B,是前代 GLM-4.7的2倍。

计算效率:拥有256个专家,每次激活8个(约44B 激活参数),稀疏度仅为5.9%。

长文本与多模态:支持最高 202K token 的上下文窗口。 同时,针对2026年的市场需求,GLM-5强化了视频理解等多模态能力,补齐了此前DeepSeek纯文本架构的短板。

行业影响:部署门槛进一步降低

由于采用了 DSA 架构,GLM-5可以直接复用 vLLM、SGLang 等主流推理框架的现有优化方案。 这意味着企业级用户在部署该模型时,技术门槛和算力成本将大幅降低。

在国产 AI “偷家”海外大模型的浪潮中,智谱凭借 GLM-5的强悍表现,再次证明了其在模型性能与工程实现上的顶尖实力。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version