ITBear旗下自媒体矩阵:

智谱GLM-5“身份”揭晓:复用DeepSeek架构参数翻倍,市值飙升坐实国产AI领跑者

   时间:2026-02-11 13:33:39 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

资本市场近日因国产大模型领域的重大突破掀起波澜。智谱AI推出的新一代模型GLM-5不仅引发行业震动,更推动其股价在短期内暴涨200%,总市值突破1500亿港币,达到IPO时的三倍水平。这一成绩的取得,源于该模型在技术架构与性能上的双重突破。

全球模型服务平台OpenRouter上曾出现一款代号"Pony Alpha"的匿名模型,其代码生成能力一度被认为接近国际顶尖水平。经过技术社区的深入分析,该模型通过系统提示词暴露了GLM家族的身份特征,更有开发者通过验证GLM系列特有的逻辑处理模式——例如输入特定烹饪指令时产生的异常响应——最终确认其真实身份。这一发现过程展现了开源社区在模型识别领域的独特作用。

技术架构层面,GLM-5延续了DeepSeek-V3的稀疏注意力机制(DSA),通过参数规模翻倍实现性能跃升。模型总参数量达7450亿,是前代GLM-4.7的两倍,但通过256个专家模块的动态激活机制,每次推理仅需调用约440亿参数,稀疏度控制在5.9%以内。这种设计既保证了模型容量,又显著提升了计算效率。

在功能扩展方面,新模型支持长达202K token的上下文窗口,较前代提升近4倍。针对多媒体内容处理需求,研发团队强化了视频理解能力,弥补了纯文本架构的局限性。测试数据显示,GLM-5在多模态任务中的表现已达到行业领先水平,特别是在动态场景解析方面展现出独特优势。

企业部署层面,DSA架构的兼容性优势得到充分体现。该模型可无缝接入vLLM、SGLang等主流推理框架的优化方案,使企业用户无需重构技术栈即可完成模型部署。据测算,这种技术路线可使算力成本降低40%以上,显著降低了大模型的应用门槛。业内人士指出,这种工程化能力的突破,标志着国产模型在商业化落地方面已形成完整体系。

随着GLM-5的正式亮相,国产大模型在国际竞争中的地位进一步提升。该模型在保持文本处理优势的同时,通过多模态能力的补强,形成了更完整的技术矩阵。技术社区普遍认为,这种"架构复用+参数扩展"的演进策略,为行业提供了性价比更高的升级路径,或将引发新一轮的技术竞赛。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version