ITBear旗下自媒体矩阵:

智谱GLM-4.7强势登场:代码能力超群,国产开源模型迈向新高度

   时间:2025-12-24 00:15:40 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

国产开源大模型GLM-4.7近日正式上线并开放源代码,在多项国际权威评测中展现出强劲实力,成为全球开源模型领域备受瞩目的新力量。该模型在智能体与推理能力评测中表现突出,与GPT-5.1、Claude Sonnet 4.5等国际顶尖模型同台竞技时,不仅全面对齐部分指标,更在多个维度实现超越,标志着国产大模型在技术突破上迈出关键一步。

在代码能力方面,GLM-4.7的突破尤为显著。根据专业编码评测平台Code Arena的全球开发者盲测数据,该模型在Web开发方向排名第六,成为当前开源模型中表现最优的国产方案,甚至超越了GPT-5.2与Claude Sonnet 4.5。具体到细分基准测试,其在SWE-bench-Verified中取得73.8%的成绩,LiveCodeBench-V6更达到84.9%,整体水平与Claude Sonnet 4.5持平,稳居开源领域第一梯队。这些数据背后,是模型对复杂代码逻辑的深度理解能力,以及在真实开发场景中的高效生成能力。

推理能力的提升是GLM-4.7的另一大亮点。在被誉为“人类最后考试”的HLE评测中,模型在工具辅助条件下取得42.8%的成绩,较前代版本提升超过12个百分点,甚至超越了GPT-5.1 High版本。工具调用能力同样表现亮眼,在τ²-Bench中斩获87.4%的高分,BrowseComp在开启上下文管理后提升至67.5%,展现出在多轮网页任务和交互式工具调用场景中的稳定性。这些突破得益于模型内部思考机制的革新——通过引入保留式思考与轮级思考控制,模型能在多轮任务中自动保留已有推理结果,避免重复推导,同时允许开发者根据任务复杂度动态调整推理过程,在效率与稳定性间取得平衡。

技术升级不仅体现在分数上,更在实际应用中得到验证。智谱团队通过100个真实编程任务测试发现,GLM-4.7在前端开发、后端逻辑和指令遵循三大核心方向均有显著提升。前端任务胜率从4.6版本的52.1%跃升至64.6%,指令遵循场景胜率达58.3%,后端复杂任务胜率稳定在46.7%。更值得关注的是,模型在Z.ai平台上线了全栈技能环境,通过全新Skills模块实现了ASR语音识别、TTS语音合成、GLM-4.6V视觉模型等多模态技能的统一调度。这种“技能联动”能力使模型在处理复杂任务时,既能规划路径又能执行动作,工具间的调度逻辑形成闭环,显著提升了开发效率。

实际测试场景进一步印证了模型的实用性。在3D控制任务中,GLM-4.7生成的HTML代码构建出由5000多个粒子组成的立体圣诞树,支持手势识别与UI反馈:用户张开手掌时,圣诞树会炸开为悬浮照片墙,握拳则重新收缩为树形,整个过程伴随流畅的动画效果与性能优化机制。在UI生成测试中,模型根据“1:1复刻iOS系统”的提示,生成了包含可点击图标、可交互功能页的完整主界面,虽细节与最新iOS存在差距,但整体体验流畅,图标风格与颜色搭配符合基础审美。更令人惊喜的是,在双人格斗游戏任务中,模型不仅还原了Switch手柄的配色布局,还构建了包含角色移动、攻击、跳跃等基础操作的完整对战框架,甚至内置了节奏感强的格斗BGM,展现出在前端关键模块的可用性与稳定性。

从技术评测到真实场景,GLM-4.7的突破并非孤立事件。其开源代码在全球社区的下载量已突破6000万次,付费API使用量长期位居OpenRouter全球前十,这些数据表明,模型正从实验室走向开发者的实际工具列表。当前,国产大模型企业正经历从科研模型、开源生态向“真实使用”与“市场验证”的关键转型,GLM-4.7的上线恰逢智谱冲刺港交所上市的节点,成为这一转型进程的生动注脚。随着技术迭代与生态完善,国产开源模型正从“对标国际”向“领跑实用”迈进,GLM-4.7的实践为这一进程提供了重要参考。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version