滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

智谱GLM-4.7强势登场：代码能力超群，国产开源模型迈向新高度

时间：2025-12-24 00:15:40 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

国产开源大模型GLM-4.7近日正式上线并开放源代码，在多项国际权威评测中展现出强劲实力，成为全球开源模型领域备受瞩目的新力量。该模型在智能体与推理能力评测中表现突出，与GPT-5.1、Claude Sonnet 4.5等国际顶尖模型同台竞技时，不仅全面对齐部分指标，更在多个维度实现超越，标志着国产大模型在技术突破上迈出关键一步。

在代码能力方面，GLM-4.7的突破尤为显著。根据专业编码评测平台Code Arena的全球开发者盲测数据，该模型在Web开发方向排名第六，成为当前开源模型中表现最优的国产方案，甚至超越了GPT-5.2与Claude Sonnet 4.5。具体到细分基准测试，其在SWE-bench-Verified中取得73.8%的成绩，LiveCodeBench-V6更达到84.9%，整体水平与Claude Sonnet 4.5持平，稳居开源领域第一梯队。这些数据背后，是模型对复杂代码逻辑的深度理解能力，以及在真实开发场景中的高效生成能力。

推理能力的提升是GLM-4.7的另一大亮点。在被誉为“人类最后考试”的HLE评测中，模型在工具辅助条件下取得42.8%的成绩，较前代版本提升超过12个百分点，甚至超越了GPT-5.1 High版本。工具调用能力同样表现亮眼，在τ²-Bench中斩获87.4%的高分，BrowseComp在开启上下文管理后提升至67.5%，展现出在多轮网页任务和交互式工具调用场景中的稳定性。这些突破得益于模型内部思考机制的革新——通过引入保留式思考与轮级思考控制，模型能在多轮任务中自动保留已有推理结果，避免重复推导，同时允许开发者根据任务复杂度动态调整推理过程，在效率与稳定性间取得平衡。

技术升级不仅体现在分数上，更在实际应用中得到验证。智谱团队通过100个真实编程任务测试发现，GLM-4.7在前端开发、后端逻辑和指令遵循三大核心方向均有显著提升。前端任务胜率从4.6版本的52.1%跃升至64.6%，指令遵循场景胜率达58.3%，后端复杂任务胜率稳定在46.7%。更值得关注的是，模型在Z.ai平台上线了全栈技能环境，通过全新Skills模块实现了ASR语音识别、TTS语音合成、GLM-4.6V视觉模型等多模态技能的统一调度。这种“技能联动”能力使模型在处理复杂任务时，既能规划路径又能执行动作，工具间的调度逻辑形成闭环，显著提升了开发效率。

实际测试场景进一步印证了模型的实用性。在3D控制任务中，GLM-4.7生成的HTML代码构建出由5000多个粒子组成的立体圣诞树，支持手势识别与UI反馈：用户张开手掌时，圣诞树会炸开为悬浮照片墙，握拳则重新收缩为树形，整个过程伴随流畅的动画效果与性能优化机制。在UI生成测试中，模型根据“1:1复刻iOS系统”的提示，生成了包含可点击图标、可交互功能页的完整主界面，虽细节与最新iOS存在差距，但整体体验流畅，图标风格与颜色搭配符合基础审美。更令人惊喜的是，在双人格斗游戏任务中，模型不仅还原了Switch手柄的配色布局，还构建了包含角色移动、攻击、跳跃等基础操作的完整对战框架，甚至内置了节奏感强的格斗BGM，展现出在前端关键模块的可用性与稳定性。

从技术评测到真实场景，GLM-4.7的突破并非孤立事件。其开源代码在全球社区的下载量已突破6000万次，付费API使用量长期位居OpenRouter全球前十，这些数据表明，模型正从实验室走向开发者的实际工具列表。当前，国产大模型企业正经历从科研模型、开源生态向“真实使用”与“市场验证”的关键转型，GLM-4.7的上线恰逢智谱冲刺港交所上市的节点，成为这一转型进程的生动注脚。随着技术迭代与生态完善，国产开源模型正从“对标国际”向“领跑实用”迈进，GLM-4.7的实践为这一进程提供了重要参考。

更多>同类资讯

华为杨扬：借AI焕新产品服务携手各方推动Token经营价值提升

个人与家庭产品焕新：以智能业务与可保障体验网络，促进主营业务增长在个人场景，传统通话上网业务升级为个人通话助理与随身助理，依托运营商多入口优势，提供无处不在的贴身智能服务。杨扬表示，一方面以AI焕新产品服…

06-29

DeepSeek融资后首推开源新成果！DSpark框架让模型生成速度飙升60%-85%

根据Hugging Face上的模型卡，DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark并非新模型，而是在原有版本的基础上，增加了一个推测解码模块，用以加快推理…

06-29

机电产品出口连续15个月创新高，人工智能与传统转型成增长双引擎

06-29

AI技术助力解锁千年古卷之谜：机器学习让碳化近2000年文字重现人间

06-29

古尔曼爆料：苹果Mac Studio更新计划曝光 M5 Ultra今年登场 M7 Ultra2028年见

06-29

豆包大模型2.1跨越生产级质变点，AI赋能产业开启效率革命新篇章

豆包大模型2.1不仅拥有最聪明的“大脑”，还长出了智能体的“手臂”，用户最大的感触就是——AI替我干活终于可靠了。 AI蓝媒汇体验了豆包大模型2.1的Agent能力，向其提出要求：“帮我制作一份《桃花源记》…

06-29

翁荔最新长文深度剖析：AI行业奉为圭臬的缩放定律，应用需谨慎

从 Kaplan 与 Chinchilla 的分歧，到数据受限条件下的新模型，再到 Besiroglu 对拟合过程的重新复现，她不断强调一个事实：缩放定律的预测能力，很大程度上依赖于模型参数如何定义、损失函数…

06-29

豆包大模型2.1跨越生产级质变点，AI赋能产业开启高效增长新篇章

豆包大模型2.1不仅拥有最聪明的“大脑”，还长出了智能体的“手臂”，用户最大的感触就是——AI替我干活终于可靠了。 AI蓝媒汇体验了豆包大模型2.1的Agent能力，向其提出要求：“帮我制作一份《桃花源记》…

06-29

AI大模型告别野蛮生长：通用红利消退，垂直深耕与精细运营成新趋势

训练千亿参数基座模型需要海量算力、优质标注数据与持续资金投入，单轮完整训练成本动辄数亿，中小科技企业很难长期承担资金消耗。未来 AI 赛道的核心机会集中在三层：一是面向实体产业的垂直模型定制服务；二是轻量化边…

06-29

华为携手中国电信及行业伙伴，共筑智能体互联网新生态，推动AI体验升级

在近日由华为联合中国电信主办的“升级智能化网络，打造可保障连接，共筑Token优质体验”高峰论坛上，中国基金报记者获悉当前AI产业正式迈入规模化落地阶段，交互体验成为各类智能服务的核心竞争力。华为ICT M…

06-29

上海移动5G-A超级上行网络：以丝滑体验为笔，绘就AI时代商业新蓝图

过去，主播大多在室内固定场景直播；如今，越来越多主播走进景区、展馆、演唱会、体育赛事现场，希望将第一视角的内容实时分享给观众。例如，前文提到的高清直播、AI看展等体验场景，背后都离不开超级上行体验保障产品的…

06-29

华为杨扬：借AI之力焕新通信服务，携手伙伴共拓Token经营新蓝海

在重点行业市场，依托低时延无损的算力互联能力，推动算网一体化深度融入生产制造、医疗教育、交通巡检等各类行业场景，让算力资源真正成为驱动产业升级的核心动力。面向未来，Token经营仍处在持续探索完善的阶段，华…

06-29

《玩具总动员5》上映10天票房破2亿，时隔七年回归直击时代新议题

06-29

古尔曼爆料：苹果Mac Studio更新计划曝光，M5 Ultra芯片款今年或登场

06-29

东风奕派M8正式开启预售！大六座布局+华为科技加持，19.98万起售

06-29

点击查看更多 +

全站最新

企业微信Agent“大圆”实测：3小时搞定运营年中考核，效率飙升！

华为杨扬：借AI焕新产品服务携手各方推动Token经营价值提升

广州华立学院“特殊规定”：小米汽车被拒之门外其他车辆预约即入

科大讯飞Pro与光帆AI耳机：商务会议高效助手，户外运动贴心伙伴

科大讯飞SR302星火版VS BKHE录音神器：谁才是数码录音领域的优选利器？

广州华立学院“禁入令”引热议：小米汽车缘何被单独“拒之门外”？

热门内容

本栏最新

华为杨扬：借AI焕新产品服务携手各方推动Token经营价值提升

东风奕派M8正式开启预售！大六座布局+华为科技加持，19.98万起售

东风奕派M8开启预售：大六座SUV新选择，纯电增程双版本来袭

东风奕派M8正式开启预售！19.98万元起享大六座SUV与华为黑科技

AI浪潮来袭，通信行业如何借力重构模式，开启智能新篇章？

AI浪潮席卷通信业：从“卖连接”到“卖智能”，新价值如何破局？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.