智谱近日正式推出新一代人工智能模型GLM-4.7,在代码生成、界面设计、工具调用及复杂推理等多个维度实现突破性进展。该模型通过架构优化与算法创新,显著提升了多场景下的任务处理能力,尤其在编程与数学推理领域展现出接近人类专家的表现水平。
在编程能力方面,GLM-4.7针对多语言智能体开发实现质的飞跃。测试数据显示,其在SWE-bench编程基准测试中取得73.8%的成绩,较前代提升5.8个百分点;在多语言版本SWE-bench Multilingual中更以66.7%的得分实现12.9%的跃升。终端操作场景下,Terminal Bench 2.0测试成绩达41%,提升幅度高达16.5%。该模型引入的"预规划-执行"机制,使其在Claude Code等主流智能体框架的复杂任务中,能够自主拆解步骤并优化执行路径,任务完成效率提升近40%。
界面设计领域迎来重要革新。GLM-4.7生成的网页代码结构精简度提升35%,采用现代CSS框架的比例从62%增至89%,生成的幻灯片布局误差率降低至5%以内。通过引入视觉美学评估模块,模型能够自动调整元素间距、色彩搭配及字体层级,使最终呈现效果更符合专业设计标准。测试集显示,其生成的UI界面在用户满意度评分中达到4.7分(满分5分),较前代提升21%。
工具调用能力实现系统性突破。在τ2τ2-Bench工具使用基准测试中,GLM-4.7的得分从68.3分提升至79.1分,网络浏览任务成功率通过BrowseComp框架验证达到92%。模型新增的动态工具链构建功能,可根据任务需求自动组合调用API、数据库及外部服务,在供应链优化等复杂场景中展现出强大的跨系统协作能力。某金融企业的实测表明,使用该模型后业务流程自动化率从67%提升至89%。
数学推理能力达到新高度。在涵盖高等数学、物理建模及逻辑推理的HLE基准测试中,GLM-4.7取得42.8%的得分,较前代提升12.4个百分点。其独创的分层验证机制,通过多轮自我校验将计算错误率控制在0.3%以下。在微积分、线性代数等核心领域的解题速度提升2.3倍,证明题完整推导成功率突破65%。教育机构的应用反馈显示,该模型在辅助教学时能够提供比传统解题工具更详细的步骤解析。











