在人工智能领域,大模型的发展正经历着一场从专用向通用的深刻变革。近日,智谱公司震撼发布了其新一代旗舰模型GLM-4.5,并在Hugging Face与Model Scope两大平台同步实现开源,此举标志着人工智能技术的又一次重大飞跃。
GLM-4.5的综合实力不容小觑,它在MMLU Pro、AIME 24、MATH 500等12项基准性能测试中取得了卓越成绩,平均分位列全球第三、国产模型之首、开源模型第一。尤为尽管GLM-4.5的参数量仅为DeepSeek-R1的一半、Kimi-K2的三分之一,但其参数效率极高,在多项测试中表现尤为亮眼。
在价格方面,GLM-4.5系列也展现出了极高的性价比,API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens,远低于主流模型,这对于推动大模型的广泛应用具有重要意义。
GLM-4.5不仅性能卓越,更是一次技术创新的突破。作为智谱首款SOTA级原生智能体大模型,GLM-4.5原生融合了推理、编码和智能体能力,这一创新设计使得模型在处理复杂任务时更加游刃有余。
同期,阿里云和阶跃星辰也分别发布了通义千问AI编程大模型Qwen3-Coder和新一代基础大模型Step 3,它们都集成了推理、代码生成、智能体等能力。然而,GLM-4.5首次在单个模型中实现了推理、编码和智能体能力的原生融合,这在业界尚属首次。
智谱CEO张鹏在早前的产业生态大会上曾强调“原生”这一关键词,他演示了大模型编写PPT、生成小游戏的能力,并指出大模型正在持续叠加越来越多的能力。GLM-4.5的发布,正是这一趋势的生动体现。
业内人士指出,推理能力、智能体能力和代码能力的融合,将有助于构建一个以模型为主体的智能体。GLM-4.5在推理、代码和智能体能力上均达到了开源模型的最高水平,其中推理能力更是位列开源模型第二,这充分展示了其强大的综合实力。
与阿里Qwen3-Coder侧重于代码任务、阶跃星辰Step 3定位为原生多模态推理模型不同,智谱GLM-4.5专为智能体应用打造。它原生具备在前端编写网站、在后端进行数据库管理的能力,以及通过工具调用接口支持任意的智能体应用,这使得GLM-4.5在智能体应用领域具有得天独厚的优势。
在智谱的演示中,GLM-4.5展现了其作为智能体基座的强大潜力。它可以作为搜索引擎进行搜索、在B站发送弹幕、在微博发布动态,甚至还能胜任全栈开发任务,编写复杂应用、游戏和交互网页。这些功能的实现,得益于GLM-4.5原生融合的多项能力。
智能体基座的应用场景广泛,其中最为成熟的是接入编码智能体。GLM-4.5作为以Coding为核心的智能体,擅长处理与编码相关的任务。在Agent Coding场景中,GLM-4.5与其他开源模型相比展现出明显的竞争优势,特别是在工具调用可靠性和任务完成度方面。
随着GLM-4.5的发布,众多企业纷纷宣布即将接入该模型。Rokid Glasses、智联招聘、脉脉、Lovart中国版“星流”、沉浸式翻译、Flowith等企业都表示了对GLM-4.5的浓厚兴趣,并计划将其应用于各自的业务场景中。智谱还预告了Vibe coding模式的即将推出,这一模式将通过自然语言提示驱动AI生成代码,进一步减少手动编码的需求。
GLM-4.5的发布不仅标志着大模型技术的一次重大突破,更为智能体应用的发展奠定了坚实基础。随着越来越多的企业接入GLM-4.5,我们有理由相信,一个更加智能、更加便捷的未来正在向我们走来。