近日,科技界迎来了一大震撼消息,智谱公司正式推出了其最新的开源模型——GLM-4.5。这一消息迅速引发了广泛关注,众多科技爱好者和专业人士纷纷表示期待,并急于了解这款新模型的具体表现。
据悉,GLM-4.5的问世,无疑是对近期频繁亮相的Grok 4、Kimi K2、ChatGPT Agent以及Qwen3 coder等顶尖模型的一次有力挑战。不少网友表示,近一个月来,他们的时间线几乎被这些新兴模型刷屏,而GLM-4.5的加入,无疑让这场科技盛宴更加精彩纷呈。
有幸获得内测资格的测试者分享了他们的初体验。一位测试者激动地表示,他几乎不眠不休地进行了多项测试,对GLM-4.5的表现感到极为震惊。他表示,这款模型不仅在推理、代码生成以及智能体综合能力上达到了开源模型的顶尖水平,还首次实现了这些能力的原生融合,综合平均分位列全球第三,国产模型第一。
据测试者透露,GLM-4.5提供了两种工作模式:thinking与non-thinking,分别对应总参数为355B(激活32B)和106B(激活12B)的两种型号。在SWE-Bench Verified测试中,GLM-4.5系列在同规模下实现了最佳性能。其API调用价格也相对亲民,输入0.8元/百万tokens、输出2元/百万tokens,远低于主流模型定价,且生成速度高达每秒超过100 tokens。
为了进一步验证GLM-4.5的实力,测试者将其与Kimi K2、Qwen3 coder以及Claude sonnet4进行了头对头的测试。在一项名为“互动宇宙弦网”的数字艺术作品生成任务中,GLM-4.5以其出色的逻辑交互实现和美学表现获得了满分10分,远超其他模型。测试中,GLM-4.5成功模拟了引力源和斥力爆发的双模式鼠标交互,生成了唯美且科幻的宇宙弦网效果。
在其他测试项目中,如模拟弹力球塌方物理过程、开发3D第三人称飞机飞行游戏以及生成个人网页等,GLM-4.5同样展现出了强大的实力。尤其在开发游戏的任务中,GLM-4.5不仅实现了第三人称跟随视角和方块化美学设计,还为飞机尾气添加了粒子效果,功能及UI设计均表现出色。
值得注意的是,智谱公司还为GLM-4.5提供了API兼容服务,使其能够一键配置在Claude code等主流代码智能体中运行。测试者表示,在使用GLM-4.5驱动的Claude code进行任务时,体验非常丝滑,如制作Paul Graham文章的epub电子书等任务,仅用了不到三分钟就完成了代码编写和运行。
此次GLM-4.5的推出,无疑为国产开源模型争得了荣誉。众多网友表示,看到国产模型一个接一个地站在世界顶尖模型阵列中,感到由衷地骄傲和祝福。GLM-4.5的巅峰之作,无疑为国产科技界注入了一剂强心针,让人们对未来充满了期待。