近日,智谱公司正式推出了其最新一代旗舰模型GLM-4.5,标志着AI技术向更加实用化、高效化的方向迈出了重要一步。与以往单纯追求参数规模的做法不同,GLM-4.5更加注重智能体应用的设计,通过技术创新实现了高性价比,并积极拥抱开源和开发者生态。
据悉,GLM-4.5在推理、代码、科学、智能体等多个维度的基准测试中表现出色,综合得分位列全球参评模型的第三位,且在开源模型中独占鳌头。这一成绩的取得,不仅彰显了模型的综合实力,更凸显了其在智能体应用领域的独特优势。
GLM-4.5的设计初衷便是为了满足智能体的复杂需求。智能体不仅需要理解任务、规划分解,还需要调用工具和执行反馈,这对模型的能力提出了更高要求。为了支撑这些能力,GLM-4.5采用了混合专家(MoE)架构,总参数量达到3550亿,但单次推理中被激活的参数量仅为320亿。这种设计既保证了模型的巨大知识储备和能力上限,又有效控制了推理成本和能耗。
GLM-4.5还具备双模式运行的特点,即“思考模式”和“非思考模式”。前者适用于复杂的推理和工具调用任务,允许模型投入更多计算资源进行深度规划;后者则服务于需要快速响应的场景,保证了智能体在日常交互中的速度。这种设计充分考虑了实际应用场景的需求,使得GLM-4.5在执行复杂任务时更加得心应手。
在训练方面,GLM-4.5同样下足了功夫。在15万亿token的通用数据预训练之后,团队又使用了8万亿token的高质量数据,在代码、推理、智能体等领域进行了针对性训练,并通过强化学习进行能力对齐。这种“通识教育+专业深造”的训练路径,使得GLM-4.5不仅知识渊博,更在特定专业领域具备了解决实际问题的能力。
GLM-4.5在发布时还展现了其清晰的商业逻辑。通过提高参数效率,GLM-4.5在保证高质量输出的前提下,有效控制了推理成本和能耗,从而降低了部署和使用成本。此次公布的API定价也显著低于当前市场主流闭源模型的定价水平,为开发者提供了一个兼具高性能和低成本的选择。同时,GLM-4.5的API还兼容主流的Claude Code框架,降低了技术选型和切换的阻力。
为了吸引更多开发者并繁荣生态,智谱还采取了开源策略。GLM-4.5的模型权重在Hugging Face和ModelScope等平台遵循MIT License进行开源,为企业和个人基于GLM-4.5进行二次开发和商业化应用提供了便利。这种开放的姿态不仅有助于推动AI技术的普及和应用创新,也为GLM-4.5的未来发展奠定了坚实基础。
在实际应用方面,智谱已经展示了多个基于GLM-4.5原生能力构建的应用案例,如可交互的搜索引擎、社交媒体网站以及Flappy Bird小游戏等。这些案例充分证明了GLM-4.5在智能体方向上的潜力和价值。然而,从功能演示到稳定可靠的生产级应用仍需要一定的时间和努力。智谱此次选择公开评测题目和Agent轨迹,邀请行业共同验证和改进,也体现了其积极和开放的态度。