近日,科技圈内流传着一则令人瞩目的消息:智谱GLM-4.5系列模型即将迎来新版本发布。据悉,这一消息源自新浪科技所援引的知情人士透露,确认GLM-4.5的新开源模型将于今晚正式面世。
回溯至本月25日,modelscope/ms-swift代码库中的commit记录已悄然预示着这一变化。记录显示,智谱GLM-4.5系列模型即将发布,预计采用创新的混合专家(MoE)结构,旨在打造一款多模态且可扩展的大型模型。
根据commit中透露的代码信息,GLM-4.5系列将包含两款核心模型:GLM-4.5(参数范围355B至A32B)和GLM-4.5-Air(参数范围106B至A12B)。这两款模型的问世,无疑将为人工智能领域注入新的活力。
此前,Linux DO论坛的网友@惊鱼已对GLM-4.5进行了深入分析。他指出,该模型基于混合专家(MoE)结构,不仅支持多模态处理,还具备高吞吐推理、结构化工具调用、可解释推理追踪以及分布式负载均衡等先进特性。这些特性使得GLM-4.5在处理复杂任务时更加得心应手。
值得注意的是,GLM-4.5还引入了多专家分组、负载均衡、分布式推理以及多token预测(MTP)推理等先进技术。该模型还新增了推理解析器和工具调用解析器,使得模型能够输出严格的推理内容和工具调用内容,从而极大地增强了其工具增强推理与函数调用能力。
据官方文档显示,GLM-4.5支持文本(T)、图像(I)、可扩展(E+)以及视觉扩展(V+)等多种模态,这进一步印证了其作为多模态增强大模型的定位。随着GLM-4.5系列模型的发布,我们有理由相信,人工智能领域将迎来一次新的技术革新。