近日,科技圈内流传着一则关于智谱GLM-4.5新开源模型的发布消息,引起了广泛关注。据相关人士向新浪科技透露,智谱GLM-4.5系列模型的确将于今晚正式对外发布。
早在本月25日,modelscope/ms-swift代码库的提交记录中,已透露出智谱GLM-4.5系列模型即将问世的端倪。据推测,该系列模型或将采用创新的混合专家(MoE)架构,是一款功能强大的多模态可扩展大模型。
根据代码库中的信息,GLM-4.5系列预计包含两款模型:GLM-4.5(参数规模介于355B至A32B之间)和GLM-4.5-Air(参数规模介于106B至A12B之间)。这两款模型的具体性能与应用场景,引发了业界的诸多猜想。
此前,Linux DO论坛网友@惊鱼曾对GLM-4.5进行了深入分析。他认为,GLM-4.5基于混合专家(MoE)架构,不仅支持多模态处理,还具备高吞吐推理、结构化工具调用、可解释推理追踪以及分布式负载均衡等先进特性。这些特性使得GLM-4.5在处理复杂任务时更加得心应手。
值得注意的是,GLM-4.5还支持多专家分组、负载均衡、分布式推理以及多token预测(MTP)推理等功能。该模型还引入了新的推理解析器和工具调用解析器,能够输出严格的推理内容和工具调用内容,从而增强了模型的工具增强推理与函数调用能力。
从官方文档来看,GLM-4.5支持文本(T)、图像(I)、可扩展(E+)以及视觉扩展(V+)等多种模态,进一步凸显了其作为多模态增强大模型的定位。这一特性使得GLM-4.5在跨领域应用方面具有更广泛的前景。