智谱公司在近期的一个夜晚,正式推出了其最新一代的旗舰模型GLM-4.5,并宣布该模型已在HuggingFace与ModelScope两大平台上以开源形式发布,其模型权重遵循的是MIT开源许可协议。
GLM-4.5采用了混合专家(MoE)架构,具体分为两个版本:GLM-4.5拥有总计3550亿参数,其中激活参数为320亿;而GLM-4.5-Air的总参数量为1060亿,激活参数为120亿。这样的配置显示了智谱在模型规模与效率上的双重追求。
在费用方面,GLM-4.5为用户提供了极具竞争力的API调用价格。输入费用仅为每百万tokens 0.8元,输出费用为每百万tokens 2元。更令人瞩目的是,GLM-4.5的高速版在生成速度上可达到每秒100tokens,大大提升了处理效率。
智谱公司强调,GLM-4.5是专为智能体应用设计的基础模型。它具备两种独特的工作模式:一种是用于处理复杂推理和工具使用的思考模式,另一种是用于快速响应的非思考模式。这两种模式的结合,使得GLM-4.5在智能体应用中表现出色。
目前,GLM-4.5的API已经在BigModel.cn开放平台上上线,用户可以轻松访问并使用。该API与Claude Code框架完美兼容,为用户提供了更多的应用可能性。用户还可以在智谱清言官网和z.ai上免费体验GLM-4.5的满血版,感受其强大的功能和性能。