近日,大模型竞技场LMArena公布了最新一轮的模型排名,引发行业广泛关注。在综合性能榜单中,智谱科技发布的GLM-4.6与阿里旗下Qwen3-Max-Preview并列第四,双双占据国内模型榜首位置,同时GLM-4.6更以开源模型身份登顶全球榜首。
作为智谱科技9月30日推出的旗舰产品,GLM-4.6在编程能力、长文本处理、逻辑推理、信息检索、内容创作及智能体应用等六大核心领域实现突破性提升。测试数据显示,该模型在公开编程基准任务中的表现已与Claude Sonnet 4持平,成为国内首个达到国际顶尖水平的代码生成模型。
在LMArena的专项评测中,GLM-4.6的创意写作能力表现尤为突出,以显著优势领跑全球同类模型。这一成绩直接推动其同时登顶Hugging Face趋势榜单和OpenRouter API市场热度榜,形成"双榜第一"的领先态势。
值得关注的是,阿里通义千问Qwen3-Max系列出现特殊现象:其正式版本0923在竞技场测试中仅位列第九,落后于预览版Qwen3-Max-Preview。不过该模型在数学专项评测中展现出绝对优势,以满分表现占据全球数学能力榜首。
行业观察显示,自9月以来国产大模型进入密集迭代期。除GLM-4.6和Qwen3-Max系列外,月之暗面Kimi K2等新锐模型也在多维度评测中取得亮眼成绩,形成技术突破与市场应用的双重竞争格局。