大模型竞技场LMArena最新公布的排名显示,国产人工智能领域迎来重要突破。智谱科技于9月30日发布的GLM-4.6模型,在综合性能评估中位列全球第四,与阿里巴巴旗下Qwen3-Max-Preview模型并列中国区榜首,同时摘得全球开源模型桂冠。
根据技术文档披露,GLM-4.6在编程能力、长文本处理、逻辑推理、信息检索、内容创作及智能体应用等六大核心领域实现全面升级。在公开测试基准中,该模型的代码生成能力已达到国际领先水平,与Claude Sonnet 4模型持平,成为国内目前表现最优的编程专用模型。
在创意写作维度,GLM-4.6凭借出色的文本生成质量登顶全球榜首。这一突破性表现使其同时斩获Hugging Face趋势榜和全球大模型API市场OpenRouter的榜首位置,形成双平台领先的竞争优势。
值得注意的是,阿里巴巴通义千问Qwen3-Max的正式版本0923在本次评测中表现分化。虽然其数学运算能力位居全球首位,但整体性能仅位列第九,未能超越此前发布的预览版本。这种版本迭代中的性能波动现象,引发业界对模型优化策略的深入讨论。
自9月以来,国产大模型呈现集中突破态势。除GLM-4.6外,Qwen3-Max、Kimi K2等模型在多项技术指标上均取得显著进步。这种技术迭代速度的加快,标志着中国AI产业正在形成具有国际竞争力的技术集群。