除夕之夜,人工智能领域迎来重磅消息:阿里宣布全新一代开源大模型Qwen3.5-Plus正式发布,凭借多项突破性技术指标登顶开源模型性能榜首。这款总参数达3970亿、激活参数仅170亿的模型,在保持推理效率优势的同时,综合性能超越万亿参数的Qwen3-Max,更在多项基准测试中力压Gemini-3-Pro、GPT-5.2等闭源模型。
在核心能力维度上,Qwen3.5-Plus展现出全方位突破。MMLU-Pro综合认知测试中取得87.8分,超越GPT-5.2;博士级科学推理GPQA评测以88.4分刷新纪录,甚至超越以逻辑严谨著称的Claude 4.5。指令遵循能力方面,该模型在IFBench榜单以76.5分创下新高,Agent协同能力在BFCL-V4和Browsecomp评测中均全面领先Gemini-3-Pro。
技术架构革新是此次突破的关键。研发团队对Transformer架构进行深度重构,引入混合注意力机制实现计算资源动态分配,使长文本处理效率显著提升;极致稀疏的MoE架构将激活参数比例压低至5%以下,在保留知识优势的同时大幅降低推理成本;原生多Token预测机制使推理速度接近翻倍,系统级训练稳定性优化则解决了超大规模稀疏模型训练难题。这些创新使模型部署显存占用降低60%,推理吞吐量提升19倍,训练成本下降90%。
多模态能力成为最大亮点。作为原生多模态模型,Qwen3.5-Plus在预训练阶段即实现文本与视觉数据的深度融合,突破传统方案"语言-视觉"分步处理的局限。在MathVison、RealWorldQA等12项多模态评测中包揽全部第一,支持长达2小时视频的直接输入与精准分析,更开创性地将视觉理解与代码生成无缝衔接,可实现手绘界面草图到前端代码的自动转换,以及通过单张截图定位修复UI缺陷。
实际应用场景中,模型展现出强大泛化能力。面对"50米距离选择开车还是步行洗车"的逻辑陷阱题,能精准识别"车辆必须到达洗车点"的核心矛盾;在IMO竞赛级几何题测试中,可逐步推导复杂证明过程;动态推理任务中,能规划滑动方块的最优移动路径。更值得关注的是,该模型可与OpenClaw等第三方智能体环境集成,完成网页搜索、信息收集和结构化报告生成等复杂任务。
开源生态建设持续加速。阿里同步宣布Qwen3.5系列将陆续开源多款适配不同场景的模型版本,覆盖本地部署、端侧应用等需求,旗舰版Qwen3.5-Max也将在年后发布。目前开发者已可通过魔搭社区和HuggingFace平台获取模型资源,普通用户则能在千问APP及PC端免费体验。为降低使用门槛,阿里云百炼平台将API定价压至0.8元/百万Tokens,仅为Gemini-3-pro的1/18,同时支持201种语言,词表规模扩展至250k,小语种编码效率提升60%。
自2023年启动开源战略以来,阿里已累计发布400余个模型,形成从0.5B到235B的全尺寸覆盖体系。这个全球最大的AI模型族群累计下载量突破10亿次,单月下载量超过第二至第八名总和,衍生出超过20万个开发者模型。此次Qwen3.5-Plus的发布,标志着开源模型在性能追赶闭源系统的同时,正通过生态建设构建新的竞争维度。










