阿里近日在chat.qwen.ai平台悄然推出两款全新大语言模型——Qwen3.5-Plus与Qwen3.5-397B-A17B,标志着其在多模态人工智能领域的技术突破。这两款模型不仅延续了Qwen系列对文本与多模态任务的支持,更通过底层架构革新实现了性能与效率的双重跃升。
作为Qwen3.5系列的最新迭代,Qwen3.5-Plus总参数规模达3970亿,但每次推理仅激活170亿参数。这种创新设计使其在保持万亿参数模型性能的同时,将显存占用降低60%,推理吞吐量最高提升至19倍。该模型通过更严格的训练数据过滤机制,强化了中英文、多语言及STEM领域的知识储备,在复杂逻辑推理任务中展现出超越前代Qwen3-Max的实力。
开源旗舰模型Qwen3.5-397B-A17B则采用混合架构设计,将线性注意力机制与稀疏混合专家模型相结合。这种架构使其在编程、智能体交互及多模态理解等基准测试中表现卓越,解码效率较前代提升显著:在32k上下文长度下,解码速度是Qwen3-Max的8.6倍;256k上下文长度下更达到19倍提升。语言支持范围从119种扩展至201种,覆盖全球主要语言及方言群体。
技术团队透露,Qwen3.5系列在预训练阶段实现了三大突破:在能力维度,通过扩大视觉-文本语料规模并优化数据过滤标准,使397B模型在多项基准测试中与参数量超1万亿的Qwen3-Max-Base持平;效率维度,基于Qwen3-Next架构引入更高稀疏度的MoE机制,配合混合注意力模块,在保持性能的同时大幅降低计算资源消耗;通用性维度,通过原生多模态设计使模型天然具备文本、图像、视频的综合处理能力,25万词表较前代提升66%的编码效率。
据开发团队介绍,Qwen3.5系列已为构建通用数字智能体奠定技术基础。未来研发重点将转向系统整合层面,包括开发具备跨会话记忆能力的智能体框架、设计面向物理世界交互的具身接口,以及建立自我改进机制。这些创新旨在突破传统任务型助手的局限,打造能够长期自主运行、保持逻辑一致性的可信人工智能伙伴。










