ITBear旗下自媒体矩阵:

阿里开源Qwen3.5-Plus大模型:性能跃升推理高效,开启多模态AI新篇

   时间:2026-02-16 21:54:32 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

阿里巴巴正式开源新一代大模型千问Qwen3.5-Plus,其性能表现已达到国际领先水平,可与Gemini 3 Pro相媲美。这款模型在底层架构上实现了全面革新,总参数规模达3970亿,但激活参数仅170亿,通过创新技术实现了以小胜大的突破。相较于万亿参数的Qwen3-Max模型,新版本不仅性能更优,部署显存占用降低60%,推理效率也得到显著提升,最大推理吞吐量可提升至19倍。在API定价方面,Qwen3.5-Plus每百万Token仅需0.8元,仅为Gemini 3 Pro的十八分之一。

千问3.5系列最引人注目的突破在于从纯文本模型向原生多模态模型的转型。与前代基于纯文本预训练不同,新模型采用视觉与文本混合token进行训练,大幅增加了中英文、多语言、STEM学科及推理数据。这种设计使模型具备了更强的世界知识理解和逻辑推理能力,仅用不到40%的参数量就达到了超万亿参数模型的性能水平。在多项基准测试中,Qwen3.5-Plus表现优异:MMLU-Pro知识推理评测得分87.8分,超越GPT-5.2;博士级难题GPQA测评获得88.4分,高于Claude 4.5;指令遵循IFBench测试中以76.5分刷新纪录;在通用Agent和搜索Agent评测中也全面领先Gemini 3 Pro和GPT-5.2。

视觉能力的飞跃是千问3.5的另一大亮点。在多模态推理、通用视觉问答、文本识别、空间智能和视频理解等权威评测中,该模型均取得最佳成绩。具体应用场景中,新模型支持长达2小时的视频直接输入(1M token上下文),适用于长视频内容分析与摘要生成;在学科解题和物理空间推理任务上,其空间定位和带图推理能力显著增强;通过视觉理解与代码能力的融合,模型可将手绘界面草图直接转换为可用前端代码,仅需一张截图就能定位并修复UI问题,真正将视觉编程转化为生产力工具。

技术架构层面,千问团队对Transformer经典模型进行了重大创新。自研的门控技术曾获2025 NeurIPS最佳论文,该成果被融入新型混合架构中。通过结合线性注意力机制与稀疏混合专家(MoE)模型,新架构实现了397B总参数仅激活17B的高效运行。在训练优化方面,团队采用多token预测等技术,使Qwen3.5-Plus在保持与Qwen3-Max相同性能水平的同时,推理效率大幅提升:32K上下文场景吞吐量提升8.6倍,256K超长上下文场景最大提升19倍。

原生多模态训练的高效完成得益于阿里云AI基础设施的技术突破。通过基础技术创新,模型在文本、图像、视频混合数据训练吞吐量上接近纯文本模型水平,大幅降低了训练门槛。精巧设计的FP8、FP32精度应用策略,使训练在扩展至数十万亿token时,激活内存减少约50%,训练速度提升10%,有效节约了训练成本。

在Agent应用领域,千问3.5实现了从框架到应用的突破。模型可自主操作手机和电脑完成日常任务,移动端支持更多主流APP与指令,PC端能处理跨应用数据整理、自动化流程执行等复杂操作。团队构建的异步强化学习框架使端到端加速达到3-5倍,插件式智能体支持规模扩展至百万级。1月15日发布的全球首个消费级AI购物Agent,在春节期间6天内协助用户完成1.2亿笔订单,验证了大规模真实世界任务执行和商业化能力。

自2023年开源以来,千问系列已发布400多个模型,覆盖全尺寸、全模态,全球下载量突破10亿次。数据显示,其单月下载量超过DeepSeek、meta、OpenAI等企业2至8名的总和,开发者基于千问开发的衍生模型超过20万个。为满足不同国家开发者需求,千问3.5扩展支持201种语言,词表规模从15万扩展至25万,小语种编码效率最高提升60%。目前,千问APP和PC端已接入Qwen3.5-Plus模型,开发者可通过魔搭社区、HuggingFace下载或阿里云百炼获取API服务。阿里方面表示,将持续开源不同尺寸和功能的千问3.5系列模型,性能更强的旗舰版本Qwen3.5-Max也即将发布。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version