阿里巴巴正式推出新一代开源大模型千问Qwen3.5-Plus,在性能评测中与Gemini 3 Pro持平,成为全球最强的开源模型。该模型总参数达3970亿,但实际激活参数仅170亿,通过架构创新实现了以小博大的技术突破。相较于前代Qwen3-Max万亿参数模型,新版本不仅性能更优,部署显存占用降低60%,推理吞吐量最高可提升至19倍,且API调用价格降至每百万Token 0.8元,仅为Gemini 3 Pro的十八分之一。
千问3.5系列最显著的升级在于完成从纯文本到原生多模态的范式转变。不同于前代基于文本token的训练方式,新模型采用视觉与文本混合token预训练,数据集新增大量中英文、多语言、STEM学科及推理类内容。这种训练方式使模型在保持参数规模缩减60%的同时,在MMLU-Pro知识推理(87.8分超越GPT-5.2)、GPQA博士级难题(88.4分领先Claude 4.5)等权威基准测试中全面领先。在指令遵循能力测试IFBench中,76.5分的成绩更刷新了所有模型的历史纪录。
视觉能力的突破成为该模型的核心竞争力。在MathVison多模态推理、RealWorldQA视觉问答、CC_OCR文本识别等专项评测中,千问3.5均取得最佳成绩。其空间智能模块在RefCOCO-avg测试中表现尤为突出,能精准定位图像中的微小物体并完成复杂推理。视频理解方面支持长达2小时(100万token上下文)的连续输入,可自动生成视频摘要。更值得关注的是,模型将视觉理解与代码生成能力深度融合,用户上传手绘界面草图即可自动生成前端代码,截图分析功能可快速定位并修复UI设计缺陷。
技术突破源于对Transformer架构的革命性改造。研发团队将斩获2025 NeurIPS最佳论文的门控技术融入新型混合架构,结合线性注意力机制与稀疏混合专家(MoE)模型,在保持3970亿总参数规模的同时,将有效激活参数压缩至170亿。通过多token预测训练和上下文优化技术,模型在32K标准场景下推理速度提升8.6倍,256K超长上下文场景下更达到19倍性能提升。训练稳定性方面,创新设计的FP8/FP32混合精度策略使内存占用减少50%,训练效率提升10%。
原生多模态训练的高效实施得益于阿里云AI基础设施的支撑。通过数据流优化技术,模型在文本、图像、视频混合训练时的吞吐量接近纯文本模型水平,显著降低多模态训练门槛。在商业化应用层面,千问3.5已实现从框架到应用的实质性突破。移动端支持主流APP自动化操作,PC端可完成跨应用数据整理、复杂流程执行等任务。其异步强化学习框架将Agent训练效率提升3-5倍,插件式智能体支持规模扩展至百万级。
春节期间,基于千问3.5的AI购物Agent完成1.2亿笔订单处理,验证了大规模真实场景商用能力。自2023年开源以来,千问系列已推出400余个模型版本,覆盖全尺寸、全模态领域,全球下载量突破10亿次,单月下载量超过DeepSeek、meta、OpenAI等六家企业总和。开发者基于千问开发的衍生模型超过20万个,形成全球最大的开源模型生态。最新版本扩展支持201种语言,词表容量从15万扩展至25万,小语种编码效率提升最高达60%。目前,千问APP及PC端已完成模型接入,开发者可通过魔搭社区、HuggingFace平台下载,或通过阿里云百炼获取API服务,后续将陆续开源不同规格的千问3.5系列模型。







