在2025云栖大会现场,阿里云智能首席技术官周靖人宣布了一系列重大技术突破。当天,通义大模型家族迎来七项重要更新,覆盖模型智能水平提升、Agent工具调用与编程能力优化、深度推理强化及多模态交互等多个领域,标志着人工智能技术迈向新高度。
作为通义千问系列的核心产品,Qwen3-Max旗舰模型正式登场。该模型采用36T tokens的预训练数据,参数规模突破万亿级别,在编程实现与工具调用领域展现出卓越性能。其强大的代码生成能力可支持复杂系统开发,Agent框架则能高效整合第三方工具,为智能化应用提供底层支撑。
在基础架构层面,Qwen3-Next系列模型实现重大突破。新一代架构在保持与2350亿参数版本相当性能的同时,大幅优化计算效率,为大规模商用部署奠定基础。专项模型方面,编程专用模型Qwen3-Coder完成迭代升级,在算法优化与代码纠错能力上取得显著进展。
多模态领域同样亮点纷呈。视觉理解模型Qwen3-VL正式开源,在图像语义解析与跨模态推理方面树立新标杆。全模态交互模型Qwen3-Omni首次亮相即引发关注,该模型在音视频处理领域创下32项SOTA纪录,具备类人级的听说读写综合能力,可适配车载系统、智能眼镜及移动终端等多样化场景。
视觉创作领域迎来重要升级,通义万相推出Wan2.5-preview系列模型,集成文生视频、图生视频、文生图及图像编辑四大功能模块。新版本全面强化中英文字体生成与图表绘制能力,支持通过自然语言指令实现图像精细化编辑,大幅降低专业设计门槛。
语音交互方面,通义百聆大模型家族正式组建。其中语音识别模型Fun-ASR基于数千万小时真实语音数据训练,具备上下文感知与行业适配能力;语音合成模型Fun-CosyVoice提供超百种预制音色库,可满足客服、电商直播、有声读物、消费电子等领域的多样化需求。
截至目前,阿里通义大模型已开源300余个版本,形成覆盖全尺寸、全模态的完整生态。其全球下载量突破6亿次,衍生模型达17万个,在开源社区影响力持续领跑全球。从基础架构到垂直领域,从文本处理到多模态交互,通义大模型正以持续创新推动AI技术普惠化进程。