ITBear旗下自媒体矩阵:

阿里云重磅出击!Qwen3-Omni等多模态AI模型及工具全新发布

   时间:2025-09-23 14:58:57 来源:小AI编辑:快讯 IP:北京 发表评论无障碍通道
 

阿里云近日宣布推出三款全新AI模型,涵盖多模态交互、语音合成及图像编辑领域,并同步开放源代码供开发者使用。此次发布的模型包括Qwen3-Omni全模态模型、Qwen3-TTS-Flash语音合成系统,以及Qwen-Image-Edit-2509图像处理工具,标志着其在生成式AI技术上的进一步突破。

作为全球首个原生端到端全模态AI模型,Qwen3-Omni突破了传统多模态系统的技术瓶颈。该模型支持文本、图像、音频、视频的跨模态输入,并可通过自然语音实现实时流式输出。开发者无需在不同模态能力间进行权衡,即可构建支持多类型数据交互的应用程序,为智能客服、内容创作等领域提供更高效的解决方案。

在语音技术领域,Qwen3-TTS-Flash重新定义了文本转语音的标准。该模型支持中、英、意、法四国语言的SOTA级语音识别,提供17种情感化声线选项,并覆盖粤语、闽南语、四川话等9种中国方言。其多语言兼容性与自然度表现,使其成为游戏配音、智能导航、多媒体内容生产等场景的理想选择。

图像处理方面,Qwen-Image-Edit-2509展现了强大的融合编辑能力。用户可上传单张图片进行基础处理,或通过组合“人物+产品”“人物+场景”等元素实现创意合成。模型通过智能算法分析元素特征,自动完成光影匹配与细节优化,生成符合视觉逻辑的融合图像,为电商设计、影视特效等领域提供高效工具。

目前,这三款模型已通过阿里云平台开放下载,开发者可基于开源代码进行二次开发。相关技术文档与使用案例同步上线,用户可通过访问AI资讯平台获取最新动态及行业应用方案。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version