ITBear旗下自媒体矩阵:

通义千问Qwen3 - TTS升级啦!超49种音色,10大语言及多方言轻松驾驭

   时间:2025-12-10 21:25:50 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

通义千问近日对其语音合成模型Qwen3-TTS进行了全面升级,新版本在音色多样性、语言覆盖范围及方言支持方面实现显著突破,用户可通过Qwen API直接调用相关功能。此次升级标志着该模型在跨语言语音生成领域的技术竞争力进一步提升。

据技术团队披露,升级后的Qwen3-TTS内置超过49种精细化音色库,涵盖不同性别、年龄层次及地域特征,甚至支持虚拟角色定制化语音输出。这种设计使其能够适应有声读物、智能客服、影视配音等多元场景需求,为内容创作者提供更丰富的表达维度。

在语言支持层面,模型突破传统多语种框架,除中文、英语、日语、韩语等10种主流语言外,还特别强化了方言生成能力。闽南语、粤语、四川话等方言的语音合成效果经过专项优化,在保持地域特色的同时确保发音准确度。技术测试数据显示,其平均词错误率(WER)指标优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview等同类型产品。

开发团队强调,此次升级重点解决了跨语言语音合成中的韵律衔接问题,通过改进声学模型架构,使不同语言间的切换更加自然流畅。特别是在中英混合语句处理上,模型能够精准把握两种语言的发音重音与语调变化,显著提升多语言场景下的用户体验。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version