滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

千问语音合成模型Qwen3-TTS 发布，支持3秒克隆音色和音色定制

时间：2025-12-24 20:30:51 来源：鞭牛士编辑：快讯 IP：北京 发表评论无障碍通道

AIPress.com.cn报道

12月24日，据官方消息，通义千问发布了新一代语音合成模型Qwen3-TTS，并同步推出两款核心模型：音色创造模型 Qwen3-TTS-VD-Flash与音色克隆模型 Qwen3-TTS-VC-Flash。相比传统 TTS 产品主要依赖预设音色或简单复刻，Qwen3-TTS 将语音能力进一步扩展到“音色设计”层面。

在音色创造方面，Qwen3-TTS-VD-Flash 支持通过复杂自然语言指令直接定义声音特征。用户不仅可以描述音色本身，还可对韵律、情感、语气、人设等进行精细化控制，实现从“说什么”到“如何说”的全面调控。这种方式使语音生成不再局限于已有音色或固定模板，而是可以按需求“创造声音”。

评测数据显示，在InstructTTS-eval中，Qwen3-TTS的综合表现显著优于 GPT-4o-mini-tts 和 Mimo-audio-7b-instruct；在角色扮演测试中，其表现也超过 Gemini-2.5-pro-preview-tts，体现出更强的可控性和一致性。

在音色克隆能力上，Qwen3-TTS 支持3 秒级音色克隆，并可基于克隆音色生成中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语等10 种主流语言。在 MiniMax TTS Multilingual Test Set 上，该模型在多语种内容稳定性和平均词错误率（WER）指标上，整体优于 MiniMax、ElevenLabs 以及 GPT-4o-Audio-Preview。

两款模型均强调高表现力与稳定性。Qwen3-TTS 可根据文本语义自动调整语气与节奏，在长文本、多角色对话等复杂场景中，保持自然、生动的拟人化表达。同时，其文本解析能力覆盖复杂结构和非规范化输入，在实际应用中具备较高鲁棒性。

Qwen3-TTS 支持将已创建的音色进行持久化存储与重复调用，可用于多轮、多角色的长篇对话生成，为数字人、虚拟客服、内容创作等场景提供更灵活的语音底层能力。目前，相关模型已通过阿里云 Model Studio 提供 API 接口，面向开发者开放使用。

更多>同类资讯

这个业务，顺丰不想干了

12-24

泡泡玛特悉尼旗舰店亮相，成为南半球面积最大门店

12-24

抖音：截至11月共拦截1.2亿条网暴评论，处置违规账号超41万个

12-24

对话丽江市古城区旅拍行业协会：小红书过去一年让当地旅拍行业损失超500万，将发起集体诉讼

12-24

潮玩IP化身情感符号，Crybaby特展登陆上海

12-24

格力电器：暂时没有空调铝代铜计划

12-24

徕卡红标首次外授权小米17 Ultra定义影像旗舰新标准

12-24

作家集体起诉OpenAI等六大AI公司：指控盗版书籍训练模型构成"故意侵权"

12-24

京东：未来3天，全北京下单七鲜小厨送巧克力

12-24

特斯拉能源存储业务在英国再获大单合同金额2.75亿美元

12-24

小米17 Ultra确认涨价高端旗舰起售价或冲击7000元档

12-24

iPhone 17e已量产：传屏幕升级灵动岛 2026年春季上市

12-24

消息称京东方将为苹果iPhone 17e供应OLED显示屏

12-24

继豆包AI手机后，中兴通讯相关人士称目前已收到部分大模型厂合作邀约

12-24

影石无人机新品遭恶意抹黑，刘靖康：攻击越猛越证方向正确

12-24

点击查看更多 +

全站最新

岚图卢放直指新能源车内卷症结：回归用户创新经营方破局

电动汽车充电站“高可靠性”如何衡量？行业标准与实现路径何在？

沃尔沃XC70与理想L7对决：混动技术、安全与乘坐感受谁更优？

东风日产NX8实车亮相！增程纯电双动力，定价多少能成爆款？

吉利银河M7实车曝光！近4米8车身+1.5L插混，续航最高155km引期待

2026年上市！昊铂S600增程版亮相宽敞空间+长续航瞄准家庭用车市场

热门内容

本栏最新

影石无人机新品遭恶意抹黑，刘靖康：攻击越猛越证方向正确

科技巨头“北京聚首”：从雷军赔罪红酒到李在镕访厂，小米改写行业规则

小米17 Ultra首发徕卡2亿像素光学变焦长焦 1英寸主摄加持或成影像新标杆

小米17Ultra徕卡版正式官宣融合百年影像精髓开启专业摄影新篇章

12.98万起售的锐胜M8：大空间高配置，家庭商用皆宜的MPV新选择

环球园艺冲刺港交所：小花盆“盆”出大生意，60%毛利率能否撑起全球梦？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.