滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

阿里通义Qwen3-TTS家族再添新成员：音色克隆与定制随心掌控

时间：2025-12-24 21:01:54 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

阿里通义近日宣布，其Qwen3-TTS家族迎来重要更新，正式推出两款创新模型——音色创造模型Qwen3-TTS-VD-Flash和音色克隆模型Qwen3-TTS-VC-Flash。这两款模型在语音合成领域展现出卓越性能，为用户带来前所未有的个性化语音体验。

Qwen3-TTS-VD-Flash作为音色创造领域的突破性成果，支持通过复杂自然语言指令实现音色的精细化调控。用户可自由定义音色、韵律、情感及人设等参数，彻底摆脱传统语音合成中预设音色或简单克隆的限制。该模型在InstructTTS-eval评测中表现优异，综合评分显著超越GPT-4o-mini-tts和Mimo-audio-7b-instruct，在角色扮演场景测试中更力压Gemini-2.5-pro-preview-tts。其独特的文本解析能力可自动处理复杂结构，精准提取关键信息，即使面对非规范化文本也能保持稳定输出。

另一款明星模型Qwen3-TTS-VC-Flash则专注于音色克隆技术，仅需3秒音频样本即可完成高精度克隆。该模型支持中、英、德、意、葡、西、日、韩、法、俄等10种主流语言的语音生成，在MiniMax TTS多语种测试集中，其平均词错误率（WER）指标全面领先MiniMax、ElevenLabs及GPT-4o-Audio-Preview等同类产品。特别在中文、英文、法文等语项的内容稳定性测试中，该模型展现出显著优势。

两款模型均具备高度拟人化的语音表现力，能够根据文本语义自动调节语气节奏，输出自然生动的语音内容。在技术实现上，Qwen3-TTS-VD-Flash允许用户通过声学属性、人设描述、背景信息等自由组合，创造独一无二的定制化声音形象；Qwen3-TTS-VC-Flash则通过强化学习算法，在保持克隆音色特征的同时，显著提升多语种语音生成的准确性。

为方便开发者接入，阿里通义同步开放了Qwen3-TTS-Voice-Design和Qwen3-TTS-Voice-Clone的API文档。这两款模型的推出，标志着语音合成技术从"标准化输出"向"个性化创造"的重要跨越，将为有声内容创作、智能客服、虚拟主播等领域带来全新可能。

02-10

华为年终奖发放时间、发放规则大揭秘！技术岗职能岗差异几何？

02-10

国产“小龙”发力AI Coding：Pony Alpha与Kimi 2.5引领工程化新趋势

02-10

Seedance 2.0惊艳登场：视频生成超逼真，是想象延伸还是真实危机？

02-10

马斯克转发引关注！前百川联创陈炜鹏创业，Loopit成AI应用新宠

02-10

字节Seedance 2.0紧急调整引热议，内测风波下能否守住全球领先地位？

02-10

特斯拉北美销售负责人再离职，核心高管变动背后挑战重重

02-10

快手一月领两张巨额罚单，合规警钟敲响，未来之路挑战重重

02-10

春节归家路迢迢，易至EV3 PLUS以安全舒适伴您畅行每一程

江铃集团新能源易至汽车EV3PLUS，凭借其出色的安全性能、续航能力和舒适体验，成为了众多游子归家的首选。独特的低电量续航保护功能，则能在电量耗尽时继续支持车辆行驶近10km，为驾驶者寻找充电桩提供了宝贵的时…

02-10

小米车主频遭恶意攻击，车企护权引深思，汽车领域偏见之风何时止？

最近小米公布的一组数据，让我忍不住想问：这都什么年代了，怎么还有人干这种事儿？小米通过法律途径帮助车主维权，不仅打击了违法行为，也向社会传递了一个明确信号，恶意破坏他人财产不会逍遥法外，品牌偏见不应转化为违法…

02-10

从《Her》到现实：前百川智能联创焦可创业，用AI音频造主播开启新赛道

一块是主播和内容的AI生成管线，一块是AI音频的指令交互界面，还有一块是长记忆的Infra层，因为AI的记忆既会影响生成的内容是否匹配用户喜好，也会影响推荐分发的准确性。智能涌现：小宇宙之类的播客平台，有…

02-10

2026春节档9部影片来袭！豪华阵容多样题材，预售开启谁将成票房黑马？

《熊猫计划之部落奇遇记》是一部合家欢喜剧冒险电影，融合喜剧、动作与奇幻元素。故事讲述熊猫胡胡与大哥意外闯入神秘原始部落后，胡胡误被族人奉为神兽，为破解部落难题，众人携手闯难关，开启了一段笑点满满、惊喜不断…

02-10

广发上证科创板人工智能ETF表现亮眼，成立以来收益达66.86%

广发上证科创板人工智能ETF成立于2025年1月15日，业绩比较基准为同期上证科创板人工智能指数收益率。该基金成立以来收益66.86%，今年以来收益12.35%，近一月收益0.64%，近一年收益46.77%…

02-10

科创AIETF博时588790开盘上扬2.02%，重仓股多数飘红，澜起科技涨幅领先

来源：新浪基金∞工作室 2月9日，科创AIETF博时（588790）开盘涨2.02%，报0.860元。科创AIETF博时（588790）重仓股方面，金山办公开盘涨1.38%，澜起科技涨4.49%，寒武纪涨2.…

02-10

科创板AI基金表现亮眼：国产AI芯片崛起，应用领域投资潜力持续释放

这支成立于2025年1月6日的基金，以上证科创板人工智能指数收益率为业绩比较基准，成立以来收益已达71.93%，今年以来收益12.12%。该基金的优异表现，反映出市场对人工智能产业的乐观预期，特别是对科创板…

02-10

点击查看更多 +

全站最新

春节归家路迢迢，易至EV3 PLUS以安全舒适伴您畅行每一程

小米车主频遭恶意攻击，车企护权引深思，汽车领域偏见之风何时止？

从《Her》到现实：前百川智能联创焦可创业，用AI音频造主播开启新赛道

2026春节档9部影片来袭！豪华阵容多样题材，预售开启谁将成票房黑马？

科创板AI基金表现亮眼：国产AI芯片崛起，应用领域投资潜力持续释放

极氪主动召回3.83万辆车：以技术护航安全，用责任诠释担当

热门内容

本栏最新

春节归家路迢迢，易至EV3 PLUS以安全舒适伴您畅行每一程

小米车主频遭恶意攻击，车企护权引深思，汽车领域偏见之风何时止？

从《Her》到现实：前百川智能联创焦可创业，用AI音频造主播开启新赛道

2026春节档9部影片来袭！豪华阵容多样题材，预售开启谁将成票房黑马？

科创板AI基金表现亮眼：国产AI芯片崛起，应用领域投资潜力持续释放

2026汽车股冰火交织：寒意中逆势上涨，洗牌期谁将破局突围？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.