近期,Qwen-TTS语音合成技术取得了显著进步,通过Qwen API平台发布了其最新版本,极大地丰富了用户的语音合成体验。
新版本中,Qwen-TTS实现了对三种中文方言的突破性支持,涵盖了北京话、上海话和四川话,这一创新拓展了其应用场景的边界。该模型基于庞大的语料库训练而成,语料库规模超过300万小时,确保了合成语音的自然度和表现力接近人类水平。Qwen-TTS不仅具备高精度的语音合成能力,还能智能调整韵律、节奏和情绪,使得生成的语音更加生动、富有感染力。
在音色方面,Qwen-TTS提供了多样化的选择,现已支持七种中英双语音色,包括Cherry、Ethan等通用音色,以及专为方言设计的特色音色,如北京话的Dylan、上海话的Jada和四川话的Sunny。用户可以根据实际需求,轻松选择最适合的音色进行语音合成。
实际应用中,Qwen-TTS展现出了卓越的性能。无论是描绘日常生活场景,还是传达细腻复杂的情感,它都能生成自然且流畅的语音。例如,使用Dylan音色合成关于童年游戏的北京话语音时,充满了童真与活力;而采用Jada音色合成上海话的生活琐事对话,则彰显出地道的上海风情。
Qwen-TTS的开发团队还透露,他们致力于持续优化模型性能,并计划未来引入更多语言和语音风格,以满足用户日益增长的多样化需求。同时,团队提供了简洁易用的API接口,方便开发者将Qwen-TTS集成至各类应用中,进一步拓宽了其应用场景。
有关Qwen-TTS的更多信息,可访问官方帮助文档:https://help.aliyun.com/zh/model-studio/qwen-tts