滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

阿里推出新语音模型“百聆”：三秒录音实现多语言与情感切换

时间：2025-12-16 00:02:30 来源：CHINAZ编辑：快讯 IP：北京 发表评论无障碍通道

阿里巴巴通义大模型宣布，其 “百聆” 系列语音模型迎来了重大升级，并正式开源。此次更新的两款语音模型，能够在仅需三秒的录音后，实现无缝切换至多达九种语言和十八种方言，包括普通话、粤语、日语、英语等，同时还可以模拟多种情感如开心和愤怒。

在这次升级中，Fun-CosyVoice3模型得到了显著改善。模型的首包延迟降低了50%，大幅提升了中英混说的准确率。模型的音色克隆能力得到了增强，用户只需提供一段三秒以上的录音，便能复刻出相应的音色并合成新语音。此功能的开发使得实时语音助手、直播配音和无障碍阅读等场景变得更加高效和便捷。

Fun-ASR 模型的能力同样得到了提升，噪声环境下的准确率达到了93%。这一模型不仅支持歌词和说唱的识别，还可以进行多语言自由混说，覆盖多种中文方言与口音。为了提升用户体验，流式识别的首字延迟已降低至160毫秒，大幅提升了语音交互的流畅性。

这两款模型均支持本地部署与二次开发，开发者可以根据自己的需求进行定制化调整。开源地址也已公布，用户可以前往相关平台体验和使用这两款语音模型，进一步推动语音技术在各个领域的应用。

GitHub:https://github.com/FunAudioLLM/CosyVoice

划重点:

06-19

钉钉新CEO陈宇森首封全员信：调整组织架构，多位业务负责人确定

PChome 6月18日消息，据晚点LatePost报道，钉钉新任CEO陈宇森发布第一封全员信，他首先对组织架构进行梳理，整合成立新的悟空团队、客户发展部、市场部、核心平台业务部等，并公布相关人事任命，各个业…

06-19

德国一经销商抢先向欧洲出口小米汽车

06-19

小米最新公告：经纪商购回不超过40亿B类普通股

06-19

英伟达CEO黄仁勋：社会全面拥抱AI将有助于改善生活

06-19

网易云音乐旗下AI情感陪伴App“妙时”7月14日0时正式停运

06-19

德国公司计划进口小米SU7、YU7等中国电动车，小米官方否认合作并启动法律程序

06-19

这就回落了？SpaceX股价再跌7%

06-19

培育钻石风口下，黄河旋风、楚江新材等四家企业谁能领跑金刚石散热赛道？

06-19

Transformer奠基人Noam Shazeer再跳槽，从谷歌到OpenAI开启AI架构新征程

06-19

从换电池到全球充电宝巨头，80后夫妻携安克创新冲刺港股IPO

06-19

生成式AI关键人物再跳槽：Noam Shazeer从谷歌转投OpenAI 引领技术新方向

06-19

从文科生到AI巨匠，林俊旸两个月斩获20亿美金估值，开启新传奇

06-19

90后新帅陈宇森上任钉钉一周即行动，五大部门调整开启新管理周期

06-19

理想汽车：当产品优势渐弱，以全栈自研开启底层技术突围之路

06-19

点击查看更多 +

全站最新

钉钉新CEO陈宇森首封全员信：调整组织架构，多位业务负责人确定

Momenta港股IPO备案获批，以物理AI基座模型开启自动驾驶新篇章

传音控股赴港交所递表，2025年营收超655亿，多地区智能机市占领先

苹果CEO库克确认产品将涨价，内存芯片成本飙升成主因

鸿蒙生态新跨越：6600万终端助力，内容创新活力全面迸发

鸿蒙生态助力创意绽放：校园爱好者睿睿成长为系统共创者

热门内容

本栏最新

钉钉新CEO陈宇森首封全员信：调整组织架构，多位业务负责人确定

苹果CEO库克确认产品将涨价，内存芯片成本飙升成主因

拼多多与淘宝价格差异大揭秘：平台定位、供应链、消费需求如何影响定价？

“渝创青春·电商直播新力量”京东杯大赛收官，产教融合助力青年逐梦数字新赛道

钉钉新CEO陈宇森履新首周发全员信，推进组织架构深度调整与业务优化

百度入股深圳欧拉万象，加码家庭具身智能领域布局未来新赛道

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

​阿里推出新语音模型“百聆”：三秒录音实现多语言与情感切换

阿里推出新语音模型“百聆”：三秒录音实现多语言与情感切换