滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

B站推出AI原声风格视频配音，自研模型助力多语言自然翻译

时间：2025-08-07 02:46:08 来源：IT之家编辑：快讯 IP：北京 发表评论无障碍通道

Bilibili Index团队近期宣布了一项技术创新，他们成功研发了IndexTTS2模型，并据此推出了“原声风格”视频配音功能。这一功能不仅能够将中文视频内容翻译为外语，更重要的是，配音效果极其贴近原声，仿佛视频中的人物亲自用外语讲述。

据团队介绍，IndexTTS2模型的应用，打破了传统配音中“代言人声线”的单一性，使得配音效果在声音、语气、节奏以及个性表达上，都能与原版视频高度一致。观众在聆听时，会有种视频中人物直接用另一种语言对话的错觉。

该模型的一大创新在于提出了适用于AR系统的“时间编码”机制，这一机制有效解决了传统AR模型在语音时长控制上的不足。在保留AR架构原有优势的同时，如韵律自然性、风格迁移能力及多模态扩展性，新模型还具备了合成定长语音的能力。

团队还运用了一系列先进技术，如音色克隆、声场一致性及多声源融合，这些技术的运用，极大地解决了传统配音中存在的声音人格缺失、字幕干扰及本地化成本高昂等问题。在多说话人场景中，系统对说话人分割、情绪迁移与语速控制进行了优化，并引入了RIVAL对抗式强化学习框架，以提升翻译质量与风格适配度。

更多>同类资讯

宇树科技创始人王兴兴相亲贴引关注列理想伴侣标准求三观契合真诚善良

03-07

雷茂端代表：将70岁以上农民养老金提高到500元

03-07

美智库测算：美国对伊朗战争每天耗资近9亿美元

03-07

南航将恢复3月8日至11日的部分广州⇋迪拜、深圳⇋迪拜航班运行

03-07

国内成品油即将迎来调整窗口期加满一箱油预计多花19.5元

03-07

黄仁勋预言：未来软件全面“智能体化”，传统模式向“Token租赁”转型

03-07

商务部回应安世荷兰禁令：挑起矛盾破坏生产，荷方或担全责

03-07

YouTube私信功能重返欧洲舞台：测试范围扩大，隐私安全引关注

03-07

雷茂端代表：将70岁以上农民养老金提高到500元

03-07

无锡：推动商业航天产业在“十五五”时期成长为覆盖“火箭—卫星—数据—应用”全链条、高韧性的千亿级规模国家级产业集群

03-07

03-07

03-07

03-07

03-07

约旦称已拦截108枚来自伊朗的导弹和无人机

03-07

点击查看更多 +

全站最新

莲花For Me超混SUV来袭！LTS标准加持，百万级操控挑战超豪华市场

全新莲花ForMe插混SUV 3月10日开启小订动力续航底盘配置亮点满满

舍弗勒集团人事新布局：新任COO上任，区域及中国区CEO同步调整

2026款海狮06EV来袭！第二代刀片电池+闪充，续航驾控智能全面升级

比亚迪海豹07EV上市！705km续航+闪充技术，16.99万起售配置拉满

名爵MG2即将亮相古德伍德速度节或搭载半固态电池进军欧洲小车市场

热门内容

本栏最新

特朗普：伊朗今日将遭受沉重打击

半导体再迎大利空？

全球科技新核心赛道崛起——量子科技！

湖州“蓝焱”220吨级液氧甲烷发动机长程试车助力重型运载动力体系构建

市场最害怕的事，发生了？

三大猪企2月生猪销量环比均下降，销售收入环比、同比均下降

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.