ITBear旗下自媒体矩阵:

B站推出AI原声翻译,海外用户将享原汁原味多语种视频体验

   时间:2025-08-02 17:44:01 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

哔哩哔哩(B站)近期在国际业务布局上迈出了重要一步,宣布将原国际版APP与国内版合并,并针对海外用户推出了一系列创新功能。这一变动引发了业界的广泛关注。

在世界人工智能大会上,B站揭晓了其专为海外用户设计的“AI原声翻译功能”,旨在提升海外用户在游戏、科技、二次元等领域的观看体验。随着APP合并的完成,海外用户页面实现了多语种适配,特别是视频原声翻译功能的上线,标志着B站已整装待发,准备深入拓展海外市场。

此次发布的“AI原声翻译”功能,不仅涵盖了基础的文本互译,如自动替换中文字幕为英文、弹幕翻译及按钮英文适配,更实现了对UP主声音特征的高度还原,包括声线、音色和气口,而非采用传统的机器音。该功能还能根据翻译语言模拟口型,使得无论是中文用户观看外语UP主视频,还是海外用户观看中文UP主视频,都能享受到如同本地化的观看体验。未来,B站计划将日语等其他语言纳入“AI原声翻译”功能,进一步增强其在海外市场的适应能力。

据了解,B站的“AI原声翻译功能”背后的跨语言声音还原技术,源自其内部研发的“IndexTTS2”语音生成模型。该模型采用了一种创新的、通用的且与自回归架构兼容的语音时长及情感控制方法,能够精确调控语音时长,降低翻译难度。同时,该模型有效分离了情感表达与说话人身份,确保了高质量地复制原片语音中的情感。

面对“AI原声翻译功能”中的核心挑战,尤其是在游戏、二次元等领域中保留原风格与语音时长的精准对应,B站技术团队构建了基于大语言模型(LLM)的翻译引擎,并创造性地设计了多目标奖励模型,该模型结合了语音时长匹配、原声翻译标准与UP主独特风格。团队还采用了对抗式强化学习(RL)训练,推动模型持续进化与精准适配。同时,引入Deep Research深度挖掘技术,专注于专有名词与流行梗点的翻译,确保译文准确、地道且生动。

在字幕擦除方面,B站结合了先进的多模态大模型OCR技术和基于STTN网络的视频重绘技术,实现了字幕区域的精确检测与高保真擦除,为用户提供了更加流畅的观看体验。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version