ITBear旗下自媒体矩阵:

B站AI原声翻译上线,海外用户尽享多语种原汁原味视频体验

   时间:2025-08-02 16:39:55 来源:鞭牛士编辑:快讯团队 IP:北京 发表评论无障碍通道
 

近期,哔哩哔哩(B站)在国际市场上的动向备受瞩目。自今年5月宣布将国际版APP与国内版合并后,B站的一系列举措预示着其海外扩张战略的深化。

在世界人工智能大会上,B站展示了专为海外用户研发的“AI原声翻译”功能,旨在提升海外用户对于游戏、科技、二次元等核心内容的体验。随着APP合并的完成、海外用户页面的多语种适配,尤其是“AI原声翻译”功能的上线,B站似乎已蓄势待发,准备在海外市场大展拳脚。

此次发布的“AI原声翻译”功能,不仅实现了中文字幕到英文的自动转换、弹幕翻译及界面元素的英文适配,更突破性地还原了UP主的声线、音色及语气,避免了传统机器翻译的生硬感。同时,该功能还能根据翻译语言模拟口型,使得中文用户观看外语UP主视频,或海外用户观看中文UP主视频时,都能享受到近乎“本地化”的观看体验。未来,B站还计划将日语等更多语言纳入“AI原声翻译”功能,进一步提升在海外市场的适应性。

据了解,B站“AI原声翻译功能”中的跨语言声音还原技术,得益于内部代号为“IndexTTS2”的语音生成模型。该模型采用了一种创新且通用的方法,能够兼容自回归架构,实现对语音时长及情感的精准控制。通过指定token数量,模型能够精确调控语音时长,降低翻译难度。同时,模型还成功解耦了情感表达与说话人身份,高质量地复刻了原片语音中的情感。

面对“AI原声翻译功能”中的核心挑战,尤其是在游戏、二次元等专有名词和梗点密集的领域,B站技术团队基于大语言模型构建了翻译引擎。他们独创性地结合了语音时长匹配、原声翻译标准与UP主独特风格,构建了多目标奖励模型,并采用对抗式强化学习训练,推动模型不断进化与精准适配。团队还引入了Deep Research深度挖掘技术,专注于专有名词与流行梗点的翻译难点,确保译文准确、地道且传神。在字幕擦除方面,团队结合了先进的多模态大模型OCR技术和基于STTN网络的视频重绘技术,实现了字幕区域的精准检测与高还原度擦除。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version