ITBear旗下自媒体矩阵:

字节跳动发布中英同声传译模型,Seed LiveInterpret 2.0准确率逼近人类水平

   时间:2025-07-24 14:39:25 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

字节跳动Seed团队近期揭晓了其最新的技术成果——Seed LiveInterpret 2.0,这是一款中英双向的端到端同声传译系统,其延迟与准确率均逼近人类译员的水准,标志着产品级语音同传技术的重大突破。

该系统建立在全双工语音理解与生成框架之上,支持中英互译,并具备实时处理多人语音输入的能力。与人工同传相似,Seed LiveInterpret 2.0能够在接收源语言语音的同时,近乎实时地输出目标语言的翻译语音,实现了“边听边说”的功能。尤为该系统还引入了0样本声音复刻技术,进一步提升了沟通的流畅度和自然度。

在测试中,Seed LiveInterpret 2.0展现出了惊人的性能。面对长达40秒的中文表述,它能够迅速且准确地转化为英语,且延迟极低,翻译过程如丝般顺滑。该系统还具备快速学习并模仿说话人音色的能力,为翻译增添了更多个性化的色彩。

相较于传统的机器同传系统,Seed LiveInterpret 2.0展现出了多方面的优势。其翻译准确率接近专业人类译员,尤其在多人会议等复杂场景中,中英双向翻译的准确率超过了70%,在单人演讲场景下更是达到了80%以上。在延迟方面,该系统采用了全双工框架,使得翻译延迟降低至2-3秒,相比传统系统减少了超过60%,真正实现了实时翻译。

声音复刻技术也是该系统的一大亮点。通过实时采样语音信号并提取声音特征,Seed LiveInterpret 2.0能够以说话人的音色特质实时“说出”外语,极大地增强了交流的沉浸感和亲和力。同时,该系统还能智能地平衡翻译质量、延迟和语音输出节奏,根据语音的清晰度、流畅度和复杂程度调整输出,确保翻译的自然流畅。

目前,Seed LiveInterpret 2.0的技术报告已经对外公布,并基于火山引擎平台开放。据悉,Ola Friend耳机也将在8月底接入该系统,成为首个支持Seed LiveInterpret 2.0的智能硬件设备,为用户提供更为便捷、高效的同声传译体验。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version