今日,科大讯飞在上海外滩世界会客厅举办新品发布会,正式推出具备60种语言同声传译能力的AI翻译耳机。这款产品融合声音复刻技术与多模态AI降噪系统,定位为“多语言耳畔智能体”,旨在通过端到端AI技术重构跨语言沟通场景。
硬件设计方面,耳机采用开放式结构,搭载单耳三麦克风阵列。其中2个数字硅麦克风负责捕捉环境音与语音细节,1个骨传导麦克风则通过采集骨振动信号实现精准拾音。配合ENC降噪算法,系统可在近场通话时屏蔽环境噪音,远场交流时智能追踪音源方向,确保拾音距离达5-8米。据现场演示,即使在嘈杂展会现场,耳机仍能清晰分离人声与背景音。
翻译功能依托端到端AI同传大模型,可处理多义词、歧义句等复杂语言场景。内置超10万条专业术语库,覆盖医疗、制造、金融等20余个行业。双向对话模式下,用户可实时查看原文与译文,支持视频会议、网络通话等场景的同步传译。特别设计的“双通道独立同声传译”功能,允许两位使用者各戴单耳设备进行无按键对话,系统自动识别发言方向并切换翻译声道。
声音复刻技术是该产品的核心亮点之一。通过零样本学习算法,系统可在10分钟内完成用户音色建模,复刻相似度超90%。这项技术不仅保留声纹特征,还能根据语境调整语调,使翻译语音更接近真人表达。在商务会议场景中,用户可选择将译文转为文字记录,便于会后整理关键信息。
应用场景覆盖线上线下全维度:线上支持讲座直播、远程谈判的实时传译;线下可处理5-8米范围内的多人对话,通过AI算法自动识别发言者位置。耳机集成私人AI助手功能,支持语音记事、博客录制等扩展应用,SIM卡插槽设计更确保了独立通话能力。