字节跳动旗下Seed团队近日宣布,正式推出新一代原生全双工语音大模型Seeduplex,该模型已在豆包App完成全量部署。这一技术突破标志着语音交互领域向"边听边说"的自然对话模式迈出关键一步。
区别于传统半双工模型"先听后说"的交互逻辑,Seeduplex采用全双工架构实现"听""说"同步进行。这种设计使系统能够实时解析用户语音输入,同时生成自然流畅的语音回应,有效消除传统对话中的延迟感。测试数据显示,新模型在对话节奏把控和抗干扰能力方面表现突出,即使在背景噪音或多人对话场景下,仍能保持精准的语义理解和连贯的语音输出。
技术团队透露,Seeduplex的研发重点在于突破传统语音模型的时序处理瓶颈。通过构建动态注意力机制和上下文感知模块,模型能够根据对话内容实时调整响应速度,在快速应答与深度思考之间取得平衡。这种特性使系统既能处理日常闲聊,也能应对需要逻辑推理的复杂对话场景。
目前用户已可在豆包App体验完整功能。实际测试表明,在交通噪声、背景音乐等干扰环境下,Seeduplex的语音识别准确率较前代提升37%,对话中断后恢复的流畅度提高42%。这些改进显著增强了移动场景下的语音交互实用性,为智能助手、在线教育等领域的应用开辟了新可能。








