豆包语音对话功能近日完成重要升级,新增四种方言交互能力,覆盖粤语、四川话、东北话及陕西话。用户通过豆包App发送文字或语音指令,选择"温柔桃子"升级版音色后,即可体验方言对话服务。该功能突破传统语音助手单音色限制,依托方言迁移技术实现单一音色流畅切换多种方言,系统会根据对话场景自动识别用户意图并调整方言类型。
技术团队介绍,方言交互功能采用深度神经网络架构,通过海量方言数据训练构建语言模型。实测显示,系统对方言语音的识别准确率达92%以上,能精准解析方言特有的词汇结构和语法特征。例如在回应粤语用户时,不仅使用标准粤语发音,还会自然融入"唔该""啱啱好"等地域特色表达,使对话更贴近真实交流场景。
针对方言理解能力,豆包同步升级了ASR语音识别模块,现已支持上海话、南京话等18种方言的语音转文字功能。该模块通过多模态融合技术,将方言语音特征与语义理解深度结合,在嘈杂环境下仍能保持87%的识别准确率。测试数据显示,系统处理方言语音的响应速度较旧版提升40%,特别优化了老年用户常用的生活场景词汇库。
产品负责人表示,方言功能开发源于对多元用户需求的深度洞察。调研发现,35%的老年用户更习惯使用方言交流,在医疗咨询、生活服务等场景存在沟通障碍。此次升级重点优化了方言语音的韵律特征,通过调整语调起伏和停顿节奏,使机器语音更接近真人对话效果。目前方言功能已覆盖全国主要方言区,后续将持续扩展方言种类和适用场景。
技术文档显示,方言迁移技术采用分层编码架构,将语音特征分解为基础音色层和方言特征层。这种设计既保留了"温柔桃子"音色的统一性,又通过动态加载方言特征包实现灵活切换。在连续对话场景中,系统能根据用户前序用语自动判断方言类型,无需每次重复指定。例如用户先用粤语提问后,系统会自动保持粤语回应模式直至对话结束。










