ITBear旗下自媒体矩阵:

豆包语音对话功能升级:单音色灵活切换4种方言 还能听懂18种方言

   时间:2025-11-28 13:29:08 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

豆包语音对话功能近日完成重要升级,新增四种方言对话能力,涵盖粤语、四川话、东北话及陕西话。用户通过豆包App发送文字或语音指令,选择默认的“温柔桃子”升级版音色,即可体验方言对话服务。该功能突破传统语音模型单音色限制,依托方言迁移技术实现同一音色流畅切换多种方言。

技术层面,豆包采用先进的语音模型架构,在保持音色统一性的同时赋予系统智能判断能力。当用户提出方言对话需求时,系统能根据对话语境自动识别意图,并在四种方言间灵活转换。例如用户先用粤语询问天气后,可无缝切换至四川话继续交流,无需重复设置参数。

除输出能力外,该系统在方言识别领域也有突破性进展。通过整合ASR语音转写技术,系统可精准识别上海话、南京话等18种方言口语,并将内容实时转化为标准文本。这项技术革新显著提升了方言交互的准确率,据测试数据显示,复杂语境下的识别错误率较前代产品下降37%。

实际应用场景中,方言对话功能已覆盖生活服务、文化娱乐等多个领域。广州用户可用粤语查询本地美食,成都用户能以四川话讨论川剧变脸技巧,东北用户则可畅聊二人转艺术特色。系统内置的文化知识库包含各地方言特色词汇库,确保对话内容既地道又符合现代语境。

开发团队透露,方言功能的实现依托于大规模方言语音数据库建设。技术人员采集了超过200万小时的方言语音样本,涵盖不同年龄、性别的发音特征。通过深度神经网络训练,系统不仅掌握了方言发音规则,还构建了方言语义理解模型,使对话回应更符合地域文化习惯。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version