ITBear旗下自媒体矩阵:

科大讯飞全新多模态数字人“小飞”上岗,还能“百变声音复刻”

   时间:2025-11-06 17:00:18 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

科大讯飞近日正式推出新一代多模态数字人“小飞”,这款具备高度交互能力的智能导览员已投入实际应用场景。据官方介绍,“小飞”突破了传统数字人单一问答模式,通过多模态交互技术实现自然流畅的多人对话,并支持中英文等多种语言实时切换。

该数字人的核心优势在于个性化服务能力。系统内置的记忆模块可自动记录访客历史交互信息,在后续对话中主动调用相关数据,提供定制化提醒服务。例如当用户再次到访时,“小飞”能准确识别身份并主动询问:“您上次咨询的XX问题,需要我为您更新最新进展吗?”

同步发布的“百变声音复刻”技术引发行业关注。基于星火语音大模型的创新应用,用户仅需提供10秒语音样本即可完成音色克隆,通过参数调节可生成不同年龄、性别、情绪的声音风格。这项技术将数字人语音交互的真实感提升至全新维度,同时为有声内容创作开辟了新路径。

在应用场景拓展方面,科大讯飞展示了多领域解决方案。博物馆导览场景中,“小飞”可同时服务数十名游客,根据展品自动切换讲解语言;教育领域可定制学科专属语音包,为在线课程注入个性化教学元素;企业服务场景则支持会议纪要实时转写与多语言翻译同步输出。

技术团队透露,该系统采用动态神经网络架构,在保持低延迟响应的同时,支持持续学习优化。目前已在文旅、教育、金融等多个行业完成首批部署,用户可通过科大讯飞开放平台申请体验。更多技术细节与应用案例可通过官方网站获取。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version