在2025科大讯飞1024开发者节上,一款名为“小飞”的多模态数字人导览正式登场,标志着人工智能服务向真实物理空间迈出重要一步。这款数字人突破了传统问答交互的局限,不仅能够与多人进行自由对话,还支持多语种实时交流,更具备个性化记忆功能——通过记录访客历史信息,提供诸如天气提醒、日程建议等贴心服务。
“小飞”的核心竞争力源于八项技术的深度融合,包括远场语音识别、3D视觉感知、情感语义理解等。科大讯飞董事长刘庆峰在现场演示中强调,这些能力让AI不再是手机里的应用程序,而是能感知环境、理解情绪的“类人”伙伴。例如,当访客用方言提问时,“小飞”可自动切换方言模式;当检测到用户情绪低落时,它会主动调整语气并推荐舒缓音乐。
更令人瞩目的是其形象变换功能。通过动态骨骼绑定技术,“小飞”能在0.5秒内切换为林黛玉、宇航员等数十种虚拟形象,甚至可根据场景需求调整服饰细节。在文旅场景中,它可化身历史人物讲解文物故事;在教育场景中,则能扮演虚拟教师进行互动教学。
同期发布的“百变声音复刻”技术同样引发关注。该技术基于星火语音大模型,用户仅需提供10秒原始音频,即可生成高保真数字音色。更突破性的是,通过指令调整可自由改变声音风格——同一音色既能演绎新闻播报的庄重感,也能切换为动漫角色的俏皮腔调。这项技术已与多家有声读物平台达成合作,未来用户上传声音后,可自动生成个人专属有声书库。
技术团队透露,声音复刻的保真度达到98.7%,情感表现力较传统技术提升40%。在现场测试中,系统成功复刻了跨年龄、跨性别的声音特征,甚至能模拟特定疾病患者的发声状态。这项突破或将重塑内容创作生态,从播客制作到虚拟偶像运营,都将迎来个性化定制的新时代。











