在2025科大讯飞1024开发者节上,一款名为“小飞”的多模态数字人导览正式亮相,标志着人工智能服务迈入全新阶段。这款数字人突破了传统交互的边界,不仅能够实现多语种自由对话,还能根据场景变化切换“林黛玉”等多样化虚拟形象,为用户提供更具沉浸感的服务体验。
据科大讯飞介绍,“小飞”的核心优势在于其高度智能化的多模态交互能力。通过融合远场语音识别、3D视觉感知、情感语义理解等八项核心技术,它能够精准捕捉用户需求,甚至记住访客的历史交互信息,提供个性化提醒服务。例如,当用户再次到访时,“小飞”会主动提及之前的偏好或未完成的事项,让服务更具温度。
科大讯飞董事长刘庆峰在发布会上强调,AI技术正从“工具型应用”向“空间智能伙伴”进化。“小飞”的诞生正是这一趋势的体现——它不再局限于屏幕内的操作,而是能够感知物理空间的变化,理解人类情感的细微差异,从而提供更贴近真实场景的服务。
除了数字人导览,科大讯飞还同步推出了基于星火语音大模型的“百变声音复刻”技术。用户只需录制一句话,即可高保真复刻任意音色,并通过简单指令调整声音风格。这一突破为有声内容创作、个性化语音服务等领域开辟了新可能,未来每个人都能拥有专属的“数字声音”。











