在2025科大讯飞1024开发者节现场,一款具备突破性交互能力的多模态数字人成为焦点。这款名为"小飞"的数字导览员不仅实现了从简单问答到复杂场景服务的跨越,更通过个性化功能重新定义了人机交互的边界。
据现场演示,"小飞"突破了传统数字人的功能局限。其搭载的八项核心技术包括远场语音识别、3D空间感知和情感语义分析,使它能同时与多位用户展开自然对话。更引人注目的是其记忆功能——通过分析访客历史交互数据,"小飞"能主动提供个性化提醒,例如根据用户过往偏好推荐展览路线。
形象定制能力是该数字人的另一大亮点。技术人员现场展示其快速切换虚拟形象的功能,仅需几秒即可从标准形象转变为"林黛玉"等经典角色。这种多形态服务模式不仅提升了用户体验,更为文旅、教育等场景开辟了新的应用可能。
科大讯飞董事长刘庆峰在主题演讲中强调:"我们正在见证AI从工具向伙伴的进化。'小飞'的核心价值在于它能理解物理空间中的情感需求,提供有温度的服务。"这种进化体现在技术架构的革新上——通过融合多模态感知系统,数字人具备了环境适应能力和上下文理解能力。
同步发布的"百变声音复刻"技术同样引发关注。该技术基于星火语音大模型,用户仅需提供10秒语音样本即可完成音色克隆,配合风格转换算法能生成新闻播报、卡通配音等多样化声线。这项突破将使内容创作者拥有专属"声音库",在有声读物、数字人配音等领域催生新的商业模式。
技术团队透露,两项创新成果均已进入商用阶段。"小飞"数字人系统正在博物馆、科技馆等场所进行实地测试,其多语言支持功能特别受到国际游客好评。而声音复刻技术则计划在年内开放个人用户接口,预计将引发内容创作领域的变革。











