在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,发布了讯飞星火大模型最新技术升级及系列创新产品,全面展现了AI技术从实验室走向产业化的清晰路径。科大讯飞董事长刘庆峰在发布会上指出,AI技术的规模化应用需突破自主可控、软硬一体、行业纵深和个性化四大核心挑战,目前已在多个领域取得实质性进展。

此次发布的深度推理大模型讯飞星火X1.5成为技术亮点。该模型采用MoE架构,总参数量达293B,激活参数量30B,推理效率较前代提升100%。其六大核心能力——语言理解、文本生成、知识问答、逻辑推理、数学能力和代码能力——全面对标国际主流模型,其中数学能力持续保持领先。多语言支持覆盖130个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。更值得关注的是,星火X1.5在国产算力平台上攻克了两大技术瓶颈:长思维链强化学习训练效率从30%提升至84%以上,MoE模型全链路训练效率实现质的飞跃,为自主可控的AI发展奠定了坚实基础。
在原创技术领域,科大讯飞全球首发非自回归语音大模型架构,通过并行输出技术将推理效率提升16%,同时降低520%的推理成本。这一突破使得语音交互更加高效经济,为大规模商用提供了可能。星火X1.5还首发了个性化记忆与百变声音复刻两大功能。前者通过构建用户记忆库,实现长期画像、近期反馈和短期对话的综合理解;后者基于星火语音大模型,仅需一句录音即可复刻任意音色,并支持指令式风格创造。
软硬一体化解决方案是此次发布的另一大重点。科大讯飞推出了融合AI与多传感器阵列的软硬件一体方案,覆盖麦克风、扬声器、摄像头和视觉呈现等多个维度。例如,讯飞智能办公本X5采用上4下4环八麦克风阵列,在高噪环境下识别准确率达95.08%,远超iPhone 17 Pro;讯飞AI翻译耳机首创单耳三麦多感融合降噪系统,复杂噪声下识别准确率高达97.1%;讯飞双屏翻译机2.0在90dB噪音下识别率达98.69%。业界首个软硬一体的讯飞同传麦克风支持自动翻译免切换,首响延迟低于2秒,并可私有化部署。

在扬声器阵列技术方面,科大讯飞通过自研硬件算法实现了立体空间声场重构。搭载该技术的智能座舱音响方案iFLYSOUND已在19家车企量产,出货量超100万台,车内音效媲美百万豪车。视觉健康领域同样取得突破:讯飞AI黑板搭载全球首款圆偏类自然光护眼大屏,视觉疲劳降低50%,显示角度达130度;讯飞AI学习机集成微纳米类纸屏等多项技术,获得国内外10余项护眼认证。
多模态交互能力的提升是AI融入真实世界的关键。数字人导览“小飞”展示了八项突破性技术:麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆和情感语义。这些技术的联动使AI不再局限于软件层面,而是成为更具情感深度和应用价值的伙伴。刘庆峰强调:“超拟人多模态交互将是未来AI进入家庭的标准配置。”
在应用场景方面,科大讯飞展示了AI在教育、医疗、汽车、办公和情感陪伴等领域的深度实践。教育领域,星火大模型构建了由3大类、3层级、4000+标签构成的错因体系,通过智能批阅机和教师助手实现作业批改到课堂因材施教的“小时级闭环”。医疗领域,星火医疗大模型达到主任级医师水平,人机协同使诊断合理率从87%提升至96%,病历书写时间减半。汽车领域,星火智慧座舱2.0融合13个摄像头和54维记忆锚点,提供5项体征实时监测,打造“第三空间”。办公领域,讯飞听见APP和智能办公本X5支持说话人识别自动生成会议纪要,手写纪要与AI纪要深度融合。情感陪伴方面,“AI星朋友”拥有高保真声音克隆和160种人设模型,通过自学习情感模型主动互动,让科幻场景成为现实。
为推动AI生态繁荣,科大讯飞启动了“星火点亮全球”计划,并与多国合作伙伴签署协议。该计划依托星火的多语言和自主可控技术,为全球提供AI发展的“第二种选择”。同时,科大讯飞全面开源首个原生支持RPA的智能体平台Astron,将Agent与RPA结合,提供八大行业智能体,助力开发者跨越AI应用鸿沟。目前,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%,AI开发者大赛吸引来自17个国家的36,898个团队参与,涌现出4,622个垂类智能体。














