在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式发布讯飞星火大模型最新技术突破及系列创新产品,系统描绘了AI技术赋能千行百业的实践路径。此次发布不仅展现了中国AI企业在自主可控领域的硬实力,更通过多模态交互、软硬一体等创新方案,为全球AI发展提供了“中国方案”。

发布会上,深度推理大模型讯飞星火X1.5成为焦点。该模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数量300亿,推理效率较前代提升100%,在语言理解、数学能力等六大核心维度全面对标国际顶尖水平,其中数学能力持续保持全球领先。值得关注的是,星火X1.5在多语言支持上实现重大突破,覆盖130余个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。更令人振奋的是,该模型在国产算力平台上攻克了两大技术难题:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现质的飞跃,为AI自主可控奠定了坚实基础。科大讯飞全球首发的非自回归语音大模型架构,通过并行输出技术将推理成本降低520%,效果提升16%,重新定义了语音交互的效率标准。
软硬一体化解决方案的推出,标志着AI技术正式迈向真实场景落地阶段。科大讯飞发布的“AI+麦克风阵列”技术,通过八麦克风环形布局实现超强抗噪能力,其智能办公本X5在高噪环境下的识别准确率达95.08%,远超iPhone 17 Pro;AI翻译耳机采用单耳三麦融合降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0更是在90分贝噪音中保持98.69%的识别率。在扬声器阵列领域,搭载空间声场重构技术的iFLYSOUND智能座舱音响方案,已与19家车企达成量产合作,累计出货超100万台,车内音效媲美百万级豪车。视觉健康领域同样亮点纷呈:AI黑板搭载的圆偏类自然光护眼大屏,使视觉疲劳降低50%,130度超宽视角确保教室全覆盖;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证,重新定义了教育硬件的健康标准。
多模态交互能力的突破,让AI从“工具”进化为“伙伴”。数字人导览员“小飞”现场演示了其八大核心技术能力:通过麦克风远场识别、3D视觉感知等技术实现多人多语种对话;基于用户历史数据提供个性化推荐;独立完成购票、订酒店等复杂任务。更引人注目的是两大首发技术:个性化记忆库通过综合分析用户长期画像、近期反馈和短期对话,实现真正“懂你”的交互体验;百变声音复刻技术仅需1秒录音即可克隆任意音色,并支持风格化声音创作。科大讯飞董事长刘庆峰强调:“超拟人多模态交互将成为未来家庭AI的标配,让技术更具情感温度。”

在应用场景拓展方面,科大讯飞展示了AI技术深度融入教育、医疗、出行、办公等领域的创新实践。教育领域,星火大模型构建的4000+标签错因体系通过权威鉴定,其智能批阅机和教师助手实现“作业批改-课堂施教”小时级闭环,引领教学范式变革;医疗领域,星火医疗大模型达到主任级医师诊疗水平,人机协同使基层诊断合理率提升9个百分点,病历书写时间减半,“智医助理医院版1.0”和“讯飞晓医”健康助手正式服务公众;出行领域,星火智慧座舱2.0通过54维记忆锚点记住用户偏好,提供体征监测等5项健康服务,重新定义汽车“第三空间”;办公领域,智能办公本X5和听见APP实现会议纪要自动生成,手写内容与AI纪要深度融合;情感陪伴领域,“AI星朋友”凭借160种人设模型和自学习情感引擎,可主动发起电话交流,让科幻场景成为现实。
生态建设方面,科大讯飞宣布全面开源原生支持RPA的智能体平台Astron,该平台整合“大脑”决策与“手脚”执行能力,提供八大行业智能体模板,助力开发者跨越AI应用门槛。数据显示,2025年AI开发者大赛吸引17国3.6万余团队参与,诞生4622个垂直领域智能体,讯飞开放平台开发者总数突破968万,近一年新增200万,其中大模型企业开发者增长125%。发布会最后,科大讯飞携手多国合作伙伴启动“星火点亮全球”计划,旨在通过多语言技术和自主可控方案,构建开放共赢的AI生态,加速技术红利全球共享。




















