在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式推出讯飞星火大模型最新技术升级及系列创新产品,系统勾勒出AI产业红利落地的清晰路径。董事长刘庆峰在演讲中强调,AI技术的规模化应用需突破自主可控、软硬融合、行业深耕与个性化服务四大核心挑战。目前,这一战略已取得实质性进展——通过与行业头部企业联合打造的300余个“开箱即用”智能体中,已涌现出多个标杆级“AI员工”。其中,“星火行业分析师”成为国内首个通过工信部认证的行业分析AI应用,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。

发布会上,深度推理大模型讯飞星火X1.5成为焦点。该模型采用MoE架构,总参数量达293B,激活参数30B,推理效率较前代提升100%,在语言理解、文本生成、逻辑推理等六大核心能力上全面对标国际主流,数学能力持续保持领先。其多语言支持覆盖130余个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。值得关注的是,星火X1.5在自主可控的全国产算力平台上实现两大技术突破:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率获得质的提升。科大讯飞全球首发的非自回归语音大模型架构,通过并行输出文本序列,将推理成本降低520%,效果提升16%。
软硬一体化解决方案的发布,标志着AI技术向真实场景的深度渗透。科大讯飞推出的“AI+麦克风阵列技术”在智能办公本X5上实现创新应用——其首创的上4下4环八麦克风阵列具备超强抗噪能力,识别准确率在高噪环境下达95.08%,远超iPhone 17 Pro;AI翻译耳机搭载的单耳三麦多感融合降噪系统,在复杂噪声中识别准确率高达97.1%;双屏翻译机2.0的强降噪模式,即使在90dB噪音环境下仍保持98.69%的识别率。另一项突破性技术“AI+扬声器阵列”则通过立体空间声场重构,使智能座舱音响方案iFLYSOUND的车内音效媲美百万级豪车,该技术已在19家车企量产,累计出货超100万台。
多模态交互能力的升级成为发布会另一亮点。数字人导览“小飞”现场演示了其跨模态交互实力:支持多人多语种对话、基于历史数据的个性化推荐,并能独立完成购票、订酒店等复杂任务。这一体验背后,是讯飞在麦克风远场识别、3D视觉感知、视听觉融合理解等八项技术上的突破。刘庆峰特别提到两项首发技术:个性化记忆能力通过构建用户专属记忆库,实现长期画像、近期反馈与短期对话的综合理解;百变声音复刻技术则基于星火语音大模型,仅需1秒录音即可复刻任意音色,并支持通过指令创造多样化声音风格。

在应用场景拓展方面,科大讯飞展示了AI技术在教育、医疗、出行等领域的深度实践。教育领域,星火大模型构建的错因体系包含3大类、3层级、4000余个标签,通过智能批阅机与教师助手实现“作业批改-课堂施教”小时级闭环,获国家数学课程标准修订组专家权威认证。医疗领域,星火医疗大模型在专科诊疗能力上达到三甲医院主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半。出行领域,星火智慧座舱2.0通过13个摄像头与54维记忆锚点记住用户偏好,提供体征监测与个性化服务,将汽车打造为“第三生活空间”。办公场景中,智能办公本X5的手写纪要与AI纪要深度融合,听见APP则能基于说话人识别自动生成会议纪要与待办事项。
生态建设层面,科大讯飞宣布全面开源首个原生支持RPA的智能体平台Astron,该平台将AI大脑与RPA执行能力结合,提供八大行业智能体,助力开发者跨越应用开发鸿沟。数据显示,2025年AI开发者大赛吸引17国3.6万余团队参与,涌现4622个垂类智能体;讯飞开放平台开发者总数达968万,近一年新增200万,其中大模型企业开发者增长125%。发布会最后,科大讯飞携手多国合作伙伴启动“星火点亮全球”计划,旨在通过多语言技术与自主可控方案,为全球提供AI发展的替代性选择,加速技术红利普惠共享。


























