在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,发布讯飞星火大模型最新技术升级及系列创新产品,为AI产业红利兑现描绘出清晰路径。科大讯飞董事长刘庆峰指出,AI技术要想真正服务于社会,需突破自主可控、软硬一体、行业纵深和个性化四大核心挑战。目前,这一战略已取得实质性进展——在300余个与头部企业联合打造的“开箱即用”智能体中,涌现出多个具备行业标杆意义的“AI员工”。其中,“星火行业分析师”通过工信部认证考试,在《大数据分析师技术水平考试》中以92分超越85%的人类考生,成为国内首个获此殊荣的行业分析AI应用。

深度推理大模型讯飞星火X1.5的发布成为技术突破的焦点。该模型采用MoE架构,总参数量达293B、激活参数量30B,推理效率较前代提升100%,在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力六大核心领域全面对标国际主流,其中数学能力持续保持领先。其多语言能力覆盖130余个语种,整体性能达GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。更值得关注的是,科大讯飞在自主可控的全国产算力平台上攻克两大技术难题:长思维链强化学习训练效率从30%提升至84%以上,MoE模型全链路训练效率实现质的飞跃,为AI技术自主化奠定坚实基础。全球首发的非自回归语音大模型架构通过并行输出技术,使推理成本下降520%,效果提升16%,开辟了语音交互新范式。
软硬一体化解决方案的推出,标志着AI技术从实验室走向真实场景的关键跨越。科大讯飞发布的软硬件融合方案整合AI与麦克风阵列、扬声器阵列、摄像头阵列及视觉呈现技术,形成多维度交互生态。在办公场景中,讯飞智能办公本X5首创上4下4环八麦克风阵列,抗噪能力超越iPhone 17 Pro,高噪环境下识别准确率达95.08%;讯飞AI翻译耳机采用单耳三麦多感融合降噪系统,复杂噪声下识别准确率高达97.1%;讯飞双屏翻译机2.0在90dB噪音环境中仍保持98.69%的识别率。而全球首个软硬一体讯飞同传麦克风支持自动翻译免切换,同传播报首响延迟低于2秒,并可私有化部署。在视觉与健康领域,讯飞AI黑板搭载圆偏类自然光护眼大屏,视觉疲劳降低50%,130度超宽域显示确保每个学生清晰观看;AI学习机集成微纳米类纸屏等技术,获国内外10余项权威护眼认证。

多模态交互技术的突破让AI真正“懂人”。数字人导览“小飞”现场演示了其跨模态交互能力:支持多人多语种对话、基于历史信息的个性化推荐、购票订酒店等任务执行。这一成果源于讯飞在麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆、情感语义八大技术领域的突破。其中,个性化记忆技术通过构建用户画像库,综合分析长期行为、近期反馈与短期对话,实现精准交互;百变声音复刻技术仅需1句录音即可复刻任意音色,1条指令即可创造任意风格声音,为情感交互开辟新可能。刘庆峰强调:“超拟人多模态交互将成为AI进入家庭的标配,让技术真正服务于人的情感与需求。”
在应用场景拓展方面,科大讯飞展示了AI技术对教育、医疗、汽车、办公及情感陪伴等领域的深度赋能。教育领域,星火大模型构建了由3大类、3层级、4000+标签构成的错因体系,通过智能批阅机与教师助手实现“小时级闭环”教学范式变革,获国家数学课程标准修订组专家组权威认证。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层医疗机构诊断合理率从87%提升至96%,病历书写时间减半;个人AI健康助手“讯飞晓医”支持解析99%医学报告,累计完成1.6亿次健康咨询。汽车领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,实现用户偏好记忆与5项体征实时监测,打造“第三空间”。办公领域,智能办公本X5与听见APP升级会议纪要生成功能,手写纪要与AI纪要深度融合,更贴合用户习惯。情感陪伴方面,“AI星朋友”以4.35MOS高保真声音克隆与160余种人设模型,通过自学习情感模型主动关怀用户,将科幻场景带入现实。
生态建设层面,科大讯飞启动“星火点亮全球”计划,携手多国合作伙伴推动AI技术红利共享。2025年AI开发者大赛吸引17国36,898个团队参与,催生4,622个垂类智能体;讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。面向开发者,科大讯飞开源原生支持RPA的智能体平台Astron,将AI大脑与RPA手脚结合,提供八大行业智能体,助力中国开发者构建自主可控的创新生态。刘庆峰表示:“AI不仅是技术,更是赋能每个人融入世界、创造温暖未来的力量。让AI更懂你,成就更好的你,这是我们的初心。”













