在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,推出讯飞星火大模型最新技术升级及系列创新产品,为AI产业红利的全面落地描绘出清晰蓝图。科大讯飞董事长刘庆峰在会上指出,AI技术的规模化应用需突破自主可控、软硬融合、行业深耕与个性化服务四大核心挑战,并展示了公司在这些领域的突破性成果。
此次发布的深度推理大模型讯飞星火X1.5成为全场焦点。该模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数300亿,推理效率较前代提升100%。其语言理解、文本生成、逻辑推理等六大核心能力全面对标国际顶尖水平,数学能力持续领先,多语言支持覆盖130个语种,整体性能达GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。基于全国产算力平台,科大讯飞攻克了长思维链强化学习训练效率从30%提升至84%的关键技术,并实现MoE模型全链路训练效率的质的飞跃,为AI技术自主可控奠定坚实基础。公司全球首发的非自回归语音大模型架构,通过并行输出文本序列,将推理成本降低520%,效果提升16%。
软硬一体化解决方案的推出,标志着AI技术向真实场景的深度渗透。科大讯飞发布的智能办公本X5搭载上4下4环八麦克风阵列,在强噪音环境下识别准确率达95.08%,超越iPhone 17 Pro;AI翻译耳机采用单耳三麦多感融合降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0在90dB极端噪音中仍保持98.69%的识别率。同传麦克风则实现自动翻译免切换,首响延迟低于2秒,支持私有化部署。在音频呈现领域,iFLYSOUND智能座舱音响方案通过立体空间声场重构技术,已量产应用于19家车企,累计出货超100万台,车内音效比肩百万级豪车。视觉健康方面,AI黑板搭载圆偏类自然光护眼大屏,视觉疲劳降低50%,130度超宽显示确保教室全域清晰;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证。
多模态交互能力的突破重新定义了人机协作边界。数字人导览“小飞”现场演示了多人多语种对话、个性化推荐及任务执行能力,其背后是麦克风远场识别、3D视觉感知、视听觉融合理解等八项核心技术的协同。星火X1.5首发的个性化记忆功能,通过构建用户画像库,实现长期偏好、近期反馈与短期对话的综合理解;百变声音复刻技术则基于星火语音大模型,仅需1秒录音即可复刻任意音色,并支持风格化声音创造。刘庆峰强调:“超拟人多模态交互将成为AI进入家庭的标准配置。”
在应用场景拓展方面,科大讯飞展示了AI技术在教育、医疗、出行等领域的深度实践。教育领域,星火大模型构建的错因体系获国家数学课程标准修订组专家权威认证,通过智能批阅机与教师助手实现作业批改到课堂教学的“小时级闭环”。医疗领域,星火医疗大模型专科诊疗能力达三甲医院主任级水平,人机协同使基层诊断合理率从87%提升至96%,病历书写效率翻倍;“智医助理医院版1.0”与个人健康助手“讯飞晓医”同步升级,后者已累计完成1.6亿次健康咨询。出行领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供体征监测与个性化服务,将汽车打造为“第三生活空间”。办公场景中,智能办公本X5与听见APP实现会议纪要自动生成,手写内容与AI纪要深度融合;情感陪伴领域,“AI星朋友”凭借4.35MOS高保真声音克隆与160种人设模型,通过自学习情感模型主动互动,让科幻场景成为现实。
生态建设层面,2025年科大讯飞AI开发者大赛吸引全球17国36,898支团队参与,催生4,622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。公司正式开源原生支持RPA的智能体平台Astron,将决策大脑与执行手脚结合,提供八大行业智能体,助力开发者跨越AI应用门槛。发布会最后,科大讯飞联合多国伙伴启动“星火点亮全球”计划,依托多语言与自主可控技术,推动AI红利全球共享,为世界提供技术发展的“第二选择”。






