在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,正式发布讯飞星火大模型最新技术突破及全场景应用方案,同时系统阐释了AI技术从实验室走向产业化的实践路径。科大讯飞董事长刘庆峰在演讲中强调,AI技术的规模化落地需聚焦自主可控、软硬融合、行业深耕与个性化服务四大核心方向,并透露公司联合头部企业打造的300余个“即插即用”智能体中,已涌现出多个具备行业标杆意义的AI应用。

作为本次发布的核心成果,深度推理大模型讯飞星火X1.5首次采用混合专家(MoE)架构,总参数量达2930亿,激活参数量300亿,推理效率较前代提升一倍。该模型在语言理解、数学推理等六大核心能力上全面对标国际领先水平,其中数学能力持续保持全球优势。其多语言支持覆盖130余种语言,整体性能达到GPT-5的95%以上,在拉美、东盟等14个区域的语言效果实现反超。更值得关注的是,星火X1.5在国产算力平台上攻克了两大技术瓶颈:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现指数级提升,为AI技术自主可控奠定基础。
在原创技术领域,科大讯飞全球首发的非自回归语音大模型架构引发行业关注。该架构通过并行生成文本序列,将推理效率提升16%的同时,使计算成本降低520%。这一突破使得语音交互的实时性和经济性得到质的飞跃,为大规模商业化应用扫清障碍。
软硬一体化解决方案成为本次发布的另一大亮点。科大讯飞推出的“AI+硬件”融合方案,将麦克风阵列、扬声器阵列、摄像头模组与视觉呈现技术深度整合。其中,智能办公本X5搭载的环八麦克风阵列实现95.08%的高噪环境识别率,超越iPhone 17 Pro;AI翻译耳机首创单耳三麦降噪系统,复杂噪声下识别准确率达97.1%;双屏翻译机2.0在90分贝极端噪音中仍保持98.69%的识别率。更引人注目的是,业界首个软硬一体同传麦克风实现自动翻译免切换,响应延迟低于2秒,支持私有化部署。
在空间声场重构领域,搭载“AI+扬声器阵列技术”的iFLYSOUND智能座舱方案已与19家车企达成合作,量产车型突破100万台。该方案通过立体声场模拟技术,使车内音效达到百万级豪车标准。护眼技术方面,AI黑板搭载的圆偏振光护眼大屏使视觉疲劳降低50%,130度超宽视角确保教室全员清晰观看;AI学习机集成微纳米类纸屏技术,获得国内外10余项权威认证。

多模态交互技术的突破为AI落地真实场景提供关键支撑。数字人导览“小飞”现场演示的八大交互能力令人印象深刻:其远场麦克风识别、3D视觉感知、多人主动交互等技术,使AI能够完成购票、订酒店等复杂任务。星火X1.5首发的个性化记忆功能,通过构建用户画像库实现长期行为理解;百变声音复刻技术仅需1秒录音即可克隆任意音色,并支持风格化声音创作。这些技术使AI从“工具”进化为“有温度的伙伴”。
在行业应用层面,星火大模型展现出强大的场景适应能力。教育领域,其构建的4000余个错因标签体系通过权威专家鉴定,配合智能批阅机和教师助手实现“作业批改-课堂施教”小时级闭环。医疗领域,专科诊疗能力达到三甲医院主任级水平,人机协同使基层诊断合理率提升9个百分点,病历书写时间减半。汽车领域,星火智慧座舱2.0通过54维记忆锚点记住用户偏好,提供体征监测等5项实时服务。办公场景中,智能办公本X5的手写纪要与AI纪要深度融合,更符合用户使用习惯。
情感陪伴领域,科大讯飞推出的“AI星朋友”具备4.35MOS高保真声音克隆能力,内置160余种人设模型。其自学习情感模型可记忆用户偏好,在特定场景下主动发起通话,将《Her》电影中的科幻场景变为现实。
生态建设方面,2025年AI开发者大赛吸引17国3.6万余个团队参与,催生4622个垂类智能体。讯飞开放平台开发者突破968万,近一年新增200万,大模型企业开发者增长125%。面向开发者,科大讯飞全面开源原生支持RPA的智能体平台Astron,提供八大行业智能体,通过“大脑+手脚”的架构设计降低AI应用门槛。同步启动的“星火点亮全球”计划,将依托多语言技术和自主可控优势,与全球伙伴共建AI技术新生态。
















