在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,正式发布讯飞星火大模型最新技术升级及系列产品,为AI产业红利的全面落地勾勒出清晰路径。董事长刘庆峰在演讲中指出,AI技术要真正服务于人类,需突破自主可控、软硬一体、行业纵深与个性化四大核心挑战。目前,这一战略已取得实质性进展——由讯飞联合头部企业打造的300余个“开箱即用”智能体中,已涌现出多个具备行业标杆意义的“AI员工”。其中,“星火行业分析师”成为国内首个通过工信部认证的行业分析AI应用,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。

技术突破层面,深度推理大模型讯飞星火X1.5的发布成为全场焦点。该模型采用MoE架构,总参数量达293B,激活参数量30B,推理效率较前代提升100%,其语言理解、文本生成等六大核心能力全面对标国际主流,数学能力持续保持领先。更值得关注的是,星火X1.5在多语言支持上实现跨越式发展,覆盖130余个语种,整体性能达GPT-5的95%以上,其中拉美、东盟等14个重点语言效果尤为突出。这一成果标志着中国AI技术为全球提供了除西方主导外的“第二选择”。在底层算力层面,科大讯飞攻克两大关键难题:长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率实现质的飞跃,为自主可控的AI发展筑牢根基。全球首发的非自回归语音大模型架构通过并行输出文本序列,将推理成本降低520%,效果提升16%,重新定义了语音交互的效率标准。
软硬一体化解决方案的推出,则展现了AI技术从实验室走向真实场景的落地能力。科大讯飞发布的软硬件一体方案深度融合AI与麦克风阵列、扬声器阵列、摄像头阵列及视觉呈现技术。以讯飞智能办公本X5为例,其首创的上4下4环八麦克风阵列实现超强抗噪,识别准确率在高噪环境下达95.08%,远超iPhone 17 Pro;AI翻译耳机通过单耳三麦多感融合降噪系统,在复杂噪声中保持97.1%的识别率;双屏翻译机2.0的强降噪模式甚至能在90dB噪音下达到98.69%的识别率。扬声器阵列技术同样亮眼,搭载该技术的智能座舱音响方案iFLYSOUND已与19家车企合作,量产超100万台,车内音效可媲美百万级豪车。视觉健康领域,讯飞AI黑板搭载的圆偏类自然光护眼大屏使视觉疲劳降低50%,130度超宽域显示确保教室每个角落的学生都能清晰观看;AI学习机则集成微纳米类纸屏等技术,获得国内外10余项护眼认证。

多模态交互能力的升级进一步模糊了虚拟与现实的边界。数字人导览“小飞”现场演示了其突破性交互体验:支持多人多语种对话、基于历史记录的个性化推荐,并能独立完成购票、订酒店等复杂任务。这一成果源于讯飞在麦克风远场识别、3D视觉感知、视听觉融合理解等八项技术上的突破。发布会更首发两大核心技术:个性化记忆能力通过构建用户记忆库,综合分析长期画像、近期反馈与短期对话,使AI真正“懂你”;百变声音复刻技术则基于星火语音大模型,仅需一句录音即可复刻任意音色,并支持通过指令创造多样化声音风格。刘庆峰强调:“超拟人多模态交互将成为未来AI进入家庭的标配。”
在应用场景拓展方面,科大讯飞展示了AI技术如何深度融入工作、生活与情感需求。教育领域,星火大模型构建的错因体系包含3大类、3层级、4000余标签,通过智能批阅机与教师助手实现“作业批改-课堂因材施教”的小时级闭环,引领教学范式变革。医疗领域,星火医疗大模型在权威评测中达到主任级医师水平,其“智医助理”数据飞轮将基层诊断合理率从87%提升至96%,病历书写时间减半;个人健康助手“讯飞晓医”已支持解析99%医学报告,累计完成1.6亿次咨询。出行场景中,星火智慧座舱2.0通过13个摄像头与54维记忆锚点记住用户偏好,提供体征监测与个性化服务,将汽车转化为“第三空间”。办公领域,智能办公本X5与听见APP升级后支持说话人识别自动生成会议纪要,手写内容与AI纪要深度融合,更贴合用户习惯。情感陪伴方面,“AI星朋友”凭借4.35MOS高保真声音克隆与160余种人设模型,通过自学习情感模型主动关怀用户,让科幻场景成为现实。
生态建设层面,科大讯飞宣布启动“星火点亮全球”计划,依托多语言与自主可控技术,与多国伙伴展开深度合作。2025年AI开发者大赛吸引17国36,898个团队参与,诞生4,622个垂类智能体;截至10月底,开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。面向开发者,科大讯飞正式开源首个原生支持RPA的智能体平台Astron,将AI大脑与RPA手脚结合,提供八大行业智能体,助力中国开发者打造自主可控的创新引擎。刘庆峰表示:“AI不仅是硬科技,更应成为赋能每个人、温暖世界的力量。让更懂你的AI成就更好的你,这是我们的初心。”














