在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,发布了讯飞星火大模型最新技术突破及多款创新产品,系统描绘了AI技术赋能千行百业的实践路径。科大讯飞董事长刘庆峰指出,AI技术从实验室走向规模化应用,需攻克自主可控、软硬协同、行业深耕与个性化服务四大核心挑战。目前,公司联合行业头部企业打造的300余个“即插即用”智能体已落地应用,其中“星火行业分析师”成为国内首个通过工信部认证的行业分析AI工具,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。

发布会上,深度推理大模型“讯飞星火X1.5”正式亮相。该模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数量300亿,推理效率较前代提升100%。其语言理解、文本生成、逻辑推理等六大核心能力全面对标国际主流模型,数学能力持续领先,多语言支持覆盖130个语种,整体性能达GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现更优。值得关注的是,星火X1.5在国产算力平台上突破了两项关键技术:长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率实现质的飞跃,为自主可控AI生态奠定基础。
在原创技术领域,科大讯飞全球首发非自回归语音大模型架构,通过并行生成文本序列,推理效率较传统自回归模型提升16%,成本降低520%。这一突破为实时语音交互、高并发服务场景提供了更高效的解决方案。
软硬一体化成为AI技术落地的重要支撑。科大讯飞推出融合AI与多模态传感器的软硬件解决方案,其中“AI+麦克风阵列技术”赋能的智能办公本X5,采用上下双层八麦克风设计,抗噪能力超越iPhone 17 Pro,在90分贝噪音环境下识别准确率达95.08%;AI翻译耳机首创单耳三麦降噪系统,复杂场景识别率达97.1%;双屏翻译机2.0在90分贝噪音中仍保持98.69%的识别率。业界首款软硬一体同传麦克风支持自动翻译免切换,首响延迟低于2秒,并可私有化部署。
在空间音频领域,“AI+扬声器阵列技术”与自研算法结合,实现立体声场重构。搭载该技术的iFLYSOUND智能座舱方案已与19家车企合作,量产超100万台,车内音效媲美百万级豪车。视觉健康方面,讯飞AI黑板配备全球首款圆偏振自然光护眼屏,视觉疲劳降低50%,显示视角达130度;AI学习机集成微纳米类纸屏技术,获得10余项国内外护眼认证。

多模态交互能力再升级。数字人导览“小飞”现场演示了八项核心技术突破,包括麦克风远场识别、3D视觉感知、多人主动交互、类人行为反馈、视听觉融合理解、超拟人数字人、个性化记忆及情感语义分析。其中,个性化记忆功能通过构建用户画像库,综合长期偏好、近期反馈与短期对话,实现“千人千面”服务;百变声音复刻技术仅需1秒录音即可复刻任意音色,并支持风格化定制。
应用场景持续拓展。教育领域,星火大模型构建了包含4000余个标签的错因分析体系,通过智能批阅机与教师助手实现“作业批改-课堂反馈”小时级闭环,获国家数学课程标准修订组专家认证。医疗领域,星火医疗大模型专科诊疗能力达三甲医院主任级水平,“智医助理”试点显示人机协同使诊断合理率从87%提升至96%,病历书写时间减半。出行场景中,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供体征监测与个性化服务。办公领域,智能办公本X5与听见APP升级会议纪要生成功能,手写内容与AI纪要深度融合。情感陪伴方面,“AI星朋友”搭载4.35MOS高保真声音克隆与160种人设模型,通过自学习情感模型主动互动,推动科幻场景落地现实。
生态建设加速推进。2025年科大讯飞AI开发者大赛吸引17国3.6万个团队参与,诞生4622个垂类智能体。截至10月底,讯飞开放平台开发者达968万,年增200万,大模型企业开发者增长125%。面向开发者,公司开源原生支持RPA的智能体平台Astron,集成“大脑”与“手脚”功能,提供八大行业智能体,助力中国开发者构建全球创新生态。发布会最后,科大讯飞联合多国伙伴启动“星火点亮全球”计划,依托多语言与自主可控技术,推动AI红利全球共享。













