在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,推出讯飞星火大模型最新技术升级及系列创新产品,为AI产业红利兑现勾勒出清晰蓝图。科大讯飞董事长刘庆峰指出,AI技术的规模化应用需突破四大核心挑战:自主可控的技术底座、软硬一体的协同能力、行业纵深的场景适配以及个性化服务体验。目前,这一路径已取得显著进展,联合头部企业打造的300余个“开箱即用”智能体中,涌现出如“星火行业分析师”等标杆应用——该产品以92分的成绩通过工信部《大数据分析师技术水平考试》,超越85%的人类考生,成为国内首个获认证的行业分析AI工具。

技术突破层面,深度推理大模型讯飞星火X1.5成为焦点。该模型采用MoE架构,总参数量达293B,激活参数30B,推理效率较前代提升100%,语言理解、数学能力等六大核心指标全面对标国际主流,其中数学能力持续领跑全球。其多语言支持覆盖130余种语言,整体性能达GPT-5的95%以上,在拉美、东盟等14个重点语言市场表现尤为突出。更关键的是,星火X1.5在国产算力平台上攻克两大技术难题:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现质的飞跃,为自主可控的AI发展筑牢根基。科大讯飞全球首发的非自回归语音大模型架构,通过并行输出文本序列,将推理成本降低520%,效果提升16%,重新定义了语音技术的效率边界。
软硬一体化解决方案的发布,标志着AI技术从实验室走向真实场景的关键跨越。科大讯飞推出的“AI+麦克风阵列”技术,赋予智能办公本X5超强抗噪能力——其上4下4环八麦克风阵列在高噪环境下识别准确率达95.08%,远超iPhone 17 Pro;AI翻译耳机采用单耳三麦多感融合降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0的强降噪模式,甚至能在90dB噪音中保持98.69%的识别率。在扬声器领域,iFLYSOUND智能座舱音响方案通过立体空间声场重构技术,让车内音效媲美百万豪车,目前已落地19家车企,出货量突破100万台。视觉技术方面,AI黑板搭载的圆偏类自然光护眼大屏,将视觉疲劳降低50%,130度超宽域显示确保教室每个角落清晰可见;AI学习机则集成微纳米类纸屏等10余项护眼技术,获得国内外权威认证。
多模态交互能力的革新,让AI从“工具”升级为“伙伴”。数字人导览“小飞”现场演示了其突破性交互:支持多人多语种对话、个性化推荐、购票订酒店等任务。这一体验背后,是讯飞在麦克风远场识别、3D视觉感知、超拟人数字人等八项技术上的突破。发布会首发的两大核心技术——个性化记忆与百变声音复刻,进一步拉近了人与AI的距离。前者通过构建用户记忆库,综合理解长期画像、近期反馈与短期对话;后者仅需一句录音即可复刻任意音色,并支持指令式风格创造。刘庆峰强调:“超拟人多模态交互将成为AI进入家庭的标配。”

在应用场景层面,科大讯飞展示了AI如何深度融入工作、生活与情感需求。教育领域,星火大模型构建的错因体系获国家数学课程标准修订组组长曹一鸣教授领衔的专家组鉴定,通过智能批阅机与教师助手实现“小时级闭环”教学;医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,“智医助理医院版1.0”与个人健康助手“讯飞晓医”累计完成1.6亿次健康咨询;出行领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供体征监测与个性化服务;办公领域,智能办公本X5与听见APP升级会议纪要功能,手写与AI纪要深度融合;情感陪伴方面,“AI星朋友”以4.35MOS高保真声音克隆与160余种人设模型,通过自学习情感模型主动关怀用户,让科幻场景成为现实。
生态建设层面,科大讯飞宣布全面开源原生支持RPA的智能体平台Astron,将AI大脑与RPA手脚结合,提供八大行业“开箱即用”智能体,为中国开发者打造自主可控的创新引擎。截至2025年10月,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。同期启动的“星火点亮全球”计划,将依托多语言与自主可控技术,与多国合作伙伴深化合作,为全球提供AI发展的“第二种选择”,加速技术红利共享。

























