在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以《更懂你的AI》为主题,全面展示了AI技术突破与产业落地的最新成果。董事长刘庆峰在发布会上强调,AI产业红利的释放需聚焦自主可控、软硬一体、行业纵深与个性化四大核心方向。目前,这一路径已取得实质性进展——通过与300余家头部企业联合打造的“开箱即用”智能体中,涌现出多款标杆应用。其中,“星火行业分析师”成为国内首个通过工信部认证的行业分析AI工具,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。

技术突破层面,科大讯飞推出深度推理大模型“讯飞星火X1.5”,采用MoE架构,总参数量达293B、激活30B,推理效率较前代提升100%。其六大核心能力(语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力)全面对标国际主流,数学能力持续领先。多语言支持覆盖超130个语种,整体性能达GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现更优。针对国产算力平台,科大讯飞攻克两大关键技术:长思维链强化学习训练效率从30%提升至84%以上,MoE模型全链路训练效率实现质的飞跃。全球首发的非自回归语音大模型架构通过并行输出文本序列,推理成本下降520%,效果提升16%。
软硬一体化解决方案成为AI落地千行百业的核心支撑。科大讯飞发布的“AI+麦克风阵列技术”赋能多款产品:智能办公本X5采用上4下4环八麦克风阵列,抗噪能力远超iPhone 17 Pro,高噪环境下识别准确率达95.08%;AI翻译耳机首创单耳三麦多感融合降噪系统,复杂噪声下识别率达97.1%;双屏翻译机2.0在90dB噪音中识别率高达98.69%。“AI+扬声器阵列技术”则重构立体空间声场,搭载该技术的iFLYSOUND智能座舱音响方案已在19家车企量产,出货量超100万台,车内音效媲美百万级豪车。视觉健康领域,AI黑板搭载全球首款圆偏类自然光护眼大屏,视觉疲劳降低50%,显示视角达130度;AI学习机集成微纳米类纸屏等技术,获国内外10余项护眼认证。

多模态交互能力方面,科大讯飞定义了八项核心技术,包括麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈等。数字人导览“小飞”现场演示了多人多语种对话、个性化推荐及任务执行能力。发布会首发的两大功能尤为亮眼:个性化记忆库通过综合用户长期画像、近期反馈与短期对话,实现深度理解;百变声音复刻技术仅需一句录音即可复刻任意音色,并支持指令式风格创造。刘庆峰指出,超拟人多模态交互将成为未来家庭AI的标配。
在场景应用层面,科大讯飞展示了AI在教育、医疗、汽车等领域的深度实践。教育领域,星火大模型构建了由3大类、3层级、4000+标签组成的错因体系,通过智能批阅机与教师助手实现“小时级闭环”教学。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半。汽车领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供5项体征监测,打造“第三空间”。办公领域,智能办公本X5与讯飞听见APP升级后支持说话人识别自动生成纪要,手写纪要与AI纪要深度融合。情感陪伴方面,“AI星朋友”以4.35MOS高保真声音克隆与160种人设模型,通过自学习情感模型主动互动,让科幻场景成为现实。
生态建设层面,科大讯飞启动“星火点亮全球”计划,依托多语言与自主可控技术,与多国合作伙伴共建AI生态。2025年AI开发者大赛吸引17国36,898个团队参与,诞生4,622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。面向开发者,科大讯飞全面开源原生支持RPA的智能体平台Astron,结合Agent与RPA能力,提供八大行业智能体,助力中国开发者打造全球创新引擎。

























