在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以《更懂你的AI》为主题,向全球展示了其最新技术突破与产品矩阵。这场以“AI赋能千行百业”为核心的盛会,不仅发布了深度推理大模型讯飞星火X1.5,更通过软硬一体化解决方案、多模态交互技术及行业深度应用,勾勒出AI技术从实验室走向真实场景的完整路径。

星火X1.5的发布成为全场焦点。这款采用MoE架构的模型总参数量达293B,激活参数30B,推理效率较前代提升100%,在数学能力、多语言支持等六大核心维度全面对标国际主流。其数学能力持续保持领先,多语言覆盖超130个语种,整体性能达GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。更值得关注的是,科大讯飞在自主可控算力平台上实现两大突破:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率显著优化,为国产AI算力树立新标杆。与此同时,全球首发的非自回归语音大模型架构通过并行输出文本序列,将推理成本降低520%,效果提升16%,重新定义了语音交互的效率标准。
软硬一体化解决方案的推出,标志着AI技术向真实世界渗透的关键跨越。科大讯飞融合AI与传感器阵列技术,打造出覆盖办公、翻译、同传等场景的智能硬件生态。其中,智能办公本X5搭载上4下4环八麦克风阵列,在高噪环境下识别准确率达95.08%,远超iPhone 17 Pro;AI翻译耳机首创单耳三麦多感融合系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0在90dB噪音中仍保持98.69%的识别率。更引人注目的是业界首个软硬一体同传麦克风,实现自动翻译免切换,首响延迟低于2秒,支持私有化部署。在车载场景中,iFLYSOUND智能座舱音响方案通过立体空间声场重构技术,让车内音效媲美百万豪车,目前已与19家车企合作,量产超100万台。
多模态交互技术的突破让AI更具“人性温度”。数字人导览“小飞”现场演示了其八大核心能力:通过麦克风远场识别、3D视觉感知等技术,实现多人多语种对话、个性化推荐及任务执行。发布会首发的个性化记忆能力与百变声音复刻技术,则进一步拉近了AI与用户的距离。星火X1.5可构建用户记忆库,综合长期画像、近期反馈与短期对话,实现精准个性化服务;基于语音大模型的声音复刻技术,仅需1秒录音即可克隆任意音色,并支持风格化声音创造。科大讯飞董事长刘庆峰强调:“超拟人多模态交互将成为AI进入家庭的标配,让技术真正理解人类情感与需求。”

行业深度应用场景的展示,印证了AI技术从工具到伙伴的蜕变。在教育领域,星火大模型构建的错因体系包含3大类、3层级、4000+标签,通过智能批阅机与教师助手实现“作业批改-课堂施教”小时级闭环,获国家数学课程标准修订组专家权威认证。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半。全新发布的“智医助理医院版1.0”与升级后的“讯飞晓医”APP,可解析99%医学报告,累计完成1.6亿次健康咨询。在出行场景中,星火智慧座舱2.0通过13个摄像头与54维记忆锚点记住用户偏好,提供体征监测与个性化服务,将汽车转化为“第三生活空间”。办公领域,智能办公本X5与听见APP升级后,可基于说话人识别自动生成会议纪要,手写内容与AI纪要深度融合,更贴合用户习惯。情感陪伴方面,“AI星朋友”凭借4.35MOS高保真声音克隆与160种人设模型,通过自学习情感模型主动关怀用户,让科幻场景成为现实。
生态共建成为科大讯飞战略的核心。2025年AI开发者大赛吸引17国36,898个团队参与,诞生4,622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。发布会现场,科大讯飞宣布全面开源原生支持RPA的智能体平台Astron,将“大脑”与“手脚”结合,提供八大行业智能体,助力开发者跨越AI应用鸿沟。同时,携手多国伙伴启动“星火点亮全球”计划,依托多语言与自主可控技术,推动AI红利全球共享,为世界提供“第二种选择”。


























