第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,正式推出深度推理大模型讯飞星火X1.5,并发布覆盖多领域的AI软硬一体解决方案。这款采用MoE架构的新一代模型总参数量达293B,激活参数30B,推理效率较前代提升100%,在语言理解、数学能力等六大核心维度全面对标国际主流模型,数学能力持续保持领先。其多语言支持覆盖超130个语种,整体性能达GPT-5的95%以上,尤其在拉美、东盟等14个重点区域语言处理上表现突出,为全球AI发展提供了自主可控的高性能选择。

在自主可控技术突破方面,科大讯飞实现两大关键进展:长思维链强化学习训练效率从30%提升至84%以上,显著降低深度推理训练成本;攻克MoE模型全链路训练效率难题,夯实国产AI技术底座。全球首发的非自回归语音大模型架构通过并行输出文本序列,推理效率较同尺寸自回归模型提升16%,成本下降520%,为语音交互规模化应用扫清障碍。星火行业分析师成为国内首个通过工信部《大数据分析师技术水平考试》认证的AI应用,以92分超越85%的人类考生,展现专业领域实战能力。
软硬一体解决方案成为本次发布会的另一焦点。科大讯飞推出融合麦克风阵列、扬声器阵列、摄像头阵列等技术的创新产品,推动AI从软件向具象化产品渗透。讯飞智能办公本X5首创上4下4环八麦克风阵列,高噪环境下语音识别准确率达95.08%,超越iPhone 17 Pro;AI翻译耳机搭载单耳三麦多感融合降噪系统,复杂噪声中识别准确率高达97.1%;双屏翻译机2.0在90dB极端噪音下仍保持98.69%的识别率。软硬一体讯飞同传麦克风实现自动翻译免切换,首响延迟低于2秒,支持私有化部署,满足专业场景需求。
扬声器阵列技术与自研算法的结合催生智能座舱音响方案iFLYSOUND。该方案通过立体空间声场重构技术,使车内音效达到百万级豪车水准,已在19家车企量产,累计出货量超100万台。视觉与健康领域,讯飞AI黑板搭载圆偏类自然光护眼大屏,降低视觉疲劳50%,配合130度超宽域显示;AI学习机整合微纳米类纸屏等护眼技术,获10余项国内外权威认证。多模态交互方面,数字人导览“小飞”展示麦克风远场识别、3D视觉感知等八项核心技术,实现多人多语种对话、个性化推荐及一站式服务办理。

星火X1.5的个性化记忆能力通过构建用户记忆库,综合长期画像、近期反馈与短期对话信息,实现精准需求响应。百变声音复刻技术基于星火语音大模型,仅需一句录音即可复刻音色,配合指令生成任意风格语音,实测音色相似度达91分,风格一致性达85.6分。科大讯飞董事长刘庆峰预判,超拟人多模态交互将成为未来家庭AI标配功能。
在应用场景拓展上,科大讯飞展示AI在教育、医疗、汽车等领域的深度落地。教育领域,星火大模型构建精细化错因体系,通过智能批阅机与教师助手实现“小时级闭环”,推动教学个性化变革。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使诊断合理率提升至96%,病历书写时间减半。出行领域,星火智慧座舱2.0通过54维记忆锚点记录用户偏好,提供体征监测功能,打造“第三空间”。办公领域,智能办公本X5与听见APP支持会议纪要自动生成,手写纪要与AI深度融合。情感陪伴领域,全新发布的“AI星朋友”搭载高保真声音克隆技术,内置160种人设模型,通过自学习情感模型主动互动,还原科幻场景。
生态建设方面,2025年AI开发者大赛吸引17国36898个团队参赛,涌现4622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。科大讯飞发布并开源首个原生支持RPA的智能体平台Astron,结合Agent与RPA技术,提供八大行业智能体,助力开发者跨越应用落地鸿沟。发布会尾声,科大讯飞携手多国伙伴启动“星火点亮全球”计划,依托多语言能力与自主可控技术,向世界提供AI发展的“第二种选择”,加速技术红利共享。










