在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式推出讯飞星火大模型X1.5版本及多款创新产品,系统描绘了人工智能技术从实验室走向产业化的实践路径。此次发布不仅展示了自主可控技术体系的突破,更通过软硬一体化解决方案重新定义了AI与人类生活的交互方式。

作为技术升级的核心成果,星火X1.5采用混合专家(MoE)架构,总参数量达2930亿,激活参数300亿,推理效率较前代提升100%。该模型在数学能力、多语言支持等六大核心维度全面对标国际顶尖水平,其中数学能力持续保持领先,多语言覆盖超130个语种,整体性能达到GPT-5的95%以上。在拉美、东盟等14个重点语言场景中,其表现甚至超越国际竞品。值得关注的是,星火X1.5在国产算力平台上攻克了两大技术瓶颈:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现质的飞跃,为AI技术自主可控奠定坚实基础。
在硬件创新领域,科大讯飞推出全球首款非自回归语音大模型架构,通过并行输出机制将推理成本降低520%,同时效果提升16%。这一突破直接应用于智能办公场景:搭载八麦克风阵列的讯飞智能办公本X5,在嘈杂环境中识别准确率达95.08%,超越iPhone 17 Pro;AI翻译耳机采用单耳三麦降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0更在90分贝噪音中保持98.69%的识别率。声学领域的创新同样亮眼,iFLYSOUND智能座舱音响方案通过立体空间声场重构技术,已量产应用于19家车企,累计出货超100万台,车内音效媲美百万级豪车。
多模态交互能力的进化成为本次发布的另一焦点。数字人导览员“小飞”现场演示了跨模态任务执行能力:不仅能同时处理多人多语种对话,还可根据用户历史行为提供个性化服务,完成购票、订酒店等复杂操作。其背后是麦克风远场识别、3D视觉感知、情感语义理解等八项核心技术的突破。更引人注目的是两大首发功能:个性化记忆系统通过构建用户画像库,实现长期偏好与短期需求的综合理解;百变声音复刻技术仅需1秒录音即可克隆任意音色,并支持风格化声音创作。

在应用场景拓展方面,科大讯飞展示了AI技术对传统行业的深度改造。教育领域首创的4000+标签错因分析体系,通过智能批阅机和教师助手实现“作业批改-课堂施教”的小时级闭环;医疗领域发布的“智医助理医院版1.0”,使基层诊疗合理率从87%提升至96%,病历书写时间减半;出行领域,星火智慧座舱2.0通过54维记忆锚点记录用户偏好,融合13个摄像头实现体征监测,将汽车转化为“第三生活空间”。情感陪伴赛道则推出“AI星朋友”,其160种人设模型与自学习情感引擎,能主动发起通话互动,让科幻场景走进现实。
生态建设层面,科大讯飞宣布全面开源原生支持RPA的智能体平台Astron,该平台整合Agent智能决策与RPA自动化能力,提供八大行业解决方案。数据显示,2025年AI开发者大赛吸引3.6万个国际团队参与,催生4622个垂直领域智能体。截至10月,讯飞开放平台开发者总数突破968万,近一年新增200万,其中大模型企业开发者增长125%。发布会上启动的“星火点亮全球”计划,将联合多国合作伙伴,通过多语言技术与自主可控架构,构建AI技术共享的跨国生态。










