在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以一场技术盛宴展示了AI领域的最新突破。其核心产品讯飞星火大模型X1.5的发布,标志着国产算力在大模型领域实现重大跨越,同时通过“自主可控、软硬一体、行业纵深、个性化”四大路径,推动AI技术深度融入社会各领域。
讯飞星火X1.5采用MoE架构,总参数量达293B,激活参数30B,仅为国外的际主流大模型一半,却在综合性能上实现全面对标。相比前代星火X1,其推理效率提升100%,语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力六大核心指标均达到国际领先水平。尤其在数学能力上,星火X1.5持续保持全球优势,同时支持超过130种语言,整体性能达GPT-5的95%以上,在拉美、东盟等14个重点区域语言表现中更胜一筹,为全球AI发展提供了“中国方案”。
在纯国产算力平台上,科大讯飞攻克了MoE模型全链路高效训练与长思维链强化学习两大难题,将训练效率从30%提升至84%以上。全球首发的非自回归语音大模型通过并行输出技术,使推理效率实现阶跃式提升,相比同尺寸自回归模型,效果提升16%,成本降低520%,为AI大规模落地奠定了技术基础。
科大讯飞创始人刘庆峰指出,软硬一体是AI技术从实验室走向真实场景的关键。公司推出的AI+硬件融合方案,在多个领域创造了行业标杆。例如,讯飞智能办公本X5首创“上4下4环八”麦克风阵列,在90分贝高噪环境下语音识别准确率达95.08%,远超iPhone 17 Pro;讯飞AI翻译耳机采用“单耳三麦多感融合”降噪系统,复杂噪声下识别准确率达97.1%;讯飞双屏翻译机2.0在90dB噪音中仍保持98.69%的识别率;而讯飞同传麦克风作为业界首款软硬一体同传设备,首响延迟低于2秒,支持私有化部署。
在声学领域,iFLYSOUND智能座舱音响方案通过AI与扬声器阵列技术,重构车内立体空间声场,音效媲美百万级豪车,目前已量产于19家车企,出货量突破100万台。视觉与健康领域同样创新不断:讯飞AI黑板搭载全球首款“圆偏类自然光”护眼大屏,视觉疲劳降低50%,支持130度超宽域显示;讯飞AI学习机采用微纳米类纸屏技术,获国内外10余项护眼认证,为用户提供健康用眼环境。
多模态交互是AI融入真实世界的核心。科大讯飞定义了麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆、情感语义八大能力,并首发两大核心技术。其中,个性化记忆能力通过构建用户画像库,综合长期偏好、近期反馈与短期对话,实现AI的深度理解;百变声音复刻技术则支持一句话复刻音色、一条指令创造风格、任意组合生成,让AI交互更具个性化。
发布会现场,数字人导览“小飞”通过多语种对话、个性化推荐、任务执行等场景演示,展现了AI技术的实用价值。目前,科大讯飞的AI解决方案已深度渗透教育、医疗、汽车、办公、情感陪伴等领域。在教育领域,其首创的“错因体系”包含3大类、3层级、4000余个标签,通过“星火智能批阅机”和“星火教师助手”实现作业批改到因材施教的“小时级闭环”;医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,智医助理将诊断合理率从87%提升至96%,病历书写时间减半;汽车领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供体征监测与个性化偏好服务;办公领域,讯飞智能办公本X5与讯飞听见App支持会议纪要自动生成与手写纪要融合;情感陪伴领域,“AI星朋友”作为成长伙伴,可主动发起电话交互,让科幻场景成为现实。











