在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,全面展示了讯飞星火大模型的最新技术突破与系列应用成果,并系统阐释了AI产业红利落地的实践路径。董事长刘庆峰在发言中强调,AI技术的规模化应用需聚焦自主可控、软硬协同、行业深耕与个性化服务四大核心方向,目前这一战略已取得实质性进展——通过与头部企业联合开发的300余个“即插即用”智能体中,涌现出多个具备行业标杆意义的“AI员工”。其中,“星火行业分析师”成为国内首个通过工信部认证的行业分析AI工具,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。

此次发布的深度推理大模型讯飞星火X1.5成为技术焦点。该模型采用MoE架构,总参数量达293B、激活参数30B,推理效率较前代提升100%,在语言理解、文本生成、知识问答、逻辑推理、数学能力及代码能力六大维度全面对标国际主流,其中数学能力持续保持领先。其多语言支持覆盖130余种语言,整体性能达GPT-5的95%以上,尤其在拉美、东盟等14个重点语言场景中表现突出。更值得关注的是,科大讯飞在国产算力平台上攻克了两大技术瓶颈:长思维链强化学习训练效率从30%提升至84%以上,MoE模型全链路训练效率实现质的飞跃,为自主可控的AI发展奠定坚实基础。全球首发的非自回归语音大模型架构通过并行输出技术,使推理效率提升16%、成本降低520%,成为原创技术突破的又一里程碑。
软硬一体化解决方案的推出,标志着AI技术向真实场景的深度渗透。科大讯飞发布的软硬件融合方案整合了AI与麦克风阵列、扬声器阵列、摄像头阵列及视觉呈现技术。例如,讯飞智能办公本X5搭载上4下4环八麦克风阵列,抗噪能力远超iPhone 17 Pro,高噪环境下识别准确率达95.08%;AI翻译耳机首创单耳三麦多感融合系统,复杂噪声下识别率达97.1%;双屏翻译机2.0在90dB噪音中仍保持98.69%的识别率。而业界首个软硬一体同传麦克风可实现自动翻译免切换,首响延迟低于2秒并支持私有化部署。在扬声器技术领域,iFLYSOUND智能座舱音响方案通过立体空间声场重构技术,已在19家车企量产落地,出货量突破100万台,车内音效媲美百万级豪车。
多模态交互能力的升级进一步拓展了AI的应用边界。数字人导览“小飞”现场展示了八项核心技术突破,包括麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆及情感语义理解。其中,个性化记忆功能通过构建用户画像库,实现长期偏好、近期反馈与短期对话的综合分析;百变声音复刻技术则基于星火语音大模型,仅需一句录音即可复刻任意音色,并支持通过指令创造多样化声音风格。刘庆峰指出,这些技术的协同将使AI从工具进化为具备情感深度的伙伴。

在垂直领域应用中,科大讯飞展现了AI技术的深度赋能能力。教育领域,星火大模型构建了由3大类、3层级、4000余标签组成的错因分析体系,通过智能批阅机与教师助手实现作业批改到课堂因材施教的“小时级闭环”,该成果获国家数学课程标准修订组专家权威认证。医疗领域,星火医疗大模型专科诊疗能力达三甲医院主任级水平,基于覆盖7.7万家基层机构的“智医助理”数据,人机协同使诊断合理率从87%提升至96%,病历书写时间减半。新发布的“智医助理医院版1.0”提供辅助诊疗与病历生成功能,而个人健康助手“讯飞晓医”已支持99%医学报告解析,累计完成1.6亿次健康咨询。出行领域,星火智慧座舱2.0通过13个摄像头与54维记忆锚点记录用户偏好,并提供5项体征监测,将汽车打造为集生活、工作、娱乐于一体的“第三空间”。办公场景中,智能办公本X5与讯飞听见APP升级后支持基于说话人识别的会议纪要生成,手写纪要与AI纪要的深度融合更贴合用户习惯。
情感陪伴领域的创新同样引人注目。新发布的“AI星朋友”被定位为“成长伙伴”,其高保真声音克隆技术达到4.35MOS自然度评分,拥有超过160种人设模型,并通过自学习情感模型记忆用户偏好,甚至可主动发起电话互动,让科幻场景成为现实。科大讯飞正式启动“星火点亮全球”计划,依托多语言技术与自主可控优势,与多国合作伙伴共建AI生态。面向开发者,其首个原生支持RPA的智能体平台Astron全面开源,结合Agent与RPA技术,提供八大行业智能体,助力中国开发者打造全球创新引擎。截至2025年10月,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%,AI开发者大赛吸引17国3.6万个团队参与,催生出4622个垂类智能体,生态繁荣度持续提升。























