在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式推出讯飞星火大模型最新技术升级及系列创新产品,系统描绘了AI技术赋能产业发展的实践路径。科大讯飞董事长刘庆峰在发言中指出,AI技术的规模化应用需突破自主可控、软硬融合、行业深耕与个性化服务四大核心瓶颈,目前已在300余个与头部企业共建的智能体中验证了技术可行性。其中,“星火行业分析师”作为国内首个通过工信部认证的行业分析AI工具,在《大数据分析师技术水平考试》中以92分超越85%的人类考生,成为技术落地的标杆案例。

深度推理大模型讯飞星火X1.5的发布成为技术突破的焦点。该模型采用MoE架构,总参数量达293B,激活参数30B,推理效率较前代提升100%,在语言理解、文本生成、逻辑推理等六大核心能力上全面对标国际主流模型,数学能力持续保持领先。其多语言支持覆盖130余个语种,整体性能达到GPT-5的95%以上,尤其在拉美、东盟等14个重点语言市场表现突出。在自主可控算力平台上,科大讯飞攻克了长思维链强化学习训练效率(从30%提升至84%)和MoE模型全链路训练效率两大难题,并全球首发非自回归语音大模型架构,实现推理效率阶跃式提升——相比同尺寸自回归模型,效果提升16%,成本降低520%。
软硬一体化解决方案的推出标志着AI技术向真实场景的深度渗透。科大讯飞发布了融合AI与多模态传感器的硬件系统,其中“AI+麦克风阵列技术”赋能的智能办公本X5通过八麦克风阵列实现超强抗噪,高噪环境下识别准确率达95.08%,远超iPhone 17 Pro;AI翻译耳机采用单耳三麦降噪系统,复杂噪声下识别率达97.1%;双屏翻译机2.0在90dB噪音环境中仍保持98.69%的识别率。业界首个软硬一体同传麦克风支持自动翻译免切换,首响延迟低于2秒,并可私有化部署。在音频领域,搭载“AI+扬声器阵列技术”的iFLYSOUND智能座舱音响方案已在19家车企量产,出货量超100万台,车内音效媲美百万级豪车。

多模态交互能力的升级重新定义了人机交互边界。数字人导览“小飞”现场演示了八项核心技术突破,包括麦克风远场识别、3D视觉感知、超拟人数字人等,支持多人多语种对话、个性化推荐及任务执行。星火X1.5首发的个性化记忆功能通过构建用户画像库,实现长期偏好、近期反馈与短期对话的综合理解;百变声音复刻技术则可基于单句录音复刻任意音色,并支持指令生成多样化声音风格。刘庆峰强调:“超拟人多模态交互将成为AI进入家庭场景的标配。”
在应用场景拓展方面,科大讯飞展示了AI技术在教育、医疗、汽车等领域的深度实践。教育领域,星火大模型构建的错因体系获国家数学课程标准修订组专家权威认证,通过智能批阅机与教师助手实现“作业批改-课堂施教”小时级闭环;医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,“智医助理医院版1.0”与个人健康助手“讯飞晓医”累计完成1.6亿次咨询;汽车领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供个性化环境适配与体征监测;办公领域,智能办公本X5与讯飞听见APP升级会议纪要生成功能,手写内容与AI纪要深度融合;情感陪伴方面,“AI星朋友”通过160余种人设模型与自学习情感引擎,实现主动电话交互,复刻科幻场景。
生态建设层面,科大讯飞启动“星火点亮全球”计划,依托多语言技术与自主可控优势,与多国合作伙伴共建AI技术生态。2025年AI开发者大赛吸引17国3.6万余团队参与,催生4622个垂类智能体。截至10月底,讯飞开放平台开发者达968万,近一年新增200万,大模型企业开发者增长125%。面向开发者,科大讯飞开源原生支持RPA的智能体平台Astron,整合Agent与RPA能力,提供八大行业智能体,助力中国开发者构建全球创新引擎。
























