在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,发布了讯飞星火大模型最新技术突破及系列应用产品,同时系统描绘了AI技术红利从实验室走向产业落地的实践路径。科大讯飞董事长刘庆峰在现场指出,AI技术的规模化应用需突破四大核心瓶颈——自主可控的算力底座、软硬协同的交互体系、垂直行业的深度渗透以及个性化服务的精准触达。目前,这一战略已取得阶段性成果,通过与300余家头部企业联合打造的“开箱即用”智能体中,涌现出“星火行业分析师”等标杆应用。该产品以92分的成绩通过工信部《大数据分析师技术水平考试》,超越85%的人类考生,成为国内首个获得行业认证的AI分析工具。

此次发布的深度推理大模型讯飞星火X1.5成为焦点。该模型采用MoE架构,总参数量达293B,激活参数量30B,推理效率较前代提升100%。其六大核心能力——语言理解、文本生成、知识问答、逻辑推理、数学计算与代码生成——全面对标国际主流模型,其中数学能力持续保持全球领先。多语言支持方面,X1.5覆盖130余种语言,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言市场表现尤为突出。更关键的是,科大讯飞在国产算力平台上攻克了两大技术难关:长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率实现质的飞跃,为AI技术自主可控奠定坚实基础。全球首发的非自回归语音大模型架构通过并行输出文本序列,将推理成本降低520%,效果提升16%。
软硬一体化解决方案的推出,标志着AI技术从云端走向真实场景的关键跨越。科大讯飞发布的“AI+麦克风阵列”技术已在多款产品中落地:智能办公本X5采用上下双层八麦克风阵列,抗噪能力超越iPhone 17 Pro,高噪环境下识别准确率达95.08%;AI翻译耳机通过单耳三麦融合降噪系统,复杂噪声下识别率达97.1%;双屏翻译机2.0在90dB极端噪音中仍保持98.69%的识别率。而“AI+扬声器阵列”技术则重构了立体声场,搭载该技术的iFLYSOUND智能座舱方案已与19家车企合作,量产超100万台,车内音效媲美百万级豪车。在视觉健康领域,AI黑板搭载的圆偏振光护眼大屏使视觉疲劳降低50%,130度超宽视角确保教室每个角落清晰可见;AI学习机则集成微纳米类纸屏技术,获得国内外10余项护眼认证。
多模态交互能力的突破让AI更贴近人类需求。数字人导览“小飞”现场演示了八大技术能力:远场麦克风识别、3D视觉感知、多人主动交互、类人动作反馈、视听融合理解、超拟人形象、个性化记忆与情感语义分析。其中,个性化记忆库通过整合用户长期画像、近期反馈与短期对话,实现“千人千面”的服务;百变声音复刻技术仅需1秒录音即可复刻任意音色,并支持风格化声音创作。刘庆峰强调:“超拟人多模态交互将成为家庭AI的标准配置,让技术真正理解人类情感。”

在应用场景拓展方面,科大讯飞展示了AI技术对教育、医疗、出行等领域的深度改造。教育领域,星火大模型构建了包含3大类、3层级、4000余个标签的错因分析体系,通过智能批阅机与教师助手实现“作业批改-课堂反馈”小时级闭环,获国家数学课程标准修订组专家认证。医疗领域,星火医疗大模型专科诊疗能力达三甲医院主任级水平,试点显示人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半。“智医助理医院版1.0”与个人健康助手“讯飞晓医”可解析99%的医学报告,累计完成1.6亿次健康咨询。出行领域,星火智慧座舱2.0通过13个摄像头与54维记忆锚点,实现用户偏好记忆与环境感知,提供体征监测与“第三空间”服务。办公场景中,智能办公本X5与听见APP支持说话人识别与会议纪要自动生成,手写内容与AI纪要深度融合。情感陪伴方面,“AI星朋友”以4.35MOS高保真声音克隆与160余种人设模型,通过自学习情感模型主动发起互动,让科幻场景成为现实。
为构建开放生态,科大讯飞启动“星火点亮全球”计划,依托多语言技术与自主可控优势,与多国合作伙伴深化合作。2025年AI开发者大赛吸引17国3.6万余个团队参与,催生4622个垂直领域智能体。截至10月底,讯飞开放平台开发者达968万,近一年新增200万,大模型企业开发者增长125%。现场发布的Astron智能体平台首次原生支持RPA技术,将AI决策能力与自动化操作结合,提供八大行业“开箱即用”解决方案,助力开发者跨越技术鸿沟。刘庆峰表示:“AI不仅是技术,更是赋能每个人创造温暖未来的力量。让技术理解人类,是我们的初心。”














