在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式发布讯飞星火大模型最新技术突破及系列应用成果,系统描绘了人工智能产业从技术突破到场景落地的完整路径。董事长刘庆峰在演讲中强调,AI价值的释放需突破自主可控、软硬融合、行业深耕与个性化服务四大维度,目前已在300余个“开箱即用”的智能体中验证成效,其中“星火行业分析师”以92分通过工信部认证,超越85%的人类考生,成为国内首个获此殊荣的行业分析AI工具。

技术层面,深度推理大模型讯飞星火X1.5成为焦点。该模型采用MoE架构,总参数量达293B,激活参数30B,推理效率较前代提升100%,数学能力持续领跑国际。其多语言支持覆盖130个语种,整体性能达GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现更优。值得关注的是,科大讯飞在国产算力平台上实现两大突破:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率显著优化,为自主可控AI发展奠定基础。全球首发的非自回归语音大模型架构通过并行输出文本序列,将推理成本降低520%,效果提升16%。
软硬一体化解决方案的发布标志着AI技术向真实场景的深度渗透。科大讯飞推出融合AI与多模态传感器的硬件方案,其中智能办公本X5搭载上4下4环八麦克风阵列,抗噪能力超越iPhone 17 Pro,高噪环境识别准确率达95.08%;AI翻译耳机采用单耳三麦降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0在90dB噪音中仍保持98.69%的识别率。扬声器阵列技术方面,智能座舱音响方案iFLYSOUND已量产落地19家车企,出货量超100万台,车内音效比肩百万级豪车。视觉健康领域,AI黑板配备圆偏类自然光护眼大屏,视觉疲劳降低50%,130度超宽显示确保教室全员可视;AI学习机集成微纳米类纸屏技术,获10余项国内外护眼认证。

多模态交互能力成为AI走向大众的关键支撑。数字人导览“小飞”现场演示了跨模态交互场景:支持多人多语种对话、个性化推荐及购票订酒店等任务执行。其背后是讯飞在麦克风远场识别、3D视觉感知、视听觉融合理解等八项技术上的突破。发布会首发两大核心技术:个性化记忆库通过综合用户长期画像、近期反馈与短期对话,实现精准理解;百变声音复刻技术仅需1句录音即可克隆音色,并支持风格化声音创作。刘庆峰指出,这些技术将推动AI从工具向情感伙伴进化。
场景应用层面,科大讯飞展示了AI在教育、医疗、出行等领域的深度实践。教育领域,星火大模型构建的错因体系包含3大类、3层级、4000+标签,通过智能批阅机与教师助手实现“作业批改-课堂施教”小时级闭环,获国家数学课程标准修订组专家权威认证。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半;“智医助理医院版1.0”与个人健康助手“讯飞晓医”累计完成1.6亿次咨询。出行领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供偏好记忆与体征监测服务。办公场景中,智能办公本X5与听见APP可自动生成会议纪要,手写内容与AI记录深度融合。情感陪伴方面,“AI星朋友”搭载高保真声音克隆与160余种人设模型,通过自学习情感模型主动互动,让科幻场景成为现实。
生态建设层面,科大讯飞宣布全面开源原生支持RPA的智能体平台Astron,提供八大行业智能体,助力开发者跨越AI应用鸿沟。2025年AI开发者大赛吸引17国3.6万个团队参与,涌现4622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。发布会最后,科大讯飞携手多国伙伴启动“星火点亮全球”计划,旨在通过多语言技术与自主可控方案,为世界提供AI发展的“中国方案”,加速技术红利全球共享。























