在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,推出讯飞星火大模型最新技术升级及系列应用产品,系统呈现AI产业从技术突破到场景落地的完整路径。董事长刘庆峰在发布会上强调,AI产业红利的全面释放需突破自主可控、软硬一体、行业纵深与个性化服务四大核心瓶颈,目前相关实践已取得实质性进展。

作为技术突破的核心成果,深度推理大模型讯飞星火X1.5正式发布。该模型采用MoE架构,总参数量达293B,激活参数量30B,在语言理解、文本生成、逻辑推理等六大核心能力上全面对标国际主流模型。其数学能力持续保持领先优势,多语言能力覆盖130个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。技术团队在国产算力平台上攻克两大关键难题:长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率实现质的飞跃。同时,全球首发的非自回归语音大模型架构通过并行输出技术,使推理效率提升16%,成本降低520%。
在软硬一体化领域,科大讯飞推出多款融合AI与硬件的创新产品。智能办公本X5搭载上4下4环八麦克风阵列,在高噪环境下识别准确率达95.08%,超越iPhone 17 Pro;AI翻译耳机采用单耳三麦多感融合系统,复杂噪声下识别率达97.1%;双屏翻译机2.0在90dB极端噪音环境中仍保持98.69%的识别率。智能座舱音响方案iFLYSOUND通过立体空间声场重构技术,已实现19家车企量产落地,累计出货超100万台。在视觉健康领域,AI黑板搭载的圆偏类自然光护眼大屏使视觉疲劳降低50%,AI学习机获得国内外10余项护眼认证。

多模态交互能力成为本次发布的另一大亮点。数字人导览“小飞”现场演示了八项突破性技术:麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈等能力支撑起自然流畅的对话体验。其中个性化记忆技术通过构建用户画像库,实现长期偏好、近期反馈与短期对话的综合理解;百变声音复刻功能基于星火语音大模型,仅需单句录音即可精准复刻音色,并支持自定义声音风格。刘庆峰指出,这些技术突破使AI从工具升级为具备情感理解的智能伙伴。
在场景化应用方面,教育领域首创的错因分析体系包含3大类、3层级、4000+标签,通过智能批阅机与教师助手实现“小时级”教学闭环。医疗领域,星火医疗大模型专科诊疗能力达到三甲医院主任级水平,人机协同使基层诊断合理率提升9个百分点,病历书写时间减半。出行领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供5项体征监测功能。情感陪伴方面,“AI星朋友”具备4.35MOS高保真声音克隆能力,内置160余种人设模型,可通过自学习情感模型主动发起交互。
生态建设层面,2025年AI开发者大赛吸引17国36,898个团队参与,催生4,622个垂直领域智能体。截至10月底,讯飞开放平台开发者突破968万,其中大模型企业开发者同比增长125%。面向开发者群体,科大讯飞开源原生支持RPA的智能体平台Astron,将AI决策能力与自动化执行深度融合,提供八大行业智能体解决方案。发布会现场,科大讯飞与多国合作伙伴共同启动“星火点亮全球”计划,依托多语言技术与自主可控架构,推动AI技术红利向全球市场延伸。











