在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式推出讯飞星火大模型X1.5版本及多款创新产品,系统描绘了AI技术赋能千行百业的实践路径。此次发布会上,科大讯飞董事长刘庆峰强调,AI价值的释放需突破自主可控、软硬融合、行业深耕与个性化服务四大关键领域,并展示了公司在核心技术攻关与生态建设中的最新成果。

星火X1.5大模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数300亿,推理效率较前代提升100%。其六大核心能力——语言理解、文本生成、知识问答、逻辑推理、数学计算与代码生成——全面对标国际顶尖水平,数学能力持续领跑全球。模型支持超过130种语言,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。值得关注的是,科大讯飞在国产算力平台上攻克了两大技术瓶颈:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现质的飞跃,为AI自主可控奠定坚实基础。公司全球首发的非自回归语音大模型架构,通过并行输出文本序列,将推理成本降低520%,效果提升16%。
软硬一体化解决方案成为本次发布的另一焦点。科大讯飞推出集成AI与多模态传感器的硬件产品,重新定义人机交互体验。例如,智能办公本X5搭载上4下4环八麦克风阵列,在高噪环境下识别准确率达95.08%,远超iPhone 17 Pro;AI翻译耳机采用单耳三麦降噪系统,复杂噪声中识别率高达97.1%;双屏翻译机2.0在90分贝噪音下仍保持98.69%的识别率。在车载场景中,iFLYSOUND智能座舱音响方案通过立体空间声场重构技术,已量产应用于19家车企,出货量突破100万台,车内音效媲美百万级豪车。教育领域,AI黑板配备圆偏类自然光护眼大屏,视觉疲劳降低50%,130度超宽视野确保教室全员清晰观看;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证。

多模态交互能力方面,科大讯飞定义了八项核心技术标准,包括远场麦克风识别、3D视觉感知、多人主动交互等。数字人导览“小飞”现场演示了跨语种对话、个性化推荐及购票订酒店等任务,其背后是超拟人数字人、情感语义理解等技术的突破。发布会还首发两大个性化功能:星火X1.5通过构建用户记忆库,实现长期画像、近期反馈与短期对话的综合理解;百变声音复刻技术仅需1秒录音即可克隆任意音色,并支持风格化声音创作。刘庆峰指出,这些创新使AI从工具升级为具备情感深度的伙伴。
在应用场景拓展上,科大讯飞展示了AI在教育、医疗、出行等领域的深度实践。教育方面,星火大模型构建的错因体系获权威专家鉴定,通过智能批阅机与教师助手实现“作业批改-课堂教学”小时级闭环,推动因材施教范式变革。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半。出行场景中,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,记住用户偏好并提供体征监测,将汽车转化为“第三生活空间”。办公领域,智能办公本X5与听见APP升级说话人识别功能,手写纪要与AI纪要深度融合,更贴合用户习惯。情感陪伴方面,AI星朋友凭借4.35MOS高保真声音克隆与160种人设模型,通过自学习情感模型主动关怀用户,让科幻场景成为现实。
生态建设层面,科大讯飞启动“星火点亮全球”计划,携手多国合作伙伴推动AI技术普惠。2025年AI开发者大赛吸引17国3.6万个团队参与,诞生4622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。公司正式开源原生支持RPA的智能体平台Astron,将AI大脑与自动化手脚结合,提供八大行业智能体,助力开发者跨越应用鸿沟。刘庆峰表示:“AI不仅是硬科技,更应成为赋能每个人、温暖世界的力量。让技术理解人类需求,这是我们的初心。”
















