在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以"更懂你的AI"为主题,发布了讯飞星火大模型最新技术升级及系列产品,系统描绘了AI技术从实验室走向产业应用的实践路径。董事长刘庆峰在发布会上指出,AI技术要真正服务于人类社会,必须突破自主可控、软硬一体、行业纵深和个性化服务四大核心挑战。目前,该公司在与头部企业联合打造的300多个智能体应用中,已涌现出多个能替代人类完成复杂任务的"AI员工",其中"星火行业分析师"以92分的成绩通过工信部认证考试,超越85%的人类考生。

全新发布的讯飞星火X1.5大模型采用MoE架构,总参数量达293B,激活参数量30B,其推理效率较前代产品提升100%。该模型在语言理解、文本生成、逻辑推理等六大核心能力上全面对标国际主流,数学能力持续保持领先地位。特别值得注意的是,其多语言支持能力覆盖130个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言区域表现尤为突出。在自主可控算力平台建设方面,科大讯飞成功攻克两大技术瓶颈:长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率实现质的飞跃。公司还全球首发非自回归语音大模型架构,在保持16%效果提升的同时,将推理成本降低520%。
软硬一体化解决方案成为本次发布会的另一大亮点。基于独家"AI+麦克风阵列技术",讯飞智能办公本X5采用创新的上4下4环八麦克风布局,在90分贝高噪环境下仍保持95.08%的识别准确率,远超iPhone 17 Pro的表现。AI翻译耳机通过单耳三麦多感融合系统,在复杂噪声环境中实现97.1%的识别准确率。智能座舱音响方案iFLYSOUND通过立体空间声场重构技术,已在19家车企量产落地,累计出货超100万台,车内音效达到百万级豪车标准。在视觉健康领域,讯飞AI黑板搭载的圆偏类自然光护眼大屏使视觉疲劳降低50%,130度超宽域显示确保教室每个角落的学生都能清晰观看。
多模态交互技术的突破为AI应用开辟了新维度。数字人导览"小飞"现场演示了多人多语种对话、个性化推荐、任务执行等能力,其背后是麦克风远场识别、3D视觉感知、视听觉融合理解等八项核心技术的突破。星火X1.5新增的个性化记忆功能,通过构建用户画像库实现长期偏好、近期反馈和短期对话的综合理解。百变声音复刻技术则可基于单句录音复刻任意音色,并支持通过指令创造个性化声音风格。这些技术使AI从单纯的工具升级为具有情感温度的智能伙伴。

在行业应用层面,星火大模型展现出强大的场景适应能力。教育领域首创的错因体系包含3大类、3层级、4000+标签,通过智能批阅机和教师助手实现"小时级"教学闭环。医疗领域,"智医助理医院版1.0"提供辅助诊疗和病历生成功能,试点显示人机协同使诊断合理率提升9个百分点,病历书写时间减少50%。星火智慧座舱2.0融合13个摄像头和54维记忆锚点,可实时监测5项生理指标,将汽车打造为"第三生活空间"。情感陪伴领域,"AI星朋友"拥有4.35MOS高保真声音克隆和160余种人设模型,能通过自学习情感模型主动发起交流。
生态建设方面,2025年AI开发者大赛吸引17个国家36,898个团队参与,催生4,622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,其中大模型企业开发者增长125%。公司正式开源首个原生支持RPA的智能体平台Astron,将智能决策与自动化执行深度融合,并提供八大行业智能体解决方案。在全球化布局上,"星火点亮全球"计划将依托多语言技术和自主可控优势,与各国合作伙伴共建AI技术生态,为世界提供不同于现有体系的AI发展路径。
























