ITBear旗下自媒体矩阵:

科大讯飞发布星火大模型升级成果,软硬一体+多模态交互,启动“星火点亮全球”计划

   时间:2025-11-07 15:26:52 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式推出讯飞星火大模型最新技术升级及系列创新产品,全面描绘了AI技术落地产业、服务民生的实践路径。董事长刘庆峰在演讲中强调,AI价值的释放需突破四大核心挑战:自主可控的技术底座、软硬协同的融合能力、垂直领域的深度应用以及个性化服务体验。目前,这一战略已取得阶段性成果,联合头部企业打造的300余个“即插即用”智能体中,多个“AI员工”表现亮眼。例如,“星火行业分析师”成为国内首个通过工信部认证的行业分析AI工具,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。

IMG_256

此次发布的深度推理大模型讯飞星火X1.5成为全场焦点。该模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数300亿,推理效率较前代提升100%。其语言理解、数学能力等六大核心指标全面对标国际顶尖水平,数学能力持续领先,多语言支持覆盖130余个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现更优。技术突破方面,科大讯飞攻克了两大难题:一是将长思维链强化学习的训练效率从30%提升至84%以上;二是实现MoE模型全链路训练效率的质的飞跃,为国产算力平台树立新标杆。全球首发的非自回归语音大模型架构通过并行输出文本序列,使推理成本降低520%,效果提升16%。

软硬一体化解决方案的推出,标志着AI技术向真实场景的深度渗透。科大讯飞展示了多款融合AI与硬件的创新产品:智能办公本X5搭载上4下4环八麦克风阵列,在嘈杂环境中识别准确率达95.08%,远超iPhone 17 Pro;AI翻译耳机采用单耳三麦降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0在90分贝噪音下仍保持98.69%的识别率。扬声器阵列技术方面,智能座舱音响方案iFLYSOUND通过立体声场重构,已量产应用于19家车企,出货量突破100万台,车内音效媲美百万级豪车。视觉健康领域,AI黑板配备圆偏类自然光护眼大屏,视觉疲劳降低50%,显示角度达130度;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证。

IMG_256

多模态交互能力的升级重新定义了人机协作边界。数字人导览“小飞”现场演示了跨模态交互场景:支持多人多语种对话、基于历史记录的个性化推荐,并能独立完成购票、订酒店等任务。其背后是八大核心技术的突破,包括麦克风远场识别、3D视觉感知、情感语义理解等。发布会首发的两项技术尤为引人注目:个性化记忆库通过整合用户长期画像、近期反馈和短期对话,使AI具备“懂你”的认知能力;百变声音复刻技术仅需1秒录音即可克隆任意音色,并支持指令生成多样化风格声音。刘庆峰指出,这些技术将推动AI从工具向情感伙伴进化。

在应用场景拓展方面,科大讯飞展示了AI在教育、医疗、出行等领域的深度实践。教育领域,星火大模型构建了包含4000余标签的错因分析体系,通过智能批阅机和教师助手实现“作业批改-课堂施教”小时级闭环,引领教学范式变革。医疗领域,星火医疗大模型诊疗能力达三甲医院主任级水平,人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半。新发布的“智医助理医院版1.0”提供辅助诊疗、病历生成等功能,“讯飞晓医”个人健康助手已累计完成1.6亿次咨询。出行领域,星火智慧座舱2.0通过54维记忆锚点记录用户偏好,融合13个摄像头实现5项体征监测,打造“第三生活空间”。办公场景中,智能办公本X5和听见APP支持说话人识别自动生成会议纪要,手写内容与AI纪要无缝融合。

生态建设层面,科大讯飞宣布全面开源原生支持RPA的智能体平台Astron,将“大脑”与“手脚”结合,提供八大行业智能体,助力开发者跨越AI应用门槛。2025年AI开发者大赛吸引17国3.6万余团队参与,涌现4622个垂直领域智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。发布会最后,科大讯飞携手多国伙伴启动“星火点亮全球”计划,旨在通过多语言技术和自主可控方案,为全球提供AI发展的替代性选择,加速技术红利普惠共享。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version