ITBear旗下自媒体矩阵:

科大讯飞发布星火大模型新升级,软硬一体+多模态交互,启动“星火点亮全球”计划

   时间:2025-11-07 15:19:15 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式推出讯飞星火大模型最新技术升级及系列创新产品,系统描绘了AI技术从实验室走向产业应用的清晰路径。此次发布不仅展现了我国在人工智能领域的自主突破能力,更通过多维度技术革新为全球AI发展提供了全新范式。

IMG_256

深度推理大模型讯飞星火X1.5的亮相成为全场焦点。该模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数量300亿,在保持国际领先的数学能力基础上,推理效率较前代提升100%。其多语言能力覆盖130余种语言,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。值得关注的是,星火X1.5在国产算力平台上攻克了两大技术瓶颈:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现质的飞跃,为AI技术自主可控奠定坚实基础。全球首发的非自回归语音大模型架构通过并行输出机制,在保持16%效果提升的同时,将推理成本降低520%。

软硬一体化解决方案的发布标志着AI技术向真实场景的深度渗透。科大讯飞推出的智能办公本X5搭载上4下4环八麦克风阵列,在95分贝高噪环境下仍保持95.08%的识别准确率,远超智能手机标杆产品。AI翻译耳机首创单耳三麦多感融合降噪系统,复杂噪声场景识别率达97.1%;双屏翻译机2.0在90分贝环境中实现98.69%的超高识别率。智能座舱音响方案iFLYSOUND通过立体空间声场重构技术,已在19家车企实现量产,累计出货超100万台,车内音效体验媲美百万级豪华车型。教育领域,全球首款圆偏类自然光护眼大屏使视觉疲劳降低50%,130度超宽域显示确保教室每个角落的学生都能清晰观看。

多模态交互技术的突破重新定义了人机关系。数字人导览“小飞”现场演示了八大核心能力:支持多人多语种对话、基于历史交互的个性化推荐、购票订酒店等复杂任务执行。其背后的技术支撑包括麦克风远场识别、3D视觉感知、类人举止反馈等创新模块。发布会特别推出的个性化记忆功能,通过构建用户专属记忆库,实现长期画像、近期反馈与短期对话的深度融合。百变声音复刻技术则突破传统语音合成局限,仅需1秒录音即可复刻任意音色,并支持创造全新声音风格。

IMG_256

在垂直领域应用方面,星火大模型展现出强大的场景适应能力。教育领域首创的4000+标签错因体系,通过智能批阅机和教师助手实现作业批改到个性化教学的“小时级闭环”,该成果已获国家数学课程标准修订组权威认证。医疗领域,专科诊疗能力达到三甲医院主任级医师水平,人机协同使基层诊断合理率提升9个百分点,病历书写效率翻倍。全新升级的“讯飞晓医”个人健康助手可解析99%的医学报告,累计提供1.6亿次健康咨询服务。智慧座舱2.0通过54维记忆锚点记录用户偏好,融合13个摄像头实现体征实时监测,将汽车转变为“第三生活空间”。办公场景中,智能办公本X5的手写纪要与AI生成内容深度融合,讯飞听见APP则支持基于说话人识别的会议纪要自动生成。

生态建设方面,科大讯飞宣布全面开源首个原生支持RPA的智能体平台Astron,该平台将决策大脑与执行手脚有机结合,提供八大行业“开箱即用”的智能体解决方案。2025年AI开发者大赛吸引36,898个团队参与,诞生4,622个垂直领域智能体。截至10月底,开放平台开发者总数突破968万,近一年新增200万,其中大模型企业开发者增长125%。发布会上启动的“星火点亮全球”计划,将依托多语言优势与自主技术,与全球合作伙伴共建AI发展新生态,为世界提供不同于西方技术路径的“中国方案”。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version