滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

小米开源Xiaomi-MiMo-Audio原生语音模型，多项评测超越同级及国际闭源模型

时间：2025-09-19 11:47:54 来源：小AI编辑：快讯 IP：北京 发表评论无障碍通道

小米近日宣布，正式开源其首个原生端到端语音模型Xiaomi-MiMo-Audio。该模型依托创新的预训练架构与海量训练数据，在语音领域首次实现了基于ICL（上下文学习）的少样本泛化能力，并在预训练阶段展现出显著的“涌现”特性。

据技术团队披露，Xiaomi-MiMo-Audio在多项权威评测中表现亮眼。在通用语音理解与对话任务的标准基准测试中，该模型以70亿参数规模超越了同量级的开源模型，创下该参数规模下的最佳性能纪录。其核心优势在于通过创新的预训练方法，显著提升了模型对复杂语音场景的适应能力。

在音频理解专项评测MMAU标准测试集上，Xiaomi-MiMo-Audio的得分超过Google旗下闭源语音模型Gemini-2.5-Flash。这一突破标志着开源模型在专业音频理解领域首次实现对商业闭源模型的超越，为语音技术研究提供了新的参考范式。

面对高难度音频推理任务时，该模型同样展现出强劲实力。在Big Bench Audio S2T基准测试中，Xiaomi-MiMo-Audio的性能指标超越了OpenAI开发的闭源语音模型GPT-4o-Audio-Preview。这项成就验证了模型在处理复杂语音推理任务时的技术优势，特别是在多模态语音交互场景中的创新能力。

更多>同类资讯

高精度温室气体综合探测卫星升空助力“双碳”与气候研究新突破

4月17日12时10分，我国在酒泉卫星发射中心成功将高精度温室气体综合探测卫星发射升空。新华社发本报讯（记者刘苏雅）4月17日12时10分，我国在酒泉卫星发射中心使用长征四号丙运载火箭，成功将高精度温…

04-19

弘盛铜业动力片区管廊智能巡检无人机试飞成功开启巡检新模式

4月14日，弘盛铜业动力片区管廊智能巡检无人机试飞成功。弘盛铜业厂区立体综合管廊沿道路架空敷设，总长超5公里，廊体上布设有水、高温含SO₂烟气、压缩空气、天然气、浓硫酸、蒸汽、氧气、氮气等多种介质管道以及…

04-19

首届世界无人机运动会低空智控赛开赛 340余支队伍竞逐低空应用新赛道

赛事以高校与职业院校队伍为主体，聚焦低空典型应用场景，集中检验无人机在精准投放、路径规划、飞行控制及飞行器设计等方面的综合能力，旨在突出低空领域专业人才的培养与选拔。赛事围绕典型低空应用场景设置多类型赛项，…

04-19

长春光机所创新设计：突破中红外量子级联激光器谱宽限制开启多领域应用新篇

团队提出了一种新型的中红外单核量子级联激光器有源区设计（MTC设计），实现了具有超宽增益谱和超宽室温激光光谱的量子级联激光器，成为宽调谐中红外激光光源、超短脉冲生成以及中红外光学频率梳等前沿应用的关键器件。 …

04-19

张雪机车荷兰站首战告捷虽未登领奖台但展现强劲竞争力

04-19

保利发展：聚焦核心城市筑牢根基，稳健财务护航穿越行业新周期

04-19

神舟二十一号乘组第三次出舱成功，张陆7次出舱刷新中国航天员纪录

央视网消息（新闻联播）：据中国载人航天工程办公室消息，4月17日1时36分，。为进一步深化验证航天员长期在轨驻留相关技术，充分发挥神舟二十二号飞船应急发射向空间站补充物资的综合效益，经周密论证评估，计划将该乘…

04-19

北影节红毯星光熠熠，极狐问道V9凭实力成高端出行“隐形顶流”

04-19

从创意到落地！上海科技馆临展揭秘“薛定谔的猫”如何被公众读懂

04-19

长春光机所新成果：超宽带中红外激光器突破技术瓶颈拓展应用新前景

04-19

飞絮纷飞时节到，这些科学防范妙招助你安心度日

04-19

成都淮州机场无人机赛事启幕：以赛促产，为低空经济培育“新工匠”

04-19

深势科技玻尔·跃迁实验室：打破壁垒，开启干湿闭环智能实验新篇

04-19

Anthropic CEO达里奥 · 阿莫迪：AI发展永无止境，未来五年或取代半数初级白领岗位

04-19

泰国发生一起交通事故已致8死11伤

04-19

点击查看更多 +

全站最新

捷达全新SUV概念车预告图来袭，硬朗外观吸睛，4月21日即将惊艳亮相

长城汽车32亿布局天津归元平台 “津产”魏牌V9X开启预售添新动力

广交会“老面孔”汪和平：从语言障碍到畅行全球，见证中国外贸新变迁

雷军亲测小米SU7 Pro京沪续航挑战成功！1313公里仅充一次电，实力见证

雷军直播坦言：小米汽车聚焦驾驶乐趣，有司机的大老板慎选！

热门内容

本栏最新

北影节红毯星光熠熠，极狐问道V9凭实力成高端出行“隐形顶流”

大手笔！马斯克的新“钱包”

DeepSeek突曝融资、加速“去英伟达”，黄仁勋急了！

1年15倍！光模块背后最大赢家

霍尔木兹开放，特朗普又“赢麻了”？伊朗秒打脸

万物云(02602.HK)等6家公司获调入恒生高股息率指数成份股

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

​小米开源Xiaomi-MiMo-Audio原生语音模型，多项评测超越同级及国际闭源模型​

小米开源Xiaomi-MiMo-Audio原生语音模型，多项评测超越同级及国际闭源模型