滚动资讯

当前位置：首页 > 资讯 > 智能汽车 > 正文内容

小米开源MiDashengLM-7B大模型，刷新22项评测记录，引领音频理解新潮流

时间：2025-08-04 20:09:35 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

小米公司近期宣布了一项重大技术进展，正式向公众开源了其声音理解大模型MiDashengLM-7B。这一举措标志着小米在AI技术研发领域迈出了重要一步，尤其是在声音理解方面。

据悉，MiDashengLM-7B在多个公开评测集上刷新了多模态大模型的最佳成绩，其单样本推理的首Token延迟仅为业界先进模型的四分之一，同时在同等显存下的数据吞吐效率更是达到了业界先进模型的20倍以上。这一卓越性能的实现，得益于小米在音频编码器和自回归解码器方面的创新设计。

MiDashengLM-7B基于Xiaomi Dasheng音频编码器和Qwen2.5-Omni-7B Thinker自回归解码器，通过通用音频描述训练策略，实现了对语音、环境声音和音乐的统一理解。这一跨领域的理解能力，使得MiDashengLM-7B不仅能够准确识别用户周围的语音信息，还能深入理解环境声音和音乐背后的含义，从而提高了用户场景理解的泛化性。

小米表示，音频理解是构建全场景智能生态的关键领域。MiDashengLM-7B的推出，将进一步推动小米在智能家居、汽车座舱等领域的智能化进程。目前，该系列模型已经在小米的多个产品中得到了应用，为用户带来了更加智能、便捷的交互体验。

值得注意的是，MiDashengLM-7B的训练数据全部来自公开数据集，涵盖了语音识别、环境声音、音乐理解、语音副语言和问答任务等多个领域。小米在数据使用和处理方面的高度透明性，也为业界提供了可复现的参考案例。

在性能表现方面，MiDashengLM-7B在音频描述、声音理解、音频问答等任务中均展现出了明显的优势。与同类7B模型相比，MiDashengLM-7B在音频描述任务中的FENSE指标更高，声音理解任务中的性能也更胜一筹。在语音识别任务中，MiDashengLM-7B在GigaSpeech 2数据集上的表现尤为突出。

除了卓越的性能表现外，MiDashengLM-7B在推理效率方面也取得了显著提升。对于单个样本推理的情形，MiDashengLM-7B的首个token预测时间仅为Qwen2.5-Omni-7B的四分之一。在批次处理时，MiDashengLM-7B能够在80GB GPU上处理更大的batch size，从而提高了数据吞吐效率。

这一系列优势的背后，是小米在音频编码器设计方面的优化和创新。通过降低音频编码器的输出帧率，小米成功降低了计算负载，实现了推理效率的提升。这一创新设计不仅提高了MiDashengLM-7B的性能表现，也为业界提供了有益的参考和借鉴。

MiDashengLM-7B还采用了通用音频描述对齐范式进行训练。这一范式避免了传统ASR转录数据对齐方法的局限性，能够迫使模型学习音频场景的深层语义关联。同时，小米还利用多专家分析管道生成训练数据，对原始音频进行细粒度标注，从而提高了模型的训练效果。

小米表示，未来将继续对Xiaomi Dasheng系列模型进行升级和优化，寻求在终端设备上实现离线部署。这将进一步推动小米在AI技术研发领域的领先地位，为用户提供更加智能、便捷的交互体验。

更多>同类资讯

基本半导体拟赴港上市：2025上半年营收1亿亏损1.77亿广汽智行等参股

12-04

奥迪E SUV概念车亮相广州车展，AUDI电动序列迈向体系化新阶段

12-04

保时捷纯电卡宴成最重量产车，重而不笨且越野或有新优势

12-04

福特新蒙迪欧焕新登场，以全能实力解锁多元出行，开启精彩新篇

12-04

福特新蒙迪欧焕新登场，14.98万起享全能实力与精彩生活新体验

12-04

曹操出行Robotaxi战略升级：绘就“十年百城千亿”绿色智能出行蓝图

12-04

江苏车饰龙头新泉股份创始人离世家族内部平稳传承实控权变更

12-04

安全为先载重强，节油有道东风伴——赵昌达的东风多利卡康陆威购车故事

12-04

乐道L90上市四月交付破4万，古天乐成黑骑士特别版首位车主引关注

12-04

朱雀三号遥一发射：高华科技助力入轨，回收试验虽憾但探路前行

12-04

江铃驭胜S350与S330全系列汽油柴油四驱N352维修电路图手册汇总

12-04

全球首条百兆瓦级全固态锂电池量产线投产中国固态电池产业化迈出关键一步

12-04

2025中国新能源汽车满意度升至80分自主品牌领跑细分市场

12-04

极氪8X路试谍照来袭！明年一季度亮相预计40万元起售

12-04

极氪8X路试谍照来袭！明年一季度亮相预计40万起售引期待

12-04

点击查看更多 +

全站最新

第三代蓝电E5 PLUS上市，12万级插混SUV的“唯一”之选来了

东风日产N6上市：以“两个王四个2”实力，开启插混轿车新舒适篇章

华系崛起正当时：岚图追光L与享界S9引领中国豪华车新征程

赛力斯再出招！蓝电E5 PLUS以独特优势，重塑12万级混动SUV格局

BBA智电转型大动作！2026年三款新车将至，哪款是你的菜？

东风日产N6上市！9万级插混轿车携“两个王四个2”开启舒适出行新体验

热门内容

本栏最新

奥迪E SUV概念车亮相广州车展，AUDI电动序列迈向体系化新阶段

保时捷纯电卡宴成最重量产车，重而不笨且越野或有新优势

福特新蒙迪欧焕新登场，以全能实力解锁多元出行，开启精彩新篇

福特新蒙迪欧焕新登场，14.98万起享全能实力与精彩生活新体验

安全为先载重强，节油有道东风伴——赵昌达的东风多利卡康陆威购车故事

乐道L90上市四月交付破4万，古天乐成黑骑士特别版首位车主引关注

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.