滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

小米MiMo-VL大模型开源，多模态推理能力领先同尺寸标杆Qwen2.5-VL-7B

时间：2025-05-30 16:13:15 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

小米公司近日宣布了一项重大进展，其多模态大模型Xiaomi MiMo-VL已正式向公众开放源代码。这一消息由Xiaomi MiMo官方公众号发布，标志着小米在人工智能领域迈出了重要一步。

据官方介绍，Xiaomi MiMo-VL在多模态任务上表现出色，尤其在图片、视频、语言通用问答及理解推理等方面，相较于同尺寸的多模态标杆模型Qwen2.5-VL-7B，有着显著的优势。更为引人注目的是，在GUI Grounding任务上，MiMo-VL的表现甚至可以与专用模型相媲美，预示着其在智能代理（Agent）时代的巨大潜力。

特别MiMo-VL-7B版本在保持小米MiMo-7B纯文本推理能力的基础上，进一步在多模态推理任务上取得了突破。仅需7B参数规模，它就在奥林匹克竞赛（OlympiadBench）及多个数学竞赛（MathVision、MathVerse）中，大幅领先参数规模达10倍的阿里Qwen-2.5-VL-72B和QVQ-72B-Preview，甚至超越了闭源模型GPT-4o。

在小米内部进行的大模型竞技场评估中，MiMo-VL-7B同样表现出色，超越了GPT-4o，成为开源模型中的佼佼者。这一成就不仅验证了MiMo-VL的卓越性能，也彰显了小米在人工智能技术研发方面的深厚实力。

MiMo-VL-7B的应用场景广泛，能够完成复杂的图片推理和问答任务。在长达10多步的GUI操作上，它也展现出了不俗的潜力。例如，用户可以通过MiMo-VL-7B轻松地将小米SU7添加到心愿单中，享受更加便捷的智能体验。

小米表示，MiMo-VL的成功得益于高质量的预训练数据以及创新的混合在线强化学习算法（MORL）。为了训练这一模型，小米收集了涵盖图片-文本对、视频-文本对、GUI操作序列等多种类型的高质量数据，总计达到2.4T tokens。通过分阶段调整不同类型数据的比例，小米强化了模型的长程多模态推理能力。同时，混合文本推理、多模态感知+推理、RLHF等反馈信号，并通过在线强化学习算法稳定加速训练，全方位提升了模型的推理、感知性能和用户体验。

目前，MiMo-VL-7B的RL前后两个模型已经开源，并提供了相应的技术报告和测评任务框架。感兴趣的开发者可以前往Huggingface和GitHub平台获取更多信息，共同探索人工智能技术的无限可能。

更多>同类资讯

百亿投资加速布局，1400亿市值沪电股份能否在AI浪潮中重夺PCB龙头？

03-13

英伟达豪掷260亿美元入局AI大模型，从“卖铲人”变身“挖金者”

03-13

卡萨帝AWE发布指挥家套系：AI全景智能体引领家庭智能化新变革

03-13

量化三巨头竞逐AI大模型：AGI、垂直专家与科研助手的三重路径

03-13

跳出单品红海，MOVA以主动智能架构重塑全球家庭生活新范式

03-13

寒武纪2025年首度盈利：营收激增453% 研发投入与市场拓展双轮驱动

03-13

“龙虾”热潮下的众生相：有人狂热追捧，有人冷静退场，有人执着探索

03-13

松延动力姜哲源谈行业：上春晚非投资关键，具身智能赛道马太效应将加剧

03-13

品牌战略全面升级长城欧拉5泰国发布：多动力版本首次亮相

03-13

DeepSeek V4来了？

03-13

声网AWE2026大放异彩：RTC与对话式AI融合，引领硬件交互新变革

03-13

魔法原子AWE展风采：春晚机器人亮相，具身智能全场景应用加速落地

03-13

理想汽车财报会聚焦：2026策略明晰，应对涨价与布局具身智能并行

03-13

OpenAI旧金山办公版图再扩大新增28万平方英尺总面积超百万

03-13

大晓机器人开源Kairos 3.0-4B模型推动具身智能迈向实际应用新阶段

03-13

点击查看更多 +

全站最新

A股异动丨钒钛股份跌逾4% 股东营口港务拟减持不超0.7%股份

A股收评：三大指数齐跌，沪指跌0.81%下破4100点，化肥、风电板块逆市走高

AWE2026现场直击：小度全系产品登场，解锁多模态AI生活新体验

2025年尼康影像产品大放异彩，海内外年度评选斩获众多荣誉

声网AWE2026大放异彩：RTC与对话式AI融合，引领硬件交互新变革

魔法原子AWE展风采：春晚机器人亮相，具身智能全场景应用加速落地

热门内容

本栏最新

声网AWE2026大放异彩：RTC与对话式AI融合，引领硬件交互新变革

魔法原子AWE展风采：春晚机器人亮相，具身智能全场景应用加速落地

星辰未来AWE2026大放异彩，AI与AR融合开启未来出行新篇章

理想2025年利润承压跌近九成，2026年押注AI迈向具身智能新赛道

理想2025利润承压遇挑战李想布局AI锚定2026具身智能转型关键年

理想汽车电话会：新L9技术重构领航，纯电车型突破，AI转型加速进化

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.