AIPress.com.cn报道
4月23日,小米Mimo研究所发文宣布,小米MiMo-V2.5-Pro及MiMo-V2.5模型开启公测,并即将开源,还有语音合成和语音识别系列紧随其后。
MiMo-V2.5系列,四款模型同时亮相。
带队的人还是罗福莉。
如果你关注AI圈,应该知道这个名字。她是前DeepSeek-V2核心研发成员,业内人称"天才少女"。
有意思的是,就在小米发模型的这个当口,业界盛传DeepSeek V4将于本周发布。
一个前DeepSeek核心成员,带着新东家在最敏感的时间点亮剑了。
一、MiMo-V2.5模型定位专为Agent场景打造先搞清楚小米这次发了什么。
MiMo-V2.5系列不擅长写朋友圈文案。它的定位极其明确,专为Agent场景打造。
MiMo-V2.5-Pro,小米迄今最强模型,专攻长难Agent任务。在SWE-bench Pro(软件工程)、Claw-eval(智能体评估)、τ3-Bench(长程推理)等基准上,直接对标Claude Opus 4.6和GPT-5.4。
它能稳定完成单次近千轮工具调用的长程任务,在超长周期内保持逻辑一致。
MiMo-V2.5标准版,原生全模态Agent,覆盖图像、音频、视频,平均推理速度比Pro版更快(100-150 tokens/s),适合办公、数据分析等时延敏感场景。
当然了,光说参数没感觉,看三个官方实测:
北大编译原理课程项目:
用Rust从零实现完整SysY编译器,包括词法分析、语法分析、IR生成、RISC-V后端、性能优化。北大本科生通常做数周,MiMo-V2.5-Pro4.3小时、672次工具调用,隐藏测试满分。
视频编辑器Web应用:
多轨道时间线、片段裁剪、交叉淡化、音频混合、导出流程。代码量8192行,11.5小时自主完成,1868次工具调用。
模拟电路EDA设计:
基于台积电180nm工艺设计FVF-LDO稳压器,连接ngspice仿真闭环迭代,约一小时生成满足全部指标的设计,部分指标比初始版本提升一个数量级。
这些任务的核心特征在于:它们重在独立完成项目,绝非简单回答问题。
至于网红问题,50米洗车该走路还是开车,
小米的新模型是这么说的:
二、小米选择的突破口Agent时代的效率优先级OpenAI强在通用能力和品牌护城河,DeepSeek强在极致性能和开源生态。小米凭什么插一脚?
凭的是Token效率。
在Agent基准Claweval上,MiMo-V2.5-Pro拿到相同分数的情况下,比Kimi本周发布的K2.6省了42% Token;MiMo-V2.5比meta的Muse Spark省了50% Token。
别小看这个数字。Agent任务绝非一问一答,往往涉及几百上千轮的工具调用、代码执行、错误诊断、自我修正。
Token消耗是指数级增长的,省42%意味着同样的预算,任务完成率大幅提升。
在Claweval的散点图上,MiMo-V2.5系列牢牢占据左上角最优区域,即通过率高且Token消耗低。
而DeepSeek V3.2位于右下角,通过率低且Token消耗极高。
技术路线已经出现分化。
省钱本身就是一种技术壁垒。
三、DeepSeek前核心成员罗福莉带队罗福莉不是普通研究员。在DeepSeek期间,她是V2模型的核心研发成员。DeepSeek-V2去年以极致性价比震动行业,罗福莉是背后关键推手之一。
加盟小米后,她只花了36天就把MiMo从V2迭代到V2.5,性能从接近一线拉到对标顶尖。
更戏剧性的是,今年3月,MiMo-V2-Pro曾以"Hunter Alpha"的匿名身份上线OpenRouter平台,被大量开发者误认为是即将发布的DeepSeek V4。
一个小米的模型,被当成DeepSeek的下一代旗舰,这说明什么?说明在硬核开发者眼里,罗福莉出品,天然带有DeepSeek级别的技术预期。
当OpenAI靠Altman的品牌、DeepSeek靠梁文锋的极客文化吸引顶尖人才时,小米靠的是罗福莉这样的技术IP。
她不仅带来算法能力,更带来一套已经被验证过的高效训练+极致推理的方法论。
四、Mimo模型的竞争力人车家生态同步OpenAI没有手机,DeepSeek没有汽车,Kimi没有IoT生态。小米有6亿+月活设备,有SU7,有澎湃OS,有从手环到电视的全场景入口。
现在谁家里没有一两件印着小米Logo的东西呢?
你的手机Agent自动整理相册并剪辑旅行视频;你的车机Agent根据实时路况和电量规划跨省路线;你的家庭Agent协调空调、灯光、扫地机器人完成"回家模式"。
这类任务超出了ChatGPT的能力边界,因为它们需要理解物理世界、调用硬件工具、在端侧高效运行。
小米自己做基座模型,目标绝非在榜单上打败OpenAI,核心诉求在于不让自己的生态命脉掌握在第三方手里。
当Agent成为下一代交互方式时,没有自研模型的大厂,才是真正的"组装厂"。
五、DeepSeek V4前夜发布说到这儿,必须回到那个最敏感的话题:DeepSeek V4。
业内传闻,DeepSeek V4将于本周发布。而小米选择在这个时间点发布V2.5,很难说是巧合。
罗福莉从DeepSeek到小米,带走的东西远超某段代码本身,核心是对Scaling Law和Agent架构的深度理解。
当DeepSeek V4本周真的发布时,行业会再次为性能数字沸腾。
但不要忘了,就在它发布的前夜,一个硬件大厂已经证明:
AI竞争的下半场,核心看点已从谁更聪明,转向谁更能落地。
而落地,恰恰是小米最熟悉的主场。











