4月23日消息,距离3月18日小米一夜之间发布三款自研大模型仅仅过去36天,4月22日深夜,小米再度出手,正式发布新一代MiMo-V2.5系列大模型,涵盖MiMo-V2.5、V2.5-Pro、V2.5-TTS Series和V2.5-ASR四款模型。
其中,旗舰型号MiMo-V2.5-Pro和通用型号MiMo-V2.5将于近期面向全球开源。预告V2.5-TTS Series和V2.5-ASR即将推出。
一月一更的“小米速度”,正让这家手机巨头在大模型赛道上从“低调赶路者”向“高调竞争者”加速蜕变。
小米创始人雷军转发了MiMo-V2.5-Pro的表现,并发文:继续进步!
MiMo-V2.5系列:为智能体时代而生的全栈模型矩阵
MiMo-V2.5系列延续了小米“为Agent时代打造”的产品思路,构建了一套覆盖旗舰推理、全模态Agent与语音交互的全栈模型矩阵。
MiMo-V2.5-Pro是小米迄今最强大的模型,被定位为“为长难Agent任务而生”。在通用智能体能力、复杂软件工程以及长程任务等维度上,它已能与全球顶尖Agent模型Claude Opus 4.6、GPT-5.4正面较量,相较上一代MiMo-V2-Pro实现了全方位跃升。
内部测试中,MiMo-V2.5-Pro搭配合适的运行框架,可以稳定完成单次涉及近千轮工具调用的长程任务,在智能体场景下的指令遵循能力也明显提升,既能精准捕捉上下文中的隐性要求,又能在超长周期内保持逻辑一致。
MiMo-V2.5则定位为原生全模态Agent模型,支持看、听、读的一体化转化,Agent能力全面超越前代V2-Pro,并支持高达100万Token的上下文窗口。与Pro版本相比,V2.5的平均推理速度更快,更适合对延迟敏感的通用Agent场景。
全方位跃升:性能、效率与成本的三重突破
据介绍,相较于V2系列,MiMo-V2.5系列实现了全方位的代际跃升,主要体现在以下三个维度。
性能层面,长程任务能力迎来质变。 V2.5-Pro在多项基准测试中表现亮眼,在评估AI编程智能体(Coding Agent)设计的基准测试SWE-Bench Pro上取得57.2分, Claude Opus 4.6为57.3分。
基于小米MiMo团队开发的评估套件MiMo Coding Bench,MiMo-V2.5-Pro73.7分,与Claude Opus 4.6 (77.1分)的差距进一步缩小,MiMo-V2-Pro是71.5分。
小米团队在技术博客中举例指出,在一次实现完整SysY编译器的挑战中,V2.5-Pro仅用4.3小时、经历672次工具调用即完成全部工作,在隐藏测试集上取得233/233的满分,作为参考,北大本科生完成该项目通常需要数周时间。在另一个独立构建Web视频编辑器的任务中,V2.5-Pro历经1868次工具调用,自主构建了包含多轨道时间线、片段裁剪、交叉淡化等功能的完整应用,最终代码量达8192行。
MiMo-V2.5在多模态理解方面同样进步显著。在全面评估AI智能体解决现实世界复杂问题的能力的Claw-eval多模态评测中,MiMo-V2.取得23.8分,相比V2-Omni的15.8分有明显优化。
效率层面,Token利用率大幅提升。
据介绍,MiMo-V2.5系列在Token效率上进行了深度优化。在达到相同Agent评测分数下,V2.5-Pro相比Kimi K2.6节省42%的Token,V2.5相比Muse Spark节省50%的Token。这意味着开发者可以用更少的Token消耗完成同样的任务,显著降低使用成本。
成本层面,小米同步对TokenPlan定价方案进行了重大调整,包括:取消1Token=4Credits的计费方式,不再区分256k和1M上下文窗口的Credit倍率;新增“连续包月”“包年”订阅模式;每日凌晨至早上八时提供八折夜间专属折扣。V2.5的消耗倍率为1x,Pro版本为2x,定价更加亲民。
从3月18日V2系列发布到4月22日V2.5系列上线,间隔仅36天。
小米大模型团队负责人罗福莉曾表示,“从Chat到Agent范式的转变发生得如此之快,甚至我们自己都几乎不敢相信”。在Agent成为行业公认的AI落地方向的背景下,小米正借势快速迭代模型能力,抢先卡位移动端智能体赛道。对小米而言,大模型是智能座舱、IoT与个人助手的底层能力,“这不是跟风云厂商,而是它必须补齐的技术底盘”。
雷军在今年3月宣布,未来三年小米计划在AI领域投入超600亿元。如此巨额的投入为模型快速迭代提供了充足的资金保障。
就在昨天,小米官方宣布,小米澎湃OS 3 Beta版已向小米17系列等机型推送“龙虾”智能体Xiaomi miclaw,新增人格体系、技能体系、跨设备同步等能力,支持80余项系统工具调用。小米模型的快速迭代与终端的实际落地正在形成双向加速的良性循环,更强的模型能力为终端AI体验提供支撑,而终端的海量使用数据又反哺模型的持续优化。
在600亿AI投入的加持下,MiMo系列的“一月一更”或许才刚刚开始。对于这家将AI提升至与汽车同等重要的战略地位的巨头而言,速度本身就是竞争力。









