小米公司近日宣布其MiMo大模型系列迎来重要更新,一口气推出四款新模型,包括旗舰推理模型MiMo-V2.5、全模态Agent模型V2.5-Pro,以及即将发布的V2.5-TTS Series和V2.5-ASR。其中,V2.5-Pro已开启公测并将开源,这一系列动作距离上一代MiMo-V2系列发布仅过去36天,显示出小米在人工智能领域的快速迭代能力。
此次升级的核心团队由原DeepSeek核心成员罗福莉领衔,她因在AI领域的突出贡献被业内称为"天才少女"。罗福莉曾表示,未来模型稳定后将开源,此次V2.5-Pro的公测和开源计划正是这一承诺的兑现。新系列模型延续了为智能体场景打造的定位,V2.5-Pro专注于长难Agent任务,V2.5则覆盖绝大多数通用Agent场景。
在性能方面,MiMo-V2.5系列展现出显著提升。全系列支持原生全模态Agent能力,涵盖图像、音频与视频处理。相比Pro版,V2.5平均推理速度更快,更适合对时延敏感的任务。在智能体基准榜单Claweval的测试中,V2.5-Pro相比Kimi本周发布的K2.6模型节省了42%的Token消耗;V2.5相比meta的Muse Spark模型节省了50%的Token,显示出更高的Token使用效率。
实际应用测试中,MiMo-V2.5-Pro展现出强大能力。在开发3D横版格斗游戏的测试中,该模型仅用几分钟就生成了包含1123行代码的"龙虎格斗游戏",具备完整的血条、角色名、倒计时等界面元素,以及命中反馈和镜头震动等系统。虽然角色造型较为简单,但游戏已具备基本可玩性。
更令人印象深刻的是专业领域的应用案例。在北京大学编译原理课程项目中,V2.5-Pro用时4.3小时、经过672次工具调用,完成了通常需要本科生数周才能实现的SysY编译器开发,在隐藏测试集上取得满分。在视频编辑器开发任务中,该模型交付了具备多轨道时间线、片段裁剪等功能的Web应用,代码量达8192行。在模拟电路设计领域,V2.5-Pro仅用约一小时就完成了翻转电压跟随器低压差线性稳压器的设计,且多个关键指标比初始版本提高了一个数量级。
通用场景表现同样出色。在面向AI智能体的端到端可信评测基准Claw-eval中,V2.5的表现超过上一代旗舰模型V2-Pro,同时API成本降低约50%。在跨模态推理、视频理解等基准测试中,其表现已接近或超越Claude Opus 4.6、Gemini 3 Pro等闭源模型。编程能力测试显示,V2.5在日常编程任务中已超越Gemini 3.1 Pro。
伴随新模型发布,小米还优化了订阅式API调用套餐MiMo Token Plan。新计划取消了1 Token=4 Credits的计费方式,不再区分256k和1M上下文窗口的Credit倍率。V2.5和V2.5-Pro分别按1x和2x计费,显著降低了使用成本。计划还提供夜间专属优惠(00:00-08:00打8折),并上线连续包月和包年订阅模式,包年订阅最高可减免近千元费用。
这一系列升级表明,小米正通过自研底层大模型、系统级权限和全生态服务的深度融合,打造真正意义上的系统级原生智能体。其技术路线显示出,轻量化模型既能实现媲美超大模型的智能体表现,又能兼顾实用性与成本效益,为AI技术在终端设备的规模化应用提供了新思路。













