小米最新发布的MiMo-V2.5-Pro大模型引发行业关注,其技术突破与商业布局成为焦点。这款模型在SWE-bench Pro测试中取得57.2%的成绩,虽与榜首Claude Mythos Preview的77.8%存在差距,但已跻身全球顶尖模型行列。值得注意的是,小米仅用一个月时间就完成从V2-Pro到V2.5-Pro的迭代,展现出极强的技术执行力。
该模型的核心突破在于"长程agent"能力。在复杂任务演示中,V2.5-Pro成功完成三项高难度挑战:历时4.3小时、调用672次工具编写完整SysY编译器;11.5小时内通过1868次调用开发视频编辑器;接入ngspice仿真器优化模拟电路设计。这些任务涉及编译器构建、桌面应用开发和芯片设计等专业领域,验证了模型处理复杂工程问题的能力。小米特别强调,模型在任务执行中展现出结构化思维和自我纠错能力,例如在编译器开发中通过单次重构解决两个测试失败案例。
商业布局方面,小米推出包含四档套餐的Token Plan订阅体系,价格从每月39元至659元不等,并采用夜间折扣、年付优惠等策略。这套体系支持Claude Code、OpenClaw等主流开发框架,意图构建AI基础设施入口。更值得关注的是,小米计划通过算力集群实现规模化效应,随着用户基数扩大,边际成本将显著降低,形成类似SaaS的高毛利商业模式。这种转型若成功,将使小米从硬件制造商升级为AI生态运营者。
技术架构上,V2.5系列实现多模态与agent能力的深度融合。模型支持100万token上下文,在Video-MME测试中取得87.7分,接近Gemini 3 Pro水平;Claw-eval多模态子集得分23.8,与Claude Sonnet 4.6持平。特别在token效率方面,V2.5-Pro以约7万token/trajectory达到64% Pass³率,较同类模型节省40%-60%计算资源。这种优化使长期任务执行成本大幅降低,为工业级应用铺平道路。
尽管技术突破显著,小米仍面临多重挑战。在通用推理能力测试中,V2.5-Pro在Humanity's Last Exam仅得48.0%,落后GPT-5.4的58.7%。更关键的是,小米尚未公布完整的技术复现标准,其展示的编译器开发、电路设计等案例缺乏公开基准对比。模型高度依赖Claude Code等第三方工具链,存在生态绑定风险。虽然承诺开源,但目前仅发布V2 Flash版本,核心的V2 Pro系列仍未开放权重。
行业观察人士指出,小米的AI战略呈现明显工程化特征。不同于其他厂商侧重模型参数竞赛,小米更关注实际场景中的任务完成度。这种务实路线与其硬件基因密切相关,但能否在开发者社区建立信任,取决于技术透明度和生态开放性。当前AI市场竞争已从技术参数转向工程落地能力,小米的快速迭代策略或许能开辟新赛道。
随着Token Plan的推出,小米正构建"硬件+AI+生态"的新商业模式。这种转型需要平衡开源社区与商业利益,既要通过开源吸引开发者,又要通过订阅服务实现变现。小米汽车和IoT设备的AI化改造将成为关键验证场景,若能形成闭环生态,其算力税收模式可能重塑行业格局。不过,要真正成为AI基础设施提供商,小米还需在模型稳定性、任务复现性和生态兼容性等方面持续突破。











