在12月18日的小米“人车家全生态大会”上,一款名为MiMo-V2-Flash的新模型成为焦点。这款由新加入的“天才少女”罗福莉主导研发的模型,标志着小米在人工智能领域迈出了重要一步。尽管参数规模仅为309B,激活参数15B,但小米团队将其定位为Agent训练的基座模型,重点优化了高性价比和快速响应能力。
MiMo-V2-Flash的核心优势体现在三个方面:每秒150 tokens的生成速度、极低的成本,以及在保持高性价比的同时不牺牲性能。罗福莉在发布会上透露,该模型的代码能力和Agent能力已在全球开源模型评估榜单中跻身前列,部分指标甚至超越了DeepSeek-V3、Kimi K2-Thinking等知名模型,而参数规模仅为后者的1/2至1/3。例如,在SWE-Bench Multilingual测试中,MiMo-V2-Flash的表现优于包括GPT-5在内的多个闭源大模型。
这一成果的背后,是小米对技术路径的独特选择。罗福莉指出,当前模型学习方向与生物智能进化存在背离,单纯依靠“大力出奇迹”已难以实现更高阶的智能突破。因此,小米转向了更契合自身需求的路径——开发参数小、性能优且成本低的模型。具体而言,MiMo-V2-Flash采用了5:1的滑动窗口注意力(SWA)与全局注意力(GA)混合结构。实验数据显示,SWA在长文处理和推理能力上优于主流线性注意力机制,且固定大小的KV Cache使其更容易适配现有基础设施。
小米的AI战略已进入加速期。2025年,公司计划投入超过300亿元用于研发,其中四分之一(约75亿元)直接投向AI领域,并规划未来五年累计投入超2000亿元。组织层面,小米自2024年起搭建了AI Infra平台,并着手构建GPU万卡集群,目前团队已拥有6500张GPU资源。人才方面,除罗福莉负责基础大模型外,小米还引入陈龙团队,后者提出并开源了全球首个打通自动驾驶与具身操作的跨具身基座模型MiMo-Embodied,试图解决两者间的知识迁移难题。
这一系列动作的逻辑清晰可见:小米正试图用一套通用的AI逻辑驱动其庞大的硬件生态,覆盖手机、智能家居到智能驾驶的全场景。MiMo-V2-Flash的发布,不仅是技术实力的展示,更是小米向资本市场和用户传递的新信号——这家硬件巨头正通过掌握高效的“大脑”和广泛的“身体”,在智能时代完成关键转型。然而,技术突破能否真正转化为用户体验的提升,仍需时间检验。











