在12月18日举办的小米人车家全生态大会上,新加入的“天才少女”罗福莉携团队推出MiMo-V2-Flash模型,成为全场焦点。这款参数规模达309B、激活参数15B的模型,虽被罗福莉戏称“小到不愿称其为大模型”,却凭借高性价比与快速推理能力引发行业关注。

小米团队明确将该模型定位为Agent基座,核心优化方向聚焦三大领域:强化代码与工具调用能力以提升智能体交互效率;通过混合注意力机制突破推理速度瓶颈;探索后训练范式以激发强化学习潜能。官方数据显示,MiMo-V2-Flash在SWE-Bench Multilingual测试中超越GPT-5等闭源模型,代码能力跻身全球开源模型前列。更引人注目的是其成本优势——推理价格仅为Claude Sonnet 4.5的2.5%,生成速度却达2倍,API定价输入0.7元/百万tokens、输出2.1元/百万tokens,形成显著市场竞争力。
技术架构层面,小米采用5:1比例的滑动窗口注意力(SWA)与全局注意力(GA)混合结构。实验表明,SWA在长文本处理与推理任务中表现优于主流线性注意力机制,且固定KV Cache设计便于适配现有基础设施。不过团队也坦言,300B规模距离端侧落地仍有差距,未来需进一步压缩模型体积。
罗福莉在演讲中提出更具野心的愿景:“AI进化需构建与真实环境交互的物理模型,打造具备时空连贯性的虚拟宇宙。”这一表述暗合小米双线并进的战略布局:一方面持续死磕端侧部署,通过升级“超级小爱”与澎湃OS,推动智能终端从指令执行向主动服务转型;另一方面加速智驾领域突破,以大模型为基座拓展自动驾驶能力边界。

回顾2025年,小米在AI领域呈现加速奔跑态势:4月开源MiMo-7B系列,5月突破多模态视觉理解,11月整合自动驾驶与机器人技术推出具身智能大模型,12月以MiMo-V2-Flash完成年度收官。这一连串动作背后是巨额投入——集团总裁卢伟冰透露,2025年研发投入将超300亿元,其中四分之一直投AI领域,未来五年计划投入超2000亿元。组织架构上,小米已搭建自主AI Infra平台,并秘密组建6500张GPU的万卡集群,为大规模模型训练提供算力支撑。
人才战略同样关键。除罗福莉领衔基础模型研发外,小米还引入陈龙团队攻克智驾难题。双方协作成果显著:陈龙团队提出的跨具身基座模型MiMo-Embodied,成功打通自动驾驶与机器人操作的知识迁移通道。这一突破意味着小米正尝试用统一AI逻辑驱动手机、智能家居、智能汽车等全生态硬件,形成技术协同效应。
市场分析认为,小米的AI战略正从技术储备转向生态落地。其全球超10亿台设备连接量构成独特优势,但挑战同样严峻:如何让模型在多样终端上保持稳定性能,如何将技术突破转化为用户可感知的体验提升,将成为决定这场进化能否成功的关键因素。

















