小米在人工智能领域再落重子,一口气推出三款大模型:面向Agent时代的旗舰基座模型Xiaomi MiMo-V2-Pro、全模态基座模型Xiaomi MiMo-V2-Omni,以及语音合成模型Xiaomi MiMo-V2-TTS。其中,MiMo-V2-Pro在Artificial Analysis全球大模型榜单中位列第八,按品牌维度计算则高居第五,甚至超越了xAI的Grok。这场低调发布的技术突围,让外界重新审视小米在AI赛道的战略布局。
这场技术突围的幕后操盘手,正是去年12月从DeepSeek加盟小米的罗福莉。这位被外界称为“天才少女”的AI工程师,用三个月时间交出第二份答卷——此前发布的MiMo-V2-Flash已展现其技术锐度,而此次三款模型同步亮相,更凸显小米在多模态交互与具身智能领域的野心。雷军在微博坦言:“我们在AI领域实际进展比外界看到的更快。”
新模型的发布充满戏剧性。MiMo-V2-Pro与MiMo-V2-Omni的早期测试版在OpenRouter平台匿名上线后,连续多日登顶API调用量日榜,甚至引发“是否为DeepSeek新模型”的猜测。这种“扮猪吃老虎”的测试策略,恰与罗福莉“悄无声息的伏击”的自我评价不谋而合。她坦言,从Chat到Agent的技术范式转换速度超出团队预期,但小米需要这种“一鸣惊人”的破局方式。
罗福莉的技术成长轨迹堪称典型逆袭样本。这位1995年出生于四川宜宾的工程师,大学期间曾因编程基础薄弱在班级垫底,却通过七周自学Python、四个月产出顶会论文的“蜗牛式”追赶,最终拿下北大计算机系唯一保研名额。在阿里达摩院期间,她主导开发的多语言预训练模型VECO成为跨境电商核心工具;转战DeepSeek后,又带领团队将DeepSeek-V2的推理成本压至每百万tokens仅1元,创下行业新低。
小米AI战略的转型节点出现在2025年。尽管早在2021年就布局具身智能,2023年发布MiLM-6B模型,但始终未能跻身第一梯队。当字节跳动、阿里巴巴等企业掀起AI人才争夺战时,雷军以重金挖角罗福莉的举动引发行业震动。这位兼具学术深度与工程落地能力的技术领袖,被赋予整合小米数字智能与具身智能双线作战的重任——前者聚焦应用交互,后者直指物理世界交互,两条技术路径的协同难度远超常规企业。
在2025小米“人车家全生态”合作伙伴大会上,罗福莉首次以核心演讲者身份亮相,系统阐释了小米的AI进化论。她提出,下一代智能体必须突破“语言模拟器”的局限,构建能理解物理规律的“世界模型”。这种技术理念与李飞飞、杨立昆等学者的路径不谋而合,却与OpenAI前首席科学家伊利亚·苏茨克维主张的“纯文本学习通向通用智能”形成鲜明对立。这种技术路线的选择,折射出小米在AI竞赛中的差异化定位。
管理协同成为罗福莉面临的新挑战。作为小米集团技术委员会直属的大模型Core团队负责人,她需要协调终端、自动驾驶等成熟业务线的研发节奏。这种组织架构设计,让人联想到小米2017年首次造芯时遭遇的内部阻力——当时松果电子研发的芯片因缺乏业务线支持最终折戟,直到2021年将芯片团队并入手机部后才重启成功。如今罗福莉能否打破部门壁垒,将决定小米AI战略的落地成效。
从学术圈到工业界,从DeepSeek到小米,罗福莉始终保持着“垫底者”的清醒认知。她曾在朋友圈写道:“请还我安静做事的环境,我不是天才少女。”这种对努力价值的坚持,或许正是小米在AI长跑中最需要的品质。当行业还在争论技术路线时,小米已用三款模型完成首次战略卡位,而这场“伏击战”能否转化为持久战斗力,将取决于罗福莉团队接下来的技术突破与组织融合能力。










