在小米近期举办的一场合作伙伴大会上,一位95后科学家的亮相引发了广泛关注。她就是罗福莉,曾是DeepSeek的核心成员,被业内誉为“天才少女”。此次她以小米MiMo大模型负责人的身份首次公开亮相,为小米在人工智能领域的发展带来了新的思路与方向。
罗福莉在大会上的表现虽略显青涩,与小米一贯成熟的营销风格形成对比,但她带来的开源模型MiMo-V2-Flash以及小米集团总裁卢伟冰宣布的未来五年2000亿元研发投入规划,都清晰地展现出小米在AI时代的战略布局。当下,传统硬件制造利润不断收窄,以大模型为核心的智能服务成为企业转型和提升市值的关键因素。雷军不惜重金引入罗福莉,既是对小米技术短板的补充,也是基于商业理性的战略考量。
科技商业格局正经历着深刻变革,掌握核心智能技术成为企业守护自身生态的关键。对于小米庞大的硬件生态而言,只有拥有自主的智能“大脑”,才能避免沦为他人的附庸。罗福莉在大会上提出了一个与众不同的技术路线,与行业普遍追求的Scaling Law(规模法则)形成鲜明反差。
她指出,当前的大模型本质上只是“语言模拟器”,并非真正的智能体。她从哲学角度分析,人类进化是自下而上的,先有对物理世界的感知和行动,才产生语言;而当前AI的发展路径却完全相反,跳过了对真实世界的感知,直接从语言符号入手,这种“头重脚轻”的路径构建出的只是“空中楼阁”。例如,AI能写出莎士比亚风格的诗歌,却无法理解基本的物理法则,容易产生具身幻觉。她强调:“真正的智能源于交互,而非文本阅读。”
基于这一理念,罗福莉为小米规划了一条独特的技术路线:不追求“全知全能”的云端模型,而是打造“知行合一”的物理大脑。在技术实现上,她展示的MiMo-V2-Flash采用了实用主义策略。该模型采用MoE(混合专家)架构,总参数达309B,但实际运行时仅激活15B,这种轻量化设计使其能够适配手机和汽车的芯片。
为了实现这一目标,MiMo-V2-Flash采用了一系列工程策略。团队锁定了128个Token的滑动窗口,牺牲部分创意写作能力,换取了极致的代码执行和工具调用效率。在展示中,其推理速度是竞争对手DeepSeek-V3.2的3倍,成本仅为Gemini 2.5 Pro的二十分之一。罗福莉认为,算力和数据并非真正的竞争壁垒,如果大家都在参数上竞争,最终拼的只是GPU数量。而小米选择的“物理世界”路线,拼的是科学的研究文化和问题定义能力。
她希望构建的,是一个能与物理世界交互、具备时空连贯性的“虚拟宇宙”。在这个宇宙中,AI的使命不是简单的聊天,而是理解用户指令背后的物理含义,如“把空调调高”背后的冷热感知,或“路面结冰”后的驾驶逻辑。罗福莉的这一路线,正是为小米量身定制,旨在让小米拥有具备“物理模型”的智能体,而非停留在“语言模拟器”层面。
当前,人工智能行业正面临焦虑与转型。OpenAI前首席科学家伊利亚·苏茨克维曾预言,单纯堆砌算力的边际收益正在递减,行业正从“规模时代”转向“研究时代”。云端的聊天机器人未能如预期般重构所有应用,高昂的推理成本也让商业模式难以为继。在此背景下,模型的应用落地成为关键,竞争维度也从“模型聪明程度”转向“物理世界入口的掌控”。
2025年,行业动态进一步印证了这一趋势。字节跳动与中兴通讯联合推出“豆包手机”,阿里频繁发布AI眼镜,甚至OpenAI也试图涉足硬件制造。这些软件巨头意识到,没有硬件载体,再强大的模型也无法触达真实世界。而小米作为“物理世界”的巨头,拥有全球最大的消费级IoT平台,连接着10.4亿台设备。这些设备是训练“具身智能”的直接入口,为小米提供了独特的优势。
未来,小米有望从硬件销售转向“智能服务”提供,硬件成为载体,AI成为溢价核心,这也是其提升市场估值的关键。高盛曾指出,豆包的尝试验证了小米等硬件巨头的结构性优势,用户选择将受生态系统壁垒影响。然而,这对小米的模型交互能力提出了更高要求。如果MiMo模型不够智能,用户可能会选择其他应用,导致小米设备沦为流量入口。
罗福莉提出的“端云结合”和“极致效率”理念虽具吸引力,但在算力受限的端侧设备上实现高智商推理仍面临物理定律的挑战。如何让数万名传统硬件开发工程师适应大模型时代的开发范式,也是小米需要解决的问题。雷军投入2000亿元、引入罗福莉,正是为了证明小米的原生模型比外来应用更优质。否则,小米的“人车家生态”可能失去灵魂,硬件沦为他人躯壳,这是任何有野心的科技企业都无法接受的结局。










