前DeepSeek研究员、现任小米MiMo大模型团队负责人罗福莉,近日与北京大学合作取得技术突破,共同研发出名为ARL-Tangram的统一资源管理系统。这一成果已通过学术论文形式对外公布,标志着小米在人工智能领域的技术积累再添重要砝码。
该系统的核心创新在于采用统一的动作级公式与弹性调度算法,能够同时满足异构资源的约束条件,并显著优化动作完成时间(ACT)。实验数据显示,在真实世界的智能体强化学习任务中,ARL-Tangram可将平均ACT提升最高4.3分,将强化学习训练的步骤持续时间压缩至多1.5倍,同时节省高达71.2%的外部资源消耗。这种效率提升为大规模AI模型的训练与部署提供了新的技术路径。
此次发表是罗福莉加入小米后公开的第二项重大技术成果。早在2024年10月,她便以联合作者身份参与小米AI团队与北京大学的合作研究,相关论文聚焦MoE架构与强化学习的结合,成为其小米生涯的首个学术里程碑。两次研究均围绕AI系统效率优化展开,凸显了小米在基础技术研究上的持续投入。
在2025年小米人车家全生态合作伙伴大会上,罗福莉首次以小米研究员身份公开亮相。她在社交平台分享加入团队的感言:"智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的AGI!"这段文字透露出小米在通用人工智能(AGI)领域的长期布局。
目前,ARL-Tangram的相关论文已通过学术渠道发布,其技术细节与实验数据为AI资源管理领域提供了新的研究范式。这项成果不仅体现了产学研合作的潜力,也预示着小米在AI基础设施层面的技术竞争力正在逐步显现。













