ITBear旗下自媒体矩阵:

小米Xiaomi-Robotics-0模型开源发布,打破硬件局限引领机器人技术新突破

   时间:2026-02-12 15:33:41 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

小米科技在机器人领域实现重大突破,其机器人团队近日正式开源发布全新具身智能VLA模型Xiaomi-Robotics-0,并首次对外公开真机运行画面,迅速引发科技界高度关注。该模型凭借47亿参数规模,不仅具备强大的视觉语言理解能力,还能实现高性能实时执行,为机器人技术发展注入新动能。

在Libero、Calvin、SimplerEnv三大全球主流具身智能测试集中,Xiaomi-Robotics-0对标超过30款主流模型,在所有基准测试中均取得SOTA(State-of-the-Art)成绩,全面超越行业标杆。这一成果不仅体现在仿真环境中的卓越表现,更在真实机器人上实现了流畅动作,标志着小米在机器人领域取得关键性进展。

传统机器人模型长期面临推理延迟高、动作不连贯、硬件门槛高等核心痛点。高性能模型往往需要依赖昂贵的专业显卡,限制了技术普及与应用。而Xiaomi-Robotics-0的创新之处在于,它能在普通消费级显卡上实现实时推理,大幅降低具身智能技术的落地门槛,让更多开发者和团队能够接触并应用这一先进技术。

小米自研的Mixture-of-Transformers(MoT)混合架构为机器人赋予“双脑协同系统”,从根本上解决了传统模型动作断层的难题。视觉语言大脑(VLM)负责理解人类指令和环境信息,精准把握空间关系和任务目标;动作执行小脑(DiT)则将指令转化为流畅动作,确保精准稳定。这一架构使机器人动作更加接近人类灵活度,显著提升操作自然性。

为进一步提升模型性能,小米团队设计了两阶段训练方案。通过跨模态预训练和后训练优化,模型在学习动作的同时保持基础能力,并大幅提升环境适配能力。从公开的真机视频中可见,无论是处理柔性物体如毛巾,还是操作刚性积木,机器人均能稳定完成,手眼协调无卡顿或失误,展现出强大的环境适应能力。

此次发布中,小米展现开放格局,将成果全量开源。技术主页、GitHub开源代码及Hugging Face模型权重全部公开,全球开发者均可免费使用并进行二次开发。这一举措打破了大厂对具身智能核心技术的垄断,为行业技术迭代提供强大助力,推动整个领域向更开放、更创新的方向发展。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version