在具身智能产业蓬勃发展的当下,全球科技巨头正围绕“机器人大脑”展开激烈角逐。中国行业龙头宇树科技上市进程加速,而中美科技企业已在更深层次布局,试图抢占未来智能机器人市场的制高点。
今年3月的GTC 2025大会上,英伟达CEO黄仁勋演示了挪威1X公司的人形机器人NEO Gamma。这款机器人搭载了基于英伟达GR00T N1模型构建的后训练策略,能够自主完成整理任务。黄仁勋强调,人形机器人的核心竞争力在于适应性和学习能力,其“大脑”能否快速适应环境并学习新知识将成为关键。这一观点在数月后得到验证——全球科技巨头纷纷推出“机器人大脑”新成果。
8月,英伟达推出Jetson AGX Thor边缘计算平台,被业界誉为“机器人新大脑”。该平台基于Blackwell GPU架构,峰值算力达2070 FP4 TFLOPS,AI性能较前代提升7.5倍,能效提升3.5倍。其最大突破在于,通过单一紧凑模块实现实时感知与决策,使依赖云端或多芯片的机器人获得更高效的计算能力。亚马逊仓储机器人、波士顿动力等企业已率先集成该平台,推动产品向更智能、独立的方向演进。
与此同时,字节跳动在机器人领域持续发力。7月和9月,该公司先后推出通用机器人模型GR-3和Robix,展示在真实家庭场景中执行复杂任务的能力。7月底发布的演示视频中,搭载GR-3的机器人完成了将衣架插入衬衫并悬挂的任务;而最新成果Robix则与GR-3组成模型矩阵,负责任务规划、推理和自然语言交互。Seed团队研究员董恒称,Robix的性能优于GPT-4o和Gemini 2.5 Pro,但需与GR-3等控制器模型配合,形成“推理+执行”的双系统模式。
英伟达的生态优势在此轮竞争中尤为突出。其Jetson平台在高端机器人开发领域占据主导地位,拥有超200万名开发人员和7000家企业用户。Thor平台可直接调用Isaac机器人软件平台、AI模型库和仿真工具,实现端到端深度集成。其中,Isaac GR00T N1模型采用双系统架构:“快速思考行动模型”负责直觉反应,“慢思考模型”负责环境推理与行动规划。1X公司CEO表示,仅用少量后训练数据,NEO Gamma便通过GR00T N1实现了推理能力与技能的显著提升。
然而,Thor平台仍面临挑战。其开发套件售价3499美元,高昂成本限制了家用场景的应用;同时,高功率需求要求适配产品具备稳定供电能力,目前主要应用于自动驾驶汽车、工厂机器人等领域。相比之下,字节的GR-3模型通过混合训练方法(大规模图像文本数据预训练+虚拟现实微调+现实动作模仿)提升了少样本适配能力,40亿参数规模的表现优于英伟达约20亿参数的GR00T系列,显示出“规模定律”在复杂环境中的有效性。
字节在机器人领域的布局可追溯至2020年。张一鸣当时便对机器人技术表现出浓厚兴趣,并持续参与项目讨论。2023年12月,Seed团队推出技术验证产品GR-1,采用视频生成式预训练与机器人数据微调模式;2024年推出的GR-2则使用3800万段视频和超500亿token数据预训练,在超100个操控任务中成功率达97.7%。目前,字节已量产超1000台轮式物流机器人,服务于抖音电商仓及顺丰、比亚迪等客户,聚焦“仓储+自动搬运”一体化方案。
在产业投资层面,字节通过锦秋基金(由原字节财务投资负责人杨洁创立)参与宇树科技C轮融资,进一步拓展机器人生态。与此同时,英伟达正加速与中国企业的合作。其官方博客显示,联影医疗、万集科技、优必选、银河通用、宇树科技等公司已采用Thor平台。2025年1月的CES展上,黄仁勋与14家人形机器人企业同台,其中6家来自中国。
尽管字节尚未出现在英伟达的合作名单中,但双方在技术层面的互补性已初现端倪。黄仁勋曾在北京链博会上表示,AI的下一波浪潮将是机器人,而中国市场在这一路径上具有不可替代的意义。随着字节推出实验性产品ByteMini(含22个自由度、球形腕设计),其打造下一代具身智能产品的野心愈发明显。这场由英伟达与字节引领的“机器人大脑”竞赛,或将重塑全球智能机器人产业的格局。