在近日举办的CES 2026主题演讲中,英伟达首席执行官黄仁勋宣布机器人技术领域已进入关键发展阶段,并形象地将其类比为人工智能领域的“ChatGPT时刻”。此次演讲中,英伟达正式发布了一系列开源“物理AI”模型,旨在推动机器人与真实世界的深度交互能力。
黄仁勋在现场演示环节特别引入了一对名为BDX的机器人作为展示载体,通过互动场景呈现了名为“GR00T”的机器人学习系统如何逐步掌握环境感知与动作协调。这一过程直观展现了物理AI模型从数据输入到行为输出的完整链路,引发与会者对机器人自主进化潜力的关注。
针对物理世界模拟的痛点,英伟达同步推出Nvidia Cosmos Transfer 2.5与Cosmos Predict 2.5两款开源模型。这两款工具通过构建高度逼真的合成数据环境,为自动驾驶、工业机器人等高风险场景提供安全可靠的测试平台。其核心优势在于能够精准模拟物理属性与空间关系,使开发者无需承担实体测试的潜在风险即可完成算法验证。
在视觉认知领域,新发布的Cosmos Reason 2视觉语言模型(VLM)突破了传统机器视觉的局限。该模型通过整合物理常识库与先验知识,使机器人具备类似人类的场景理解能力,能够在复杂环境中自主完成推理决策。例如在物流分拣场景中,系统可同时识别物体形状、材质及空间位置,动态规划最优抓取路径。
面向人形机器人开发,英伟达推出的Nvidia Isaac GR00T N1.6模型实现了重大技术突破。该视觉语言动作(VLA)架构通过深度融合Cosmos的推理引擎,首次实现了对人形机器人全身关节的毫米级精准控制。在演示视频中,搭载该模型的机器人展现了流畅的避障行走与物品抓取能力,其动作自然度接近人类水平。
开发工具链方面,英伟达与开源社区Hugging Face达成战略合作。双方将GR00T模型与Isaac Lab-Arena仿真框架深度整合至LeRobot开发库,形成从算法训练到硬件部署的全流程解决方案。特别值得关注的是,Hugging Face旗下的Reachy 2人形机器人已实现与英伟达Jetson Thor计算平台的无缝对接,开发者可直接在仿真环境中完成算法调优并一键部署至实体机器人。
为支撑日益复杂的物理AI计算需求,英伟达同步推出了基于Blackwell架构的Jetson T4000计算模组。该硬件采用新一代异构计算架构,在保持功耗不变的前提下,将AI推理性能提升至前代产品的四倍水平。实测数据显示,在多机器人协同场景中,单块T4000模组可同时处理16路高清视频流并实时输出控制指令。











