在2026年GTC大会上,英伟达宣布推出Vera Rubin AI平台,旨在全面推动智能体AI(Agentic AI)的技术突破与应用落地。这一平台被视为英伟达史上最大规模基础设施建设的起点,覆盖从大规模预训练到实时推理的完整AI生命周期。公司创始人兼首席执行官黄仁勋强调,Vera Rubin不仅是一次技术代际的飞跃,更标志着英伟达在AI硬件领域的战略升级。
Vera Rubin平台的核心是全新设计的Vera CPU,其单颗芯片集成88个核心与144个线程,采用英伟达深度定制的Arm v9.2-A Olympus架构。该架构通过指令级并行度(IPC)的1.5倍提升,实现了计算效率的显著突破。更引人注目的是其首发的“空间多线程”技术,通过物理隔离流水线组件,使多个线程能够在单核上并行运行,彻底解决了传统多线程技术中因资源排队导致的算力损耗问题。
在系统级架构方面,新一代NVL72机架成为关键支撑。该机架通过NVLink 6技术连接72块Rubin GPU与36块Vera CPU,形成高效协同的计算集群。与上一代Blackwell平台相比,NVL72在混合专家大模型(MoE)训练中仅需四分之一的GPU资源,同时将每瓦推理吞吐量提升至10倍,单Token成本降低至十分之一。这一突破使得大规模AI模型的训练与部署成本大幅下降,为智能体AI的广泛应用奠定了基础。
针对智能体系统对低延迟和长上下文处理的严苛需求,英伟达同步推出了Groq 3 LPX推理加速机架。该系统集成256个LPU处理器,与Vera Rubin平台结合后,每兆瓦推理吞吐量最高可提升35倍。这一设计显著优化了实时交互场景下的响应速度,为智能客服、自动驾驶等应用提供了更强大的硬件支持。
在数据存储领域,全新BlueField-4 STX机架构建了AI原生存储架构。通过引入DOCA Memos框架,该系统能够高效处理大型语言模型生成的海量键值(KV)缓存数据,在降低能耗的同时将推理吞吐量提升最高5倍。这一创新使得AI系统在多轮交互场景下的响应速度与稳定性得到质的提升,为智能体AI的商业化落地扫清了关键障碍。
Vera Rubin平台的发布,标志着英伟达正式进军传统CPU直销市场,直接挑战英特尔、AMD等老牌厂商,同时向全球云计算巨头自研的Arm架构处理器发起竞争。黄仁勋表示,这一战略转型将重塑AI硬件市场的竞争格局,为智能体AI的规模化应用提供更强大的基础设施支持。











