在近期举办的英伟达GTC大会上,一场以AI为核心的技术盛宴吸引了全球目光。英伟达创始人兼CEO黄仁勋在舞台上展示了多项突破性成果,从芯片架构革新到AI代理生态构建,全面勾勒出人工智能发展的新图景。其中,Vera Rubin平台的发布被视为开启Agentic AI(代理型AI)新时代的里程碑,其涵盖的七款新芯片与五种机架系统,标志着英伟达从单芯片竞争迈向全栈系统级解决方案。
Vera Rubin架构的核心突破在于“去PCIe化”的紧耦合设计。通过1.8 TB/s的NVLink-C2C技术,Vera CPU与Rubin GPU实现同封装集成,单GPU在NVFP4精度下的推理算力达50 PFlops,训练算力35 PFlops,能效较前代提升5倍。该架构专为长上下文推理设计,支持AI智能体处理数万个Token的关联分析,并配备硅光子技术(CPO)的Spectrum-X以太网交换机,单机柜内部互联带宽达260 TB/s,相当于全球互联网跨境带宽总和的数倍。首批合作客户包括阿里巴巴、字节跳动、meta等科技巨头,产品将于今年下半年开始供货。
在芯片家族中,英伟达首次将Groq的LPU(语言处理单元)纳入生态体系。通过200亿美元战略授权整合的Groq 3 LPX机架,包含256个LPU处理器与128GB片上SRAM,扩展带宽达640 TB/s。与Vera Rubin NVL72协同工作时,GPU负责模型训练与长文本预处理,LPU则专注实时推理,形成“训练-推理”混合算力网络。这种确定性流水线架构摒弃了传统GPU的缓存管理与分支预测,将硬件复杂度转移至编译器层,使数据流动如精密传送带般稳定,在自动驾驶、高频交易等场景中实现毫秒级响应。
软件生态层面,英伟达推出面向OpenClaw社区的NemoClaw软件栈,为AI代理提供全生命周期支持。开发者可通过单条命令部署NVIDIA Nemotron模型与OpenShell运行时环境,后者提供的隔离沙箱确保AI代理在调用工具时遵循安全策略。该框架支持本地模型与云端模型的混合调用,既保护数据隐私,又可借助云端算力提升性能。目前,NemoClaw已适配GeForce RTX显卡、DGX工作站等多平台,为全天候运行的AI代理提供稳定算力。
开放模型生态的扩展是另一重点。英伟达联合全球AI实验室成立Nemotron Coalition,推出Nemotron 3系列多模态模型,涵盖Ultra、Omni和VoiceChat等版本。这些模型可同步处理语言、视觉与语音信息,支持AI代理从视频、文档中提取关键信息并完成复杂推理。在物理世界应用方面,NVIDIA Isaac GR00T N1.7模型赋能类人机器人感知与决策,Alpamayo 1.5模型通过多摄像头支持提升自动驾驶推理能力,而即将发布的Cosmos 3模型则试图统一世界生成、物理推理与行动仿真,为机器人训练提供虚拟环境。
黄仁勋在演讲中强调,AI时代的基础设施正在从数据中心向“AI工厂”转型,智能Token成为新货币。通过Vera Rubin DSX参考设计与Omniverse数字孪生蓝图,英伟达提供了一套构建高生产力AI工厂的解决方案。从芯片到系统,从软件到模型,这场技术革新不仅重新定义了AI算力的边界,更推动人工智能从辅助工具向自主代理演进,为跨行业应用开辟了全新可能性。











