ITBear旗下自媒体矩阵:

黄仁勋GTC发布野心蓝图:AI芯片领航,从地面到太空全面布局

   时间:2026-03-17 14:18:05 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在圣何塞SAP中心的舞台上,英伟达创始人黄仁勋以一场近两小时的演讲,向全球展示了公司从芯片到外太空的全面布局。这场以GTC keynote为主题的发布会,不仅推出了一系列硬件与软件产品,更勾勒出英伟达在人工智能时代的野心——构建覆盖训练、推理、智能体、物理AI、机器人、自动驾驶等全链条的基础设施帝国。

核心硬件Vera Rubin平台的亮相成为全场焦点。该平台由七颗芯片组成,包括自研CPU Vera、GPU Rubin、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换芯片,以及通过收购整合的Groq 3 LPU。这些芯片协同工作,形成一台可覆盖AI全流程的超级计算机。其旗舰产品NVL72机架集成72颗Rubin GPU和36颗Vera CPU,通过NVLink 6互联,相比上一代Blackwell平台,训练大型混合专家模型的GPU需求减少至四分之一,推理吞吐量每瓦提升10倍,每token成本降至十分之一。黄仁勋透露,下一代架构Kyber将采用垂直插入的计算托盘设计,预计2027年搭载于Vera Rubin Ultra上。

推理领域成为英伟达战略的重心。黄仁勋提出将推理拆分为预填充(prefill)和解码(decode)两阶段,分别由GPU和LPU处理。Groq 3 LPU专为解码阶段设计,其内置的500MB SRAM带宽达150TB/s,是Rubin GPU中HBM带宽的近7倍。英伟达将256颗Groq 3 LPU集成于LPX机架,与NVL72并排部署,形成“GPU负责重计算、LPU负责高带宽输出”的组合。黄仁勋称,这种架构在万亿参数模型上可实现每兆瓦推理吞吐量提升35倍。

软件层面,英伟达推出NemoClaw,这是基于OpenClaw优化的开源项目。OpenClaw被黄仁勋誉为“个人AI的操作系统”,其增长速度创下开源项目纪录。NemoClaw通过NVIDIA Agent Toolkit实现一键安装,核心组件OpenShell提供开源模型隔离沙箱环境,为智能体添加安全、网络和隐私护栏。其混合架构允许本地运行Nemotron等开源模型处理隐私任务,同时通过隐私路由器调用云端前沿模型处理复杂请求。该系统支持从GeForce RTX电脑到DGX Spark AI超级计算机的多平台部署。

开源模型生态方面,英伟达联合Mistral AI、Perplexity、Cursor等公司成立Nemotron联盟。首批成员包括Black Forest Labs、LangChain等八家AI企业,首个合作项目是联合训练基础模型,模型将在英伟达DGX Cloud上训练并开源发布,成为Nemotron 4家族的基础。黄仁勋强调,开源模型生态的繁荣将直接带动硬件需求,而英伟达希望通过此举在开源领域保持基础设施的核心地位。

自动驾驶领域,英伟达与比亚迪、吉利、日产、五十铃达成合作,这些车企将采用DRIVE Hyperion平台开发L4级自动驾驶车辆。Uber则宣布扩大与英伟达的合作,计划到2028年在28个城市部署全栈英伟达自动驾驶车队,首批城市为洛杉矶和旧金山湾区,2027年上半年启动。Bolt、Grab、Lyft等出行平台也将接入该平台。技术层面,英伟达发布Alpamayo 1.5可交互自动驾驶推理模型,支持视频、运动历史、导航指引和自然语言提示输入,开发者可通过文本提示直接调整车辆行为。

针对AI工厂的部署需求,英伟达推出DSX Air SaaS平台,允许客户在硬件到货前模拟完整AI工厂环境,包括计算、网络、存储等配置。CoreWeave已使用该平台验证其AI工厂环境,黄仁勋称其可将部署时间从数周缩短至数小时。配套发布的Vera Rubin DSX AI工厂参考设计和Omniverse DSX蓝图,提供物理精确的数字孪生能力,吸引Cadence、达索系统等工业软件巨头接入。DSX Max-Q动态功率分配技术可在固定电力数据中心多部署30%的AI基础设施,DSX Flex软件则使AI工厂成为电网灵活资产,释放100吉瓦闲置电网容量。

存储架构方面,英伟达推出BlueField-4 STX,首个落地产品CMX上下文记忆存储平台在GPU内存外扩展高性能上下文层,满足智能体跨步骤、工具和会话的实时响应需求。黄仁勋称,CMX相比传统存储可提供5倍每秒token吞吐量、4倍能效提升和2倍数据摄取速度。CoreWeave、Crusoe等公司计划采用该技术,Dell、HPE等存储厂商则基于STX参考设计构建下一代AI存储基础设施。

游戏领域,DLSS 5技术被黄仁勋称为“自实时光线追踪以来最重大的图形突破”。该技术引入实时神经渲染模型,通过分析游戏帧的颜色和运动向量,理解场景中的复杂元素和环境光照,生成视觉精确的增强图像。Bethesda的《星空》《上古卷轴》、CAPCOM的《生化危机》等厂商已确认支持,DLSS 5将于今年秋季推出。

发布会的最后,黄仁勋将目光投向太空计算领域。他宣布推出Space-1 Vera Rubin Module计算模块,采用紧密集成的CPU-GPU架构和高带宽互联,专为太空环境设计。相比H100,Space-1在太空推理场景下提供25倍AI算力提升,可在轨道上直接运行大语言模型和高级基础模型。地面端,RTX PRO 6000 Blackwell Server Edition GPU用于地理空间情报处理,其分析卫星图像的速度是传统CPU系统的100倍。配合Space-1的还有IGX Thor工业级平台和Jetson Orin超紧凑AI推理模块,后者已部署于卫星实时处理视觉、导航和传感器数据。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version