在圣何塞SAP中心的舞台上,英伟达创始人黄仁勋以一场近两小时的演讲,勾勒出从芯片到太空的AI技术版图。这场以GTC keynote为主题的发布会,不仅展示了多款硬件与软件创新,更传递出英伟达在AI时代构建基础设施帝国的野心。
核心硬件Vera Rubin平台的亮相成为全场焦点。该平台由七颗芯片组成,包括Vera CPU、Rubin GPU、NVLink 6交换芯片等,通过协同工作形成一台超级计算机。其旗舰产品NVL72机架集成72颗Rubin GPU和36颗Vera CPU,训练大型混合专家模型的GPU需求较前代减少四分之三,推理吞吐量每瓦提升10倍,每token成本降至十分之一。黄仁勋透露,下一代架构Kyber将采用垂直插入计算托盘设计,预计2027年搭载于Vera Rubin Ultra平台。
推理领域成为英伟达战略重心。通过收购Groq公司核心资产,英伟达将256颗Groq 3 LPU集成至LPX机架,与Vera Rubin形成互补。LPU专为语言模型解码阶段设计,其500MB SRAM内存带宽达150TB/s,是Rubin GPU HBM带宽的近7倍。这种组合在万亿参数模型上实现每兆瓦推理吞吐量提升35倍,标志着英伟达从训练市场向推理市场的深度拓展。
软件生态层面,英伟达推出基于OpenClaw优化的NemoClaw系统。该系统通过NVIDIA Agent Toolkit实现一键安装,其核心组件OpenShell提供开源模型隔离沙箱环境,为AI代理添加安全防护。混合架构设计允许本地运行Nemotron等开源模型处理隐私任务,云端调用前沿模型处理复杂请求,支持从个人电脑到AI超级计算机的全平台部署。
开源模型联盟的成立凸显英伟达的生态策略。由Mistral AI、Perplexity等企业组成的Nemotron联盟,首个项目是联合训练基础模型并开源发布。这种合作模式既对抗闭源巨头垄断,又确保英伟达硬件成为开源生态的核心基础设施。联盟成员贡献的数据与评估框架,将直接推动Nemotron 4模型家族的演进。
自动驾驶领域迎来重大突破。比亚迪、吉利等车企采用DRIVE Hyperion平台开发L4级自动驾驶车辆,Uber计划2028年前在28个城市部署全栈英伟达自动驾驶车队。新发布的Alpamayo 1.5模型支持视频、运动历史等多模态输入,开发者可通过文本提示直接调整车辆行为,标志着自动驾驶从规则驱动向认知驱动的转变。
AI工厂建设迎来数字化革新。DSX Air平台允许客户在硬件部署前模拟完整AI工厂环境,将投产周期从数月缩短至数小时。配合发布的Vera Rubin DSX参考设计和Omniverse蓝图,形成从设计到运维的全流程解决方案。DSX Max-Q技术可在固定电力条件下增加30%基础设施部署,DSX Flex软件则使AI工厂具备电网灵活调节能力。
存储架构创新直指AI代理需求。BlueField-4 STX架构推出的CMX平台,在GPU内存外扩展高性能上下文层,实现5倍token吞吐量、4倍能效提升。该架构已获得Dell、HPE等存储厂商支持,将重新定义AI数据存储标准。
游戏图形技术迎来里程碑式升级。DLSS 5通过实时神经渲染模型,为游戏注入照片级真实光照效果。该技术可理解复杂材质与环境光照条件,生成视觉精确的增强图像。Bethesda、CAPCOM等厂商已确认支持,预计秋季推出的DLSS 5将重新定义游戏画面质量标准。
太空计算成为新战略支点。Space-1 Vera Rubin模块专为轨道数据中心设计,在太空推理场景下提供25倍AI算力提升。配合IGX Thor工业级平台和Jetson Orin卫星模块,英伟达构建起从地面到太空的全维度计算网络。RTX PRO 6000 Blackwell Server Edition GPU更将卫星图像分析速度提升至传统系统的100倍。
黄仁勋在演讲中抛出惊人预测:2025至2027年AI芯片市场规模将突破1万亿美元。他强调,在AI时代,token已成为新货币,而英伟达正在建造生产这些货币的工厂。从训练到推理,从智能体到太空计算,英伟达的技术版图已覆盖AI全产业链,这场发布会或许正是其帝国扩张的起点。











