英伟达GTC大会上,黄仁勋以一场长达两小时的演讲勾勒出AI产业的新图景。他宣布,AI已跨越训练阶段,全面进入以推理、智能体和物理交互为核心的工业化时代。在这场变革中,Token成为核心商品,光互联与硅光子技术成为突破算力瓶颈的关键,而英伟达正从芯片供应商转型为“AI工厂”的构建者,目标是在2027年实现万亿美元营收。
黄仁勋将AI产业的重心转移定义为“五层架构”的崛起:能源供应、芯片制造、基础设施搭建、模型开发到最终应用落地。他特别强调,Token的消耗将因推理和执行场景的普及而呈指数级增长,数据中心的角色正从存储中心转变为“Token工厂”。英伟达的核心战略是成为“Token之王”,通过降低每Token成本构建竞争优势——其数据中心的设计理念已从“每瓦算力”转向“每瓦Token吞吐量”,这一转变将重新定义科技企业的成本结构。
在硬件领域,英伟达推出覆盖短、中、长期的三代芯片架构,其中Vera Rubin超级AI平台成为焦点。该平台由七款芯片组成,整合计算、网络和存储功能,形成目前最先进的POD规模AI基础设施。其组件包括Vera CPU、Rubin GPU、NVLink 6高速互联芯片、ConnectX-9超级网卡、BlueField-4数据处理单元和Spectrum-6以太网交换机。这一平台已获得Anthropic、OpenAI等科技巨头及主要云服务商的订单,将成为英伟达未来两年营收的核心支柱。
针对实时交互场景,英伟达发布Groq 3 LPU芯片。这款基于2025年收购的Groq技术开发的处理器,搭载230MB片上SRAM,数据带宽达80TB/s,首Token延迟低于0.1秒,推理性能是H100的10倍。其“确定性执行”模式确保在相同输入下输出时间恒定,特别适用于自动驾驶决策和智能客服等场景。该芯片计划于2026年三季度量产,未来将通过3D堆叠技术直接集成到Feynman GPU核心上。
Feynman芯片架构的提前曝光引发行业震动。这款采用台积电1.6nm制程的处理器,是全球首款量产的1nm时代芯片,晶体管密度提升1.1倍。通过GAA晶体管和背面供电技术,其功耗降低15%-20%,运行速度提升8%-10%。硅光子互连技术使带宽密度提升10倍,传输能耗下降90%,而3D堆叠技术将LPU与GPU核心的距离缩短至极致。英伟达宣称,Feynman将使万亿参数模型训练成本较2023年下降87%,推理延迟降低40%-85%,Token成本降至前代的十分之一。
在互联技术方面,英伟达与台积电合作推出全球首款CPO光电共封装交换机——NVIDIA Spectrum-X。该技术将光模块直接集成到芯片封装中,实现电子信号与光信号的直接转换,能耗仅为传统铜缆的5%。这一突破不仅降低了AI集群的散热压力,更标志着“光进铜退”的产业变革正式开启。据透露,相关产品已进入量产阶段。
英伟达的算力布局正突破地球引力。大会发布的Space-1 Vera Rubin轨道数据中心,其AI算力达到H100的25倍。这个漂浮在太空的数据中心模块,可支持大语言模型和基础模型直接在轨道运行,未来将承担太空场景下的实时数据处理任务。这一举措不仅拓展了AI的应用边界,更为航天探索和太空经济开辟了新可能。
软件生态方面,英伟达推出NemoClaw智能体开发平台。作为OpenClaw的升级版,该平台通过OpenShell模块构建安全沙箱环境,限制智能体的文件和网络访问权限,确保输出质量与隐私安全。NemoClaw被定位为AI智能体的“操作系统”,提供企业级和开发者双版本,旨在打破CUDA的硬件绑定,构建跨行业的软件生态。黄仁勋预言,未来所有SaaS公司都将转型为“AaaS(智能体即服务)”,而NemoClaw将成为这一转型的基础设施。
物理AI领域迎来关键突破。英伟达升级Project GR00T通用机器人基础模型,为人形机器人提供自主决策和动作执行能力。黄仁勋将2026年定义为“人形机器人商业化元年”,预计全球量产规模将突破3万台,其中60%应用于工业制造和特种作业场景。单台工业机器人可替代2-3名工人,年节省成本超15万元。随着终端价格下降,2030年全球市场规模有望突破万亿元,年复合增长率超80%。为支撑这一趋势,英伟达还升级了Omniverse数字孪生平台,为机器人、自动驾驶和工业自动化提供虚拟训练环境,降低物理AI的研发成本。











