在拉斯维加斯国际消费电子展的舞台上,英伟达创始人黄仁勋身着标志性黑色夹克登场,尽管稍有迟到,但他的演讲迅速吸引了全场目光。这场持续一个半小时的演讲中,英伟达的定位已从昔日“AI的iPhone时刻”的引领者,转变为全球科技领域的“基础设施供应商”。从芯片到机架,从网络到软件,英伟达正试图构建一个覆盖机器人、汽车等领域的完整技术生态。
此次演讲的核心线索是对“全栈控制”的深度布局,尤其在存储和具备代理能力的AI领域。黄仁勋指出,下一代AI需要更长的上下文窗口、更大的内存容量和更强的网络支持,而英伟达的解决方案是打造“AI工厂”这一全新产品类别。这一概念不仅包含硬件设备,更涵盖蓝图设计、操作系统及全套组件,形成从底层架构到应用部署的完整闭环。
硬件层面,英伟达推出了由六款芯片组成的Rubin平台,包括两种规格的GPU与CPU,以及NVLink 6交换芯片和ConnectX-9 SuperNIC。通过全系统协同设计,该平台旨在降低“智能”成本,优化单token处理效率。系统级产品方面,Vera Rubin NVL72机架(配备72颗GPU和36颗CPU)将成为主力,而更大型的Rubin Ultra NVL288(288颗GPU和144颗CPU)则计划于2026年下半年通过合作伙伴推向市场。DGX品牌下的“AI工厂”体系将训练与推理设备标准化,形成即插即用的算力单元。
网络与存储被视为关键“外挂”技术。英伟达重点推广的Spectrum-X以太网光子交换系统,声称可将推理性能和能效提升五倍。同时,公司推出“推理上下文内存”平台,通过扩展AI的上下文窗口,解决长时序智能体的卡顿问题。这些举措暗示,英伟达的利润增长点正从GPU向周边基础设施延伸。
在模型开放策略上,英伟达采取“免费样品”模式吸引开发者。其发布的Nemotron-3模型家族包含70B、34B和8B三种规模,配套新数据集和工具链,帮助团队构建垂直领域智能体。公司还推出覆盖140种语言、规模达1.4万亿token的多语言预训练语料库Nemotron-CC,以及针对企业级任务的指令数据集Granary。据生成式AI与软件副总裁Kari Briski透露,英伟达已成为Hugging Face平台的重要贡献者,2025年已发布650个开放模型和250个数据集。
物理AI与机器人领域被描述为“分水岭时刻”。黄仁勋强调,智能体需具备感知、推理和行动的闭环能力,这依赖仿真技术、机器人模型和运动模型的协同发展。汽车行业成为验证“全栈”叙事的关键场景:英伟达Drive AV平台已进入量产阶段,将搭载于2026款梅赛德斯-奔驰CLA车型,支持L2级自动驾驶和城市导航功能。公司还推出开源AI模型家族Alpamayo,提供1700小时驾驶数据和仿真框架,助力L4级自动驾驶开发。
机器人技术方面,英伟达发布Isaac GR00T N1.6视觉-语言-行动推理模型,以及用于策略评估的Isaac Lab Arena框架。Cosmos Reason 2模型则专注于提升物理推理能力,其所属的Cosmos系列工具链可生成合成数据以训练物理AI。边缘计算平台Jetson T4000的推出,进一步将机器人技术栈与DGX级基础设施连接,形成从训练到部署的完整链条。
纵观英伟达在消费电子展的布局,其战略重心已转向构建技术流水线。无论是算力、网络、存储还是安全仿真,公司均试图让每个环节运行于自有产品体系之内。这种全栈控制模式,正重新定义科技产业的基础设施竞争格局。











