英伟达首席执行官黄仁勋在国际消费电子展的开幕演讲中,系统阐释了对人工智能产业发展的最新观点,并正式推出全新一代Vera Rubin计算架构。这一架构整合了CPU、GPU、互连、网络、存储与系统级设计,被视为支撑未来人工智能发展的核心基础设施平台。
黄仁勋在演讲中并未聚焦于具体应用场景或模型性能,而是着重强调人工智能正在引发计算产业的结构性变革。他指出,计算产业每十年至十五年就会经历一次底层重构,从大型机到个人电脑,从互联网到云计算,再到移动计算,每次变革都会重塑应用形态与产业价值链。而人工智能的特殊性在于,它同时推动着应用层与计算栈的双重迁移。
在应用层面,传统程序开发模式正被"训练"取代,应用不再依赖预设流程,而是基于上下文实时生成内容。人工智能不再局限于工具属性,而是成为应用运行的底层支撑。计算栈层面,软件开发方式、运行机制及硬件架构均发生根本性转变,GPU取代CPU成为计算核心,推理过程从单次输出演变为持续思考。
全球约十万亿美元规模的传统计算基础设施,正在向人工智能计算体系转型。黄仁勋特别提到,人工智能领域的投资并非新增资金,而是源于企业研发预算调整、风险资本转移及工业体系升级。英伟达的定位并非参与具体应用竞争,而是为整个产业提供基础设施支持,延续其"卖铲人"战略。
演讲中重点介绍的物理人工智能(Physical AI)标志着技术发展新方向。不同于生成式人工智能专注于语言与内容处理,物理人工智能致力于将智能系统引入现实世界。黄仁勋将人工智能能力演进划分为预训练、强化学习、测试时推理及具备规划执行能力的代理系统四个阶段。当人工智能开始调用工具、分解任务时,其应用边界已突破数字空间限制。
针对物理世界数据稀缺且获取成本高昂的挑战,英伟达长期投入仿真与合成数据技术研发。全新发布的NVIDIA Cosmos世界基础模型,能够理解物理规律并生成符合物理特性的场景数据。该模型不仅支持视频生成,更可模拟物理反馈,解决人工智能在现实场景中因缺乏常识产生的认知偏差。这套体系直接服务于自动驾驶与机器人领域,通过闭环训练提升系统行动能力。
在自动驾驶领域,英伟达推出全球首个具备推理能力的自动驾驶系统Alpamayo。与传统规则驱动或简单端到端模型不同,该系统在驾驶过程中会实时分析决策逻辑并输出解释。搭载该系统的梅赛德斯-奔驰CLA车型计划于2026年第一季度投入市场。人形机器人系统"格鲁"同样采用合成数据训练技术,通过Cosmos模型生成计算数据,使机器人能够应对各种复杂场景。
Vera Rubin架构的发布构成演讲技术核心。面对摩尔定律放缓与模型规模指数级增长的矛盾,英伟达选择系统性重构设计。该架构由6颗芯片组成协同系统,包含定制化Vera CPU与Rubin GPU。Vera CPU采用88物理核心设计,通过空间多线程技术实现176线程运行,特别优化功耗受限环境下的性能表现。Rubin GPU在浮点运算性能上超越前代产品,晶体管数量仅增加60%,这得益于全新张量核心与Transformer引擎设计。
系统级创新体现在阵列化架构设计。单个计算托盘集成2颗Vera CPU、4颗Rubin GPU,配合BlueField-4 DPU与ConnectX-9网络模块。通过第六代NVLink交换系统,18个计算节点可连接为整体,实现72颗GPU协同运算。完整MVL72机架包含6类新型芯片、18个计算托盘及9个交换托盘,总晶体管数量达220万亿,整机重量近两吨。
数据中心层面,Rubin架构引入多项关键改进。每颗GPU配备1.6TB/s扩展带宽,通过BlueField-4实现16TB可扩展内存空间。网络系统采用Silicon Photonics技术的Spectrum-X以太网交换机,提供512个200Gb端口,支持构建超大规模AI计算集群。能效优化方面,单机架计算密度提升3倍,全集成的液冷方案在功耗翻倍情况下可降低全球数据中心6%能耗。安全性能方面,实现PCIe、NVLink及GPU互联的全链路加密,支持加密计算部署。
这种阵列化设计重新定义了算力单元标准,将采购偏好从单卡转向整体解决方案。英伟达通过高度集成的系统设计,既满足数据中心与主权AI实验室的特殊需求,又强化了自身在产业链中的核心地位。当人工智能从数字空间向物理世界渗透,算力竞争已演变为涵盖算力、数据、模拟、系统工程能力的综合博弈。Rubin架构的推出,不仅带来技术挑战,更划定了新竞争时代的分界线,传统硬件逻辑正面临系统性变革压力。









