在近期举办的CES 2026媒体问答会上,英伟达首席执行官黄仁勋针对行业热议的“通过廉价内存降低成本”现象发表了独到见解。他直言,芯片研发是一次性投入,但软件生态的维护却是长期工程,这种差异决定了技术路线选择的重要性。他特别指出,AI产业已步入“Token经济学”新阶段,衡量技术价值的核心标准是“每单位能耗与成本能产出多少Token”。
面对硬件成本与软件生态的平衡难题,英伟达选择了一条差异化道路。黄仁勋解释称,公司坚持采用统一内存架构与软件栈的组合模式,虽然初期硬件投入较高,但能有效避免生态碎片化风险。这种策略的深层逻辑在于:当软件栈完成优化升级后,全球所有基于该架构的AI系统都能同步受益,最终实现全生命周期成本的最优化。
开源生态的爆发式增长成为问答会上的另一焦点。黄仁勋披露的数据显示,开源模型目前贡献了全球约25%的Token生成量,这一趋势彻底改变了AI部署格局。从超大型云数据中心到企业私有集群,开源技术正在推动AI应用向更广泛的场景渗透,形成全新的产业生态。
技术突破方面,黄仁勋重点介绍了Vera Rubin平台的革命性设计。该平台采用模块化托盘架构,支持在系统运行状态下直接更换NVLink等关键组件,彻底改变了传统系统“停机维护”的模式。据技术文档显示,这种设计使节点组装时间从2小时压缩至5分钟,同时通过消除复杂线缆布局,将液冷覆盖率从80%提升至100%,显著增强了系统稳定性。
供电系统创新是Rubin平台的另一大亮点。针对AI推理任务引发的瞬时功耗剧烈波动问题,英伟达研发团队通过电子系统级设计,在机架内部实现了功率波动的智能平滑处理。即便单颗GPU的TDP高达1800W,整个系统仍能向电网呈现稳定的负载曲线。这项突破使数据中心电力利用率接近理论极限,有效解决了算力扩张中的供电瓶颈问题。











