滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

从GPU到「Token工厂」，黄仁勋讲了一个万亿美元的AI未来

时间：2026-03-17 15:19:51 来源：鞭牛士编辑：快讯 IP：北京 发表评论无障碍通道

当地时间3月16日，在年度开发者大会NVIDIA GTC 2026上，黄仁勋再次展示了英伟达对于人工智能产业未来的整体构想。

从新一代AI计算架构、推理时代的数据中心商业模式，到围绕Agent构建的软件生态和产业联盟，本届大会呈现的已经不仅是单一硬件产品的升级，而是一套围绕算力展开的完整AI基础设施体系。

在演讲中，黄仁勋大胆给出了一个预测：到2027年，围绕AI芯片与基础设施的市场规模可能达到1万亿美元。

随着AI应用从模型训练逐渐转向大规模推理与Agent系统，英伟达正在尝试重新定义整个产业的技术路径与商业逻辑。

从GPU到AI系统：Vera Rubin架构登场

本届大会最重要的技术发布，是英伟达下一代AI计算平台NVIDIA Vera Rubin。与过去推出单一GPU不同，这一次英伟达强调的是系统级架构：从GPU、CPU到网络互联与软件框架全部进行垂直整合。

黄仁勋在舞台上展示的不是一块芯片，而是一整套机架级计算系统，其设计目标是把整个数据中心视为一台超级计算机进行优化。

核心计算组件Rubin GPU采用台积电3nm工艺和双芯片封装设计，拥有3360亿晶体管，配备288GB HBM4显存和22TB/s带宽，AI推理性能达到约50 PFLOPs。

配套的Vera CPU则采用定制Arm架构，拥有88个核心和176线程，并在数据中心环境中首次采用LPDDR5内存，针对AI Agent场景下的高单线程性能和数据处理需求进行了优化。

英伟达表示，这一CPU如果单独销售也有可能成为一个数十亿美元规模的业务。

Groq加入：为AI推理设计的新型芯片

随着生成式AI进入应用阶段，推理计算成为新的性能瓶颈。GPU在高吞吐并行计算方面具有优势，但在极高速度的token生成阶段效率会下降。

而Groq的LPU采用完全不同的设计思路：确定性数据流架构以及大量SRAM存储，通过编译阶段完成调度，从而显著降低运行时延迟。

这种结构非常适合token生成，但SRAM容量有限，单颗芯片只有约500MB，无法直接容纳大型模型。

英伟达提出的解决方案是将推理任务拆分：GPU负责prefill和attention等需要大算力和大内存的部分，而LPU负责decode与token生成。这种架构被称为disaggregated inference（解耦推理），两种处理器通过高速网络协同工作，从而在高吞吐和低延迟之间取得平衡。

Agent时代的软件生态

除了硬件层面的升级，英伟达在软件生态方面也提出新的战略。

随着AI Agent技术迅速发展，黄仁勋将开源框架OpenClaw定义为一种新的计算平台，并将其与Windows、Linux和Kubernetes等基础软件相提并论。在这一框架之上，英伟达推出NemoClaw，为企业部署Agent系统提供安全与管理能力，包括策略控制接口、网络访问边界以及数据隐私保护机制。

英伟达将这一关系类比为CUDA与GPU生态之间的关系：OpenClaw提供Agent操作系统，而NemoClaw则提供企业级开发平台和工具链。与此同时，英伟达还宣布成立Nemotron Coalition，推动多种AI模型的发展，包括语言模型、机器人模型、自动驾驶模型以及气候模拟系统等。

数据中心成为“Token工厂”

在技术之外，黄仁勋还提出了一种新的AI产业叙事：未来的数据中心将成为生产Token的工厂。

“数据中心是生产token的工厂；推理是工作负载，token是新商品，算力等于营收；未来每个CEO都要盯着自己token工厂的效能看。”

在他看来，AI的发展正经历新的拐点。从聊天机器人到具备推理能力的系统，再到能够执行任务的Agent，每一次能力跃迁都会显著增加单次推理所需的算力，同时也推动整体使用量快速增长。基于这一趋势，英伟达提出了新的AI服务分层模型，从免费层到Ultra层，对应不同模型规模、上下文长度和响应速度，同时也对应不同的token价格。

在这一体系下，算力基础设施直接决定了AI服务的经济可行性，而更高端的AI服务则需要更强大的计算平台。

AI进入太空

在GTC大会上，英伟达还公布了一项更加前瞻性的计划：将AI计算能力扩展到轨道数据中心。

公司发布了NVIDIA Space-1 Vera Rubin模块，其AI计算能力据称可达到NVIDIA H100GPU 的约25倍。黄仁勋在声明中表示：“太空计算，这片最后的疆域，已经到来。随着我们部署卫星星座并深入探索太空，智能必须存在于数据产生的任何地方。”

目前，包括Axiom Space、Planet Labs和Kepler Communications等企业已经在使用英伟达计算平台执行空间任务。随着卫星网络和轨道数据处理需求增加，太空计算将是未来AI基础设施中重要的一环。

AI进入更多产业场景

围绕AI基础设施，英伟达在多个产业领域也宣布了新的合作。例如IBM将把GPU加速能力整合到其AI数据平台watsonx.data中，通过GPU原生数据分析提升企业数据处理效率。在测试案例中，数据查询时间从传统CPU环境下的约15分钟缩短至约3分钟，同时显著降低成本。

同时，Amazon也宣布与英伟达合作，将NVIDIA DRIVE AGX车载计算平台与Amazon Alexa Custom Assistant结合，用于打造能够理解自然语言和环境语境的车载AI助手。

在计算机图形领域，英伟达还发布了NVIDIA DLSS 5技术，通过神经渲染模型增强游戏画面质量，使实时渲染更接近电影级视觉效果。黄仁勋称其为“图形技术的GPT时刻”。

Feynman架构提前曝光

根据规划，Blackwell架构之后将是2026年的Vera Rubin，随后在2027年推出Rubin Ultra，而2028年则会迎来全新的NVIDIA Feynman架构。

Feynman将对整个系统进行全面升级，包括新GPU、LP40 LPU、Rosa CPU以及下一代NVLink互联。与此同时，新一代Kyber机架结构也将改变计算节点的布局方式，以支持更高密度的GPU部署。这种按年度更新的节奏显示出英伟达试图以更快速度推动AI基础设施迭代。

本届GTC展示的并不仅是新芯片，而是一套新的AI产业逻辑。

更多>同类资讯

智算中心电源保护全解析：从基础认知到关键技术一网打尽

对此，泰永长征打造“智算中心能源基础设施电源系统保护系列知识问答”，本期内容首先在智算中心电源系统保护的主要目的及系统稳定的核心要素认知，来一起学习关键知识点吧~ 对电源系统中的异常（短路、过载、电压异常等）…

04-09

华为何刚晒图露玄机，HUAWEI AI Glasses或要登场引期待

04-09

爱诗科技PixVerse C1发布：专业级视频生成，普通人也能轻松创作影视级短片

04-09

美AI公司Perplexity战略转型：押注AI代理工具按使用量计费收入飙升

04-09

全球首个影视行业大模型！PixVerse C1发布

04-09

美AI搜索引擎公司转投AI代理营收单月暴增50%

04-09

15位两院院士深圳共话科技前沿石墨烯、AI与碳基芯片科普盛宴启幕

上证报中国证券网讯（记者杨子晏）4月8日，2026“科学与中国——千名院士·千场科普”湾区行活动开幕式在深圳举行，15位两院院士齐聚中国科学院深圳先进技术研究院（简称“深圳先进院”），围绕石墨烯、人工智能、…

04-09

地瓜机器人B轮融资2.7亿美元携手地平线共拓具身智能新蓝海

地平线全资子公司——地瓜机器人再获1.5亿美元投资，B轮累计融资2.7亿美元！ 4月8日，地瓜机器人宣布完成1.5亿美元B2轮融资，至此，其B轮融资总额已达2.7亿美元。本轮融资获得了零售科技与供应链巨头、P…

04-09

商汤绝影发布AI桌面机器人可悠，以科技之力构建全场景智能生活新体验

据发布会官方最新信息，可悠将依托商汤绝影自研的空间多模态交互系统，并接入研发团队打造的多种skill，实现在复杂环境中精准识人、感知环境，甚至预判用户意图的功能。接下来，商汤绝影将全面推动可悠与全场景产业生…

04-09

宝安“具身智能港”新引擎启动全球机器人开发选品选型中心助力产业腾飞

4月8日，位于深圳市宝安区“具身智能港”的AIR Design House全球机器人开发选品选型服务中心正式启用，标志着该区域在打造全球机器人产业创新枢纽的进程中迈出关键一步。立足这一优势，宝安区量身打造A…

04-09

阿维塔双车闪耀登场：新12重塑豪华，06T开启全场景运动轿车新篇章

04-09

三款新车闪耀登场，大众汽车“在中国，为中国”战略全面提速

04-09

阿维塔双车齐发：新阿维塔12携豪华配置上市，阿维塔06T预售开启新征程

04-09

商汤绝影发布家庭AI新成员可悠，以全场景协同开启智能生活新篇章

04-09

太空算力新赛道：破运力过剩、调算力不均，争低轨星座商业新局

在这个脱离地表的新型算网中，谁能率先打破物理壁垒，建立起一套高速组网与跨星调度机制，让太空算力如同地表水电般实现极低成本的按需供给，谁就锁死了低轨星座下半场的商业护城河。未来能够主导市场的顶级玩家，会是那…

04-09

点击查看更多 +

全站最新

新款阿维塔12携太行智控2.0上市增程纯电双版本智能与性能双升级

霍尔木兹海峡再次关闭！伊朗：“谈判基础”已被破坏

新款福特Bronco谍照流出混动版或登场定价成网友入手关键考量

40万起售！2026款丰田GR YARIS升级上市，三缸“小钢炮”再进化

福特2026款Bronco中期改款谍照来袭，细节调整升级，混动计划重启引期待

魏建军“自揭伤疤”谈哈弗H8：21年千场评审会铸就长城品质之路

热门内容

本栏最新

阿维塔双车闪耀登场：新12重塑豪华，06T开启全场景运动轿车新篇章

三款新车闪耀登场，大众汽车“在中国，为中国”战略全面提速

新阿维塔12上市与06T预售：双车齐发，智能豪华与性能平权共舞

商汤绝影发布家庭AI新成员可悠，以全场景协同开启智能生活新体验

商汤绝影发布家庭AI新成员可悠，以创新技术打造全场景智能陪伴新体验

智谱GLM-5.1发布：国产开源模型新突破，8小时持续工作能力领跑全球

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.