在近期举办的英伟达GTC大会上,创始人兼CEO黄仁勋以一场长达两小时的主题演讲,将“Token”这一概念推至行业焦点。无独有偶,阿里巴巴在大会前一日宣布成立Token事业群,明确“创造、输送、应用”的完整链路。两大科技巨头的同步动作,标志着AI产业正从算力竞争转向Token生产主导权争夺的新阶段。
Token作为大模型处理文本的基本单元,其重要性正随着AI应用场景的扩展而凸显。当用户输入文本时,模型会通过分词器将其切割为Token序列,再转换为数值向量进行计算。阿里巴巴CEO吴泳铭指出,AI Agent的爆发式增长将带来Token需求的指数级上升,而英伟达与阿里的布局,正是为统一这一新兴领域的技术与商业标准。
黄仁勋在演讲中提出“推理拐点已至”的论断:过去两年推理计算量增长万倍,使用量提升百倍,AI正从感知、生成向推理、工作阶段演进。他揭示了Token与AI企业收入的强关联——算力获取能力直接决定Token产量,进而影响收入规模与模型智能水平。这一逻辑链使英伟达成为最大受益者,其订单规模预期从2025年的5000亿美元翻倍至2026年的1万亿美元,股价应声上涨4.3%。
为支撑万亿级目标,英伟达提出“从数据中心到Token工厂”的转型战略。黄仁勋将Token定义为未来AI领域的“大宗商品”,并设计四级定价体系:免费层以广告变现,中级层(3-6美元/百万Token)面向主流付费市场,高速层(45-150美元/百万Token)则聚焦高溢价推理场景。其新架构在免费层实现超高吞吐量,在最高价值层级将效率提升35倍。
突破传统GPU供应商定位,英伟达推出专为智能体推理设计的Vera Rubin计算系统。该系统整合72块GPU、全新Vera CPU、BlueField 4存储平台及CPO Spectrum-X交换机,通过液冷方案将安装时间从两天压缩至两小时。其亮点包括:GPU集群加速前填充计算,Vera CPU处理控制任务以解放GPU算力,以及全球首款光封装光学以太网交换机提升数据传输效率。预计2026年下半年出货的Vera Rubin,推理速度较前代提升5倍,Token成本降低90%,MoE模型所需GPU减少75%。
针对异构计算挑战,英伟达将收购的Groq LPU平台融入体系,并开发Dynamo操作系统实现任务智能分配。黄仁勋建议,高吞吐场景可全量部署Vera Rubin,代码生成等高价值场景则引入25% Groq芯片。这种设计使数据中心单位功耗性能提升35倍,同时兼顾低延迟与高价值推理服务。英伟达预告了2028年的Vera Rubin Ultra及后续Feynman架构,强调3D堆叠、LPU集成、异构存储等技术将成为核心。
黄仁勋将OpenClaw视为重塑企业IT的关键基础设施。这个开源项目通过资源管理、问题分解与多模态输出功能,被定义为智能体操作系统级别的存在。他预测,SaaS公司将转型为AaaS公司,在提供工具的同时嵌入领域专属AI,推动2万亿美元产业规模扩张。为应对安全风险,英伟达与OpenClaw开发者合作推出企业版NeMo Claw,通过网络护栏与隐私路由等技术保障数据安全。
在图形计算领域,英伟达发布DLSS 5技术,宣称迎来“图形学的GPT时刻”。该技术融合3D图形框架与生成式AI细节填充,通过确定性结构化数据与概率性非结构化数据的协同,实现虚拟世界的美观与可控。为解决跨行业数据异构问题,英伟达同步推出cuDF与cuVS工具:前者处理表格、日志等结构化数据,后者将文本、音视频转换为语义向量。目前,这两款工具已接入IBM、戴尔等云服务体系。
随着AI竞争从模型层面转向生产力层面,行业焦点正从抢夺GPU转向掌控Token生产链。英伟达的布局覆盖芯片架构、异构系统、操作系统及数据处理工具,试图将Token生产流程标准化为制造业模式。这场变革或将重新定义AI时代的价值分配规则,而硅谷已出现将Token配额纳入工程师薪酬包的新趋势。








