滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

黄仁勋提出“推理拐点”，分布式边缘推理能否成为AI新基建核心？

时间：2026-03-26 17:01:14 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

纽约时报近期披露，硅谷正兴起一股“tokenmaxxing”新潮流，meta与OpenAI的工程师们在企业内部展开激烈竞争，通过比较推理token消耗量来一决高下。黄仁勋在GTC 2026大会上更是抛出惊人提议，建议企业将token预算作为工程师薪酬体系的重要组成部分。OpenAI的数据显示，过去一年间，企业客户在推理token上的支出呈现出爆炸式增长，增幅高达320倍。

面对需求侧的井喷式增长，供给侧如何应对成为焦点。黄仁勋在主题演讲中首次将“Tokenomics”概念引入AI领域，重新定义为衡量推理效率的经济指标，其核心在于“Tokens per Watt”，即每瓦特电力能产出的token数量。他预测，到2027年，NVIDIA的Blackwell和Vera Rubin芯片订单规模将达到1万亿美元。国内大模型厂商虽未使用“Tokenomics”这一术语，但“推理成本”或“token单价”的讨论早已甚嚣尘上，本质问题直指AI时代的基础设施建设——谁来构建支撑推理需求的“发电厂”与“电网”？

过去三年，行业普遍认为，通过扩大数据中心规模、增加GPU数量即可解决问题，这一策略在模型训练阶段确实行之有效。然而，推理与训练的逻辑截然不同：训练是“一次性工程”，推理则是“高频次、低延迟”的持续服务。当推理请求如潮水般涌来，将所有GPU集中于少数超大型数据中心反而可能成为瓶颈，真正的限制因素并非算力，而是物理定律——光速。

在GTC 2026大会上，全球最大的分布式计算平台Akamai给出了系统性解决方案。这家拥有4400多个边缘节点、覆盖130多个国家的CDN领域先驱，通过三十年的技术积累，将业务版图从内容分发扩展至安全、云计算，最终切入AI推理赛道。其核心论点清晰：AI推理必须走向分布式架构。

Akamai CTO办公室高级副总裁Andy Champagne以“个人AI导播”场景为例：一场F1比赛有20多个4K机位同时拍摄，传统模式下所有观众看到的是相同的画面；若要实现个性化直播，如根据观众偏好切换车手或镜头角度，则需在边缘节点实时合成数百万路不同的4K视频流。这种需求显然无法通过单一数据中心满足。类似逻辑在实时广告插入、游戏NPC响应、AI语音助手等场景中同样适用——AI一旦嵌入实时应用，就必须满足其原有的延迟要求。

物理定律不会因GPU性能提升而改变。光在光纤中的传播速度约为每秒20万公里，从伦敦到美国东海岸的数据中心，单程延迟约28毫秒，往返则达56毫秒；东京至美国的往返延迟更高达134毫秒，这还未计算计算时间。对比游戏NPC需在50毫秒内响应、实时广告插入需在100毫秒内完成全链路处理的场景，集中式架构的局限性显而易见。

延迟之外，带宽成本也是集中式架构的致命伤。Andy Champagne计算发现，1GW算力若集中于单一数据中心，使用Blackwell芯片进行视频推理时，出口带宽需求达75 Tbit/s；若分布至20个区域节点，每个节点仅需3.75 Tbit/s，集中式架构的出口流量是分布式的20倍。若采用下一代Vera Rubin芯片，集中式出口带宽将飙升至135 Tbit/s，芯片性能越强，集中式架构的带宽瓶颈反而越严重。Comcast专家从排队论角度分析指出，集中式与分布式部署仅14毫秒的延迟差异，就会导致约30%的GPU利用率差距，这是物理定律层面的优势，无法通过技术优化弥补。

Akamai的分布式推理逻辑与其三十年发展历程一脉相承。Andy Champagne将AI发展时间线与互联网类比：互联网普及率已超95%，AI目前仅约7%，正处于“MySpace时代”，未来潜力巨大。当年Akamai通过CDN技术将集中式内容分发转变为分布式架构，如今面对AI推理需求，方法论依然适用——“AI工厂创造智能，AI Grid分发智能”，没有分布式推理的AI，如同没有CDN的互联网。

GTC 2026期间，NVIDIA将Akamai Cloud与AWS并列列为首批提供RTX PRO Blackwell Server Edition实例的云服务商，黄仁勋的合作伙伴展示墙上，Akamai赫然在列。NVIDIA电信业务全球副总裁Chris Penrose评价称，Akamai通过运营AI Grid，为生成式AI、AI Agent和物理AI构建了连接组织，将智能直接推送至数据所在地。Akamai正式发布的全球规模NVIDIA AI Grid参考架构方案，将NVIDIA AI基础设施深度集成至自身分布式网络，成为首家将AI Grid从概念推向运营级别的厂商，底层采用NVIDIA AI Enterprise软件栈、Blackwell架构GPU和BlueField DPU加速网络。

对于正在部署推理基础设施的AI团队，现实问题不容忽视。首先，并非所有推理任务都需要H100这类顶级芯片。Akamai部署的RTX PRO 6000 Blackwell Server Edition在Token经济性上表现突出，每小时2.5美元的全包价下，每美元Token产出是同类方案的2.1倍。其96GB GDDR7显存和4000 TOPS FP4算力，在NVFP4精度下推理吞吐量比H100高60%以上，视频编解码能力更达112至132路，远超定位训练的H100。风冷设计也降低了边缘机房的部署门槛。

其次，数据出站费用常被忽视。AI产品服务全球用户时，视频和模型响应产生的出站流量成本可能超过GPU租用费用。Akamai的出站价格仅为每GB 0.005美元，与主流云厂商形成鲜明对比。边缘部署的经济性在于，推理结果在本地生成并交付，无需跨越大洋传输。

最后，调度系统比算力更难构建。Akamai的AI编排器并非传统负载均衡工具，而是综合考虑模型亲和性、GPU显存占用、KV Cache状态等AI场景特有因素，实现推理请求的实时路由。现场演示中，推理请求从巴黎节点无缝切换至加州节点，用户无感知。这一能力源于Akamai近三十年的流量调度经验，在AI场景中自然延伸。目前，Akamai的Blackwell GPU节点已覆盖欧洲、亚太和美洲的19个区域，配合4400多个边缘入网点，为出海AI团队提供了东京、新加坡、孟买、雅加达等关键亚太节点的部署选项。

Akamai的转型路径，折射出互联网基础设施的演进逻辑。其差异化优势在于，未从零建设数据中心，而是将运营近三十年的全球分布式网络转化为AI推理底座。这一策略能否成功，取决于其能否跟上AI硬件迭代速度，以及边缘推理市场需求是否如预期爆发。但对于中国出海AI创业者而言，全球化部署推理能力已从“未来规划”变为“当下需求”——合规要求、延迟门槛、成本压力，是出海时必须跨越的三座大山。Akamai的边缘推理平台提供了一种新选择：无需自建全球基础设施，也无需依赖少数超大规模云，而是借助覆盖130多个国家的分布式网络，将推理服务部署至离用户最近的地方。

更多>同类资讯

五一华强北成“老外购物天堂”：中国智造逆袭，硬实力征服全球消费者

05-06

优必选Thinker-WM登顶权威评测榜首具身智能领域再添新力量

05-05

B站五四短片《赢》：鼓励年轻人“折腾” 多元生活成新追求

05-05

GPT-5.5派对定档5月5日5点55分！Codex凭用户体验反超Claude Code

05-05

Metalenz突破屏下技术难题，Polar ID或引领智能手机迈向真全面屏时代

05-05

Fairphone 3八月结束官方支持刷eOS系统可延至2028年获安全更新

05-05

小米17T及17T Pro规格全揭秘，国内将推“套娃机型”引期待

05-05

绿联PB603移动电源上架京东：45W自带线+TFT屏，10000mAh大容量仅199元

05-05

小米“昆仑N3”增程全尺寸SUV谍照流出，方正外观+大电池续航引期待

05-05

东方甄选北京首店试水线下：自营品+场景体验，能否破解流量困局？

05-05

特斯拉Cybercab迈阿密巡展吸睛，自动驾驶布局加速未来出行新图景

05-05

小米“昆仑”增程SUV谍照流出，大电池配天地门，家庭旗舰新选择登场

05-05

充电设施升级缓解排队难题，新能源车“充电无忧”仍需跨过几道坎？

05-05

消息称三星4nm产能全部订满，订单排到明年

05-05

700多个“坏模型”喂出AI测谎仪？Anthropic审计神器让AI自曝黑料

05-05

点击查看更多 +

全站最新

英特尔大涨超15%再创历史新高，年内累涨近200%

闪迪大涨超11%再创历史新高，年内累涨488%

西部数据大涨8%创历史新高，年内累涨175%

希捷科技大涨超7%再创历史新高，年内累涨188%

中国银河(06881.HK)遭易方达基金减持267.25万股

光大证券(06178.HK)遭易方达基金减持50.92万股

热门内容

本栏最新

五一华强北成“老外购物天堂”：中国智造逆袭，硬实力征服全球消费者

特斯拉Cybercab迈阿密巡展吸睛，自动驾驶布局加速未来出行新图景

北京车展小米展台“火出圈”！车模专业又吸睛，新车黑科技更让人心动

豆包“扛不住”开启付费模式：是生存之举还是面临变现挑战？

00后职场新势力崛起：自动售货机如何拥抱年轻消费主力军？

科大讯飞耳机深度体验：以科技赋能音质，打造多场景智能音频新选择

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.