ITBear旗下自媒体矩阵:

谷歌TPU“分家”出击:TPU 8i精准卡位,在AI推理战场抢占先机

   时间:2026-04-24 19:04:06 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在拉斯维加斯举行的Google Cloud Next大会上,谷歌高级副总裁Amin Vahdat向外界展示了TPU家族的最新成员——TPU 8t与TPU 8i。这两款芯片的发布标志着谷歌在AI算力领域迈出了关键一步,首次将训练与推理任务明确区分,分别由不同芯片承担。

Amin Vahdat在官方博客中指出,随着AI智能体技术的快速发展,市场对专门针对训练和服务需求优化的芯片需求日益增长。这种“精细化分工”模式被视为行业发展的必然趋势,标志着AI算力进入了一个新的阶段。

训练与推理虽然同属AI算力范畴,但本质需求截然不同。训练过程类似于学霸攻读学位,需要海量数据和强大算力来“锤炼”模型能力;而推理过程则更像职场工作,强调快速响应和成本控制。过去,由于AI发展尚处早期,模型规模和场景复杂度有限,统一架构的芯片尚能满足需求。但随着Agentic AI时代的到来,这种模式已难以适应。

近年来,硅谷的关注点已从“大模型”转向“智能体”。AI不再局限于简单对话,而是向能够自主完成任务、调用工具的“数字员工”演进。这种转变导致推理任务量激增,往往是传统聊天机器人的20至50倍。企业成本压力随之从训练环节转向推理环节,如何降低推理成本成为关键挑战。

训练芯片为追求极致性能,通常配备昂贵的HBM内存,其成本占芯片总成本的40%-50%。用这种高成本芯片处理高频推理请求,无异于“用洲际导弹送外卖”,会导致运营成本飙升,阻碍商业化进程。谷歌云人工智能与计算基础架构副总裁Mark Lohmeyer强调,企业需要在交易量大幅增长的同时,显著降低每笔交易成本,才能实现规模化应用。

TPU 8t作为算力怪兽,单个超级模块可集成9600颗芯片,提供121 exaflops算力和2PB共享内存,计算性能较前代提升近3倍。其全新的Virgo横向扩展架构支持单个集群调度超过100万颗TPU芯片,将大模型训练周期从数月压缩至数周。在电力成为数据中心瓶颈的当下,TPU 8t在同等价格下性能提升2.8倍,每瓦性能提升124%,成为大模型训练的理想选择。

TPU 8i则专注于推理任务,通过优化芯片架构解决高频交互痛点。其片上SRAM容量扩大3倍,配合288GB HBM内存,大幅减少数据搬运损耗,消除AI思考中的“脑卡顿”现象。更关键的是,TPU 8i能效比较上一代提升117%,使谷歌云能够用相同电费支撑近两倍的推理服务,为Agent时代的商业化奠定了基础。

市场研究机构Gartner预测,到2026年底,40%的企业应用将嵌入特定任务的AI Agent。麦肯锡则估算,到2030年,Agentic AI带来的商业机会将达3万亿至5万亿美元。在这一背景下,推理成本成为决定AI技术能否大规模落地的关键因素。谷歌将芯片一分为二,正是为了在AI下半场竞争中占据优势。

谷歌的“算力分工”战略已获得市场认可。AI独角兽Anthropic和科技巨头meta成为TPU v8的首批用户。Anthropic确认其下一代模型已在TPU 8t集群上开发数月,并计划在2027年前与谷歌云签署数吉瓦级算力协议。这种深度合作不仅降低了Anthropic的推理成本,也为谷歌提供了宝贵的实战测试环境。

meta与谷歌签署的为期多年、价值数十亿美元的TPU使用协议,进一步验证了市场对谷歌芯片战略的认可。这一交易导致英伟达股价应声下跌4%,引发业界对“反英伟达联盟”形成的猜测。然而,这种合作更多是出于务实考虑,而非意识形态联盟。对于Anthropic和meta等算力需求巨大的企业而言,分散供应链风险、增强议价能力是首要目标。

谷歌的TPU战略并非简单的芯片销售,而是通过云服务构建AI生态。TPU不单独出售,客户需通过Google Cloud使用,这自然将客户引入谷歌的全栈AI云生态,从数据处理到模型部署形成闭环。摩根士丹利分析师估算,谷歌TPU年产量预计在2027年达500万颗,2028年增至700万颗,每对外销售50万颗TPU可能带来约130亿美元收入。

尽管谷歌推出TPU 8i,但英伟达仍占据AI芯片市场主导地位。英伟达的CUDA生态系统拥有庞大开发者基础,形成高迁移成本壁垒。英伟达保持“一年一迭代”的快速创新节奏,其Rubin GPU已配备HBM4内存,推理算力达50 PFlops,持续保持技术领先。

英伟达的优势不仅在于芯片性能,更在于其构建的完整AI基础设施。通过收购Mellanox并集成BlueField DPU,英伟达打造了高效的数据传输生态,形成“软硬件一体”的封闭系统。这种模式使得客户一旦采用英伟达GPU,就难以摆脱对其网络解决方案的依赖。

谷歌深知无法全面取代英伟达,因此采取差异化竞争策略。TPU 8i专注于推理场景,通过优化SRAM和能效比,为高频交互的AI Agent提供低成本解决方案。对于成本敏感的企业而言,TPU 8i的性价比优势将促使其将部分推理业务迁移至谷歌云平台,从而在英伟达主导的市场中分得一杯羹。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version