ITBear旗下自媒体矩阵:

英伟达“收编”Groq背后:推理时代GPU遇挑战,TPU成谷歌关键护城河

   时间:2025-12-26 05:35:54 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,科技行业一则重磅消息引发广泛关注:英伟达与Groq达成非独家技术许可协议。根据协议内容,英伟达计划将Groq的AI推理技术融入未来产品体系,同时,Groq创始人兼首席执行官Jonathan Ross、总裁Sunny Madra以及部分核心工程人员将加入英伟达。不过,Groq公司仍会保持独立运营,其云业务Groq Cloud也将持续对外提供服务。

这一合作看似是普通的技术协作,实则暗藏深意。通常而言,技术授权较为常见,但一家芯片公司的创始人和核心架构团队整体迁移实属罕见。英伟达此次举措,其真正目标并非Groq的营收规模,而是其背后与谷歌TPU高度同源的架构思想。

随着AI竞争焦点从训练转向推理,GPU长期构建的统治地位开始出现松动迹象。TPU凭借在效率与成本结构上的优势逐渐崭露头角,有望成为谷歌云未来十年的关键竞争优势。在此背景下,英伟达CEO黄仁勋首次显露出被“逼到墙角”的焦虑情绪。

过去一年,谷歌在AI基础设施领域动作频频,存在感显著提升。Ironwood TPU与Gemini模型体系的推进,使得谷歌与英伟达之间的竞争,从单纯的“谁采购更多GPU”演变为两种计算路线的激烈对峙。GPU在训练环节依旧占据主导,但在推理这一关乎长期成本与利润率的关键环节,TPU正快速逼近甚至实现反超。

这种差距并非源于简单的性能参数对比,而是架构差异的集中体现。GPU的优势在于通用并行计算能力,而TPU自诞生起就为神经网络推理量身定制,属于ASIC芯片。在单位能耗、延迟可控性以及规模化推理成本方面,TPU更契合当下大模型商业化阶段的实际需求。随着模型能力趋于稳定,推理对算力资源的需求日益增长,“算得起”变得比“算得快”更为重要,这正是英伟达焦虑的根源所在。

AI的发展叙事正从训练时代迈向推理时代。训练是一次性投入,而推理则是持续性支出;训练决定能力上限,推理决定商业下限。当客户开始认真权衡长期推理成本时,GPU的高溢价模式首次遭遇结构性挑战,而谷歌通过TPU将这一挑战转化为自身云业务的护城河。

从这个层面看,TPU不仅仅是一颗芯片,更是一种成本结构武器。它助力谷歌在云端推理领域逐步摆脱对英伟达的依赖,为谷歌云在未来十年的竞争中赋予了独特的底层优势。而Groq的价值,正蕴含其中。

英伟达选择“引入”Groq而非“自研”,背后有着两大考量:人才与时间。Groq成立于2016年,创始人Jonathan Ross曾是谷歌芯片高管,也是TPU早期核心参与者之一。Groq坚持的并非GPU式的通用并行路线,而是一套注重低延迟、确定性执行和极致推理效率的架构理念,这与TPU的设计哲学高度契合,却与英伟达传统GPU体系存在明显差异。相较于从零开始构建全新的张量架构,直接吸纳经过验证的TPU思维方式,显然更为迅速且现实。

此前市场曾传出英伟达将以高达200亿美元的价格全资收购Groq的消息,尽管随后被否认,但这一传闻已充分暴露出英伟达的紧迫感。Groq今年的目标收入约为5亿美元,即便全部达成,也难以支撑如此高的估值倍数。英伟达此次合作,并非出于财务考量,而是为了争取时间。

最终达成的“非收购”模式,即技术许可加核心人才转移,既降低了监管风险,又避免了在舆论上陷入“被TPU逼迫”的被动局面,但实际上,英伟达已将关键能力收入囊中。这无疑是一场防御性的反击。

AI基础设施领域的竞争格局已然改变。这并不意味着英伟达在推理之战中已败下阵来,但清晰地表明GPU的统治地位不再坚不可摧。当推理成为主战场,云厂商纷纷借助自研芯片重塑成本曲线时,英伟达不得不正视一个现实:未来的AI基础设施竞争,不再仅仅依赖更大规模的GPU。而真正的悬念,仍聚焦在谷歌一方。若TPU持续深度绑定Gemini,成为谷歌云的核心差异化能力,这场对抗才刚刚拉开帷幕。英伟达“收编”Groq,或许正是推理时代来临的一个信号,即便霸主也不得不提前调整战略布局。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version