英伟达近日以200亿美元天价收购推理芯片独角兽Groq,这场被分析师称为“技术豪赌”的交易,正引发AI芯片行业格局的深度震荡。交易核心并非单纯的技术整合,而是英伟达创始人黄仁勋对AI算力未来趋势的精准预判——通过吸纳谷歌TPU初代核心开发者Jonathan Ross及其团队,英伟达试图在推理市场爆发前夜抢占战略制高点。
这场收购的特殊性在于其“技术+人才”的双重属性。据披露,200亿美元中130亿美元为即时支付,剩余部分通过核心员工股权激励完成,其中Groq首席执行官Jonathan Ross个人获得数亿美元英伟达股权。更关键的是,Groq芯片设计团队、编译器开发组等核心资产将整体并入英伟达体系,这种“人才捆绑技术”的模式被瑞银分析师称为“规避监管风险的完美收购”。
Groq的LPU芯片架构成为这场交易的核心筹码。该架构颠覆传统GPU设计逻辑,采用全片上SRAM存储方案,通过消除数据搬运延迟实现性能跃升。实测数据显示,其运行Llama 3.3 70B模型时,token生成速度达284tokens/s,首token响应时间仅0.22秒,较英伟达B300芯片提升5-10倍,而成本仅为后者的1/10。这种“性能-成本”的双重优势,直击英伟达在推理市场的短板。
行业背景的转变加速了这笔交易的落地。当前AI发展正从“规模竞赛”转向“效率价值兑换”,推理需求占比已超训练市场。meta、谷歌等科技巨头开始构建多元化算力供应链,Anthropic更是宣布接入100万个谷歌TPU组建计算集群。这种趋势下,英伟达若仅依赖GPU架构改良,将面临被专用推理芯片边缘化的风险。
Jonathan Ross的技术路线具有颠覆性潜力。作为谷歌TPU的缔造者,他深谙GPU架构在推理场景的局限性。其设计的LPU架构绕过CUDA生态依赖,采用GlobalFoundries和三星代工方案,不占用台积电稀缺的CoWoS产能。某机构分析师指出:“这相当于在英伟达的三重护城河(GPU+CUDA+先进封装)外开辟新赛道,若放任Groq发展,可能引发AI芯片生产门槛的彻底重构。”
英伟达的应对策略展现技术霸权思维。收购后,LPU将作为专用加速单元嵌入CUDA生态系统,初期通过NVFusion实现快速集成,长期计划在底层架构层面与GPU协同设计。更值得关注的是,有消息称英伟达下一代Feynman GPU可能采用3D堆叠技术,将LPU单元与主计算芯片通过台积电SoIC技术垂直整合,这种设计既能利用SRAM的低延迟特性,又避免直接扩展带来的成本激增。
然而技术整合面临严峻挑战。CUDA内核设计初衷是实现硬件抽象,而LPU需要显式内存布局,二者在执行逻辑上存在根本冲突。某芯片架构师透露:“在AI架构中集成SRAM需要工程奇迹,既要确保LPU-GPU环境优化,又要维持CUDA的通用性,这相当于在飞行中更换飞机引擎。"但英伟达的现金流优势为其提供了试错空间——2026财年第三季度自由现金流达220.89亿美元,足以支撑这场豪赌。
这场收购的深层逻辑在于算力主导权的争夺。当Deepseek等模型的出现被Jonathan Ross称为AI行业的"斯普特尼克时刻",推理市场的技术路线之争已上升为战略层面。英伟达通过收购不仅获得即时技术优势,更将潜在竞争对手的技术路线纳入自身体系,这种"技术收编"模式或将成为AI芯片行业的新常态。











