ITBear旗下自媒体矩阵:

GTC 2026三箭齐发:英伟达以新系统重塑AI基础设施竞争新版图

   时间:2026-03-24 23:21:32 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在近期举办的GTC大会上,英伟达宣布推出三款全新系统架构,涵盖推理加速、CPU密度优化及存储编排领域,标志着其从GPU算力供应商向全栈AI基础设施平台的战略转型迈出关键一步。此次发布的Groq LPX推理机架、Vera ETL256 CPU集群与STX存储参考架构,通过整合第三方技术专利与自研芯片,构建起覆盖AI计算全链条的硬件生态。

Groq LPX系统的推出尤为引人注目。该系统基于英伟达对Groq团队的知识产权收购,将第三代LPU架构的LP30芯片与自家GPU深度融合。LP30采用三星SF4制程工艺,集成500MB片上SRAM,在FP8精度下可提供1.2 PFLOPS算力。其设计突破在于通过"注意力与前馈网络解耦"技术,将大模型推理中的动态计算部分交由GPU处理,而静态计算任务则由LPU承担。这种分工使系统在保持低延迟特性的同时,HBM容量利用率提升30%,单次解码步骤的输出token数增加至1.5-2倍。

在硬件架构层面,LPX机架采用模块化设计,32个1U计算托盘通过铜缆背板实现全互联,单节点内16块LP30芯片构成Mesh拓扑网络。每个托盘配备的Altera FPGA承担协议转换与内存扩展功能,提供最高256GB DDR5缓存空间。这种设计使机架整体规模扩展带宽达到640TB/s,较传统架构提升4倍以上。值得关注的是,LP30芯片采用单芯片设计,无需依赖先进封装技术,从而规避了台积电3nm产能的限制。

针对AI训练中日益突出的CPU瓶颈问题,Vera ETL256系统通过极端密度设计实现突破。该机架在42U空间内集成256颗Vera CPU,采用液冷技术与对称式铜缆布线方案,将机架内网络延迟控制在100纳秒以内。每个计算托盘搭载8颗CPU,通过Spectrum-X交换机实现200Gb/s全互联。这种设计使单个机架即可支持大规模强化学习训练所需的仿真环境运行,较传统分布式方案减少70%的CPU资源浪费。

存储领域的创新体现在STX参考架构的推出。该架构与英伟达此前发布的CMX上下文存储平台形成互补,详细规定了磁盘驱动器、Vera CPU、BlueField-4 DPU及Spectrum-X交换机的配置比例。每个STX机架包含16个计算单元,共配备32颗Vera CPU与64块CX-9网卡,通过SOCAMM模块实现存储与计算的解耦。包括DDN、戴尔、HPE在内的七家主流存储厂商已承诺支持该标准,这为英伟达渗透存储基础设施市场奠定基础。

行业分析指出,这三款系统的协同效应将重塑AI硬件供应链格局。LPX系统通过差异化技术路径开辟了推理优化新赛道;Vera ETL256解决了GPU集群扩张中的CPU配比难题;STX架构则使英伟达得以将控制力延伸至存储层。特别值得注意的是,LP30芯片采用非HBM内存方案,为英伟达在存储资源紧张的市场环境下创造了独特的竞争优势。随着这些系统逐步投入商用,AI基础设施市场的集中度预计将进一步提升。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version