滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

英伟达发布新平台：每机柜配备256个LPU

时间：2026-03-18 02:19:41 来源：财联社编辑：快讯 IP：北京 发表评论无障碍通道

在GTC 2026主题演讲上，一款名为英伟达Groq 3 LPU的全新芯片正式亮相。

北京时间周二凌晨，英伟达正式推出Vera Rubin平台，包括Groq 3 LPU（简称LPU）在内，共计搭载了七款芯片，分别为Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU和Spectrum-6以太网交换机。

据悉，英伟达将构建包含256个LPU的Groq 3 LPX机架，提供128GB（每个LPU集成500MB的SRAM）的SRAM和40 PB/s的推理加速带宽，并通过每个机架640 TB/s的专用扩展接口将这些芯片连接起来。这款机架将与Vera Rubin NVL72、Vera CPU等另外四款机架一同构成完整的AI超级计算机平台Vera Rubin。

英伟达表示，Groq 3 LPX 是Vera Rubin的推理加速器，旨在满足智能体系统对低延迟和大上下文的需求。Vera Rubin和LPX通过协同设计的架构，将Rubin GPU和LPU的卓越性能完美结合，使其呈现极低延迟与超大吞吐量的特点。

黄仁勋介绍称，LPX与Vera Rubin平台结合后，推理吞吐量/功耗比将能提升35倍。LPU芯片将由三星代工，预计机架将于今年下半年开始出货。

就在昨日，分析师郭明錤发文称，在英伟达投资Groq之后，LPU的出货量预测已大幅上调。预计2026至2027年的总出货量将达到400万至500万颗。新架构机柜预计于今年第四季度开始量产，2026年与2027年机柜出货量分别约为300至500个，以及15000至20000个。

在他看来，LPU需求增长快速增长主要来自外部因素。一方面，LPU与英伟达生态系（如CUDA）高度整合，大幅降低应用开发与部署门槛。另一方面，如今业内超低延迟推理需求快速增加，包括AI智能体（AI Agents）以及正在兴起的即时处理（Real-Time）、终端用户（Consumer-Facing）与物理AI（Physical-AI）等类型应用。

值得一提的是，黄仁勋在主题演讲上也强调，AI已完成从感知智能到生成智能，再到物理智能和智能体智能的关键跃迁。

财通证券指出，大模型在推理过程中会存在延迟，延迟与用户体验感精密挂钩，大模型推理过程中的延迟主要在Decode阶段，核心瓶颈在于内存带宽。LPU具备更快的内存带宽，可缩短大模型推理过程中的延迟。同时，基于LPU的大模型不仅具有更快的推理速度，还可以提供更具性价比的价格，可进一步提高用户体验感。

更多>同类资讯

AI人才争夺新动向：OpenAI等“挖角”传统软件业，聚焦企业市场扩张

【环球网科技综合报道】4月26日消息，据CNBC报道称，OpenAI和Anthropic等AI独角兽企业近期正密集从Salesforce、Snowflake、Palantir等传统软件巨头手中“挖角”，且目标…

04-27

国家超算互联网限时免费开放DeepSeek-V4对话，开启百万上下文普惠新篇

来源：环球网【环球网科技综合报道】4月26日，国家超算互联网宣布，限时推出免费DeepSeek-V4对话服务，依托国产普惠算力的支撑，让用户感受百万上下文的极速推理体验。国家超算互联网表示，DeepSe…

04-27

AI生图真假难辨引热议，脉脉CEO：互联网信任重塑在即？

IT之家 4 月 27 日消息，脉脉 CEO 林凡前天在自家平台发文，就 ChatGPT Images2.0 生图工具发表个人见解。我感觉整个互联网的信任崩塌了，但实名社交的黎明来了该模型发布后随即引发…

04-27

黄鹤之星领航班走进华为：数智赋能携手武汉企业共绘转型升级新蓝图

华为云商业解决方案与持续运营部副部长代表华为对与会嘉宾表示欢迎，并介绍了华为的发展理念、核心业务布局以及在推动行业数智化转型方面的探索与实践。鼓励武汉企业主动拥抱云与AI，利用平台化、服务化的技术能力降低转…

04-27

港中大（深圳）新突破：AI推理“纠偏术”让算力省七成答案更准

04-27

德州农工大学等团队构建AI视频编辑评估体系，为工具质量“打分”

04-27

巴勒斯坦团队创新：三相变换器让AI语言模型训练效率大幅提升

04-27

对话Momenta曹旭东：自动驾驶领航，驶向物理AI新未来

04-27

李想汽车研究院创新Switch-KD框架，助力小模型高效“看懂”图片世界

04-27

望圆智能冲击IPO：高毛利光环下，研发短板与市场风险待解

与同赛道其他玩家相比，望圆在细分市场的头部地位和成本整体控制水平确实拔尖，但在技术溢价方面存在明显短板——研发开支占收入比仅3.75%，远低于其他机器人企业8%~30%的普遍水平。它在盈利能力和商业落地上已…

04-27

上交大等团队发布PRL-BENCH：AI挑战物理研究，真实能力边界在哪？

04-27

让AI学会“认真看图”：V-GIFT方法为视觉理解注入新活力

04-27

五所高校联合攻克AI持续学习难题：最优传输理论助力对抗遗忘

04-27

艺术与科技共舞：机器人演绎经典，AI时代艺术教育如何破局新生？

04-27

GPT-5.5发布：长上下文质变，定价翻倍下中国开发者的机遇与挑战

国产模型在编程能力上正在逼近，DeepSeekV3.2、Qwen3.6在LMArena编程榜单上已经跻身前十；但在复杂推理、顶层科研场景上，FrontierMath Tier 4国产最优解尚不在同一量级，但…

04-27

点击查看更多 +

全站最新

祖龙娱乐(09990.HK)获主席兼执行董事李青增持44.2万股

中国民航信息网络(00696.HK)获Brandes Investment Partners, L.P.增持207.8万股

安井食品(02648.HK)获Schroders PLC增持6.22万股

海螺水泥(00914.HK)遭The Capital Group减持113.6万股

三花智控(02050.HK)获Schroders PLC增持135.67万股

中国人寿(02628.HK)获中国平安增持399.7万股

热门内容

本栏最新

望圆智能冲击IPO：高毛利光环下，研发短板与市场风险待解

黄鹤之星领航班走进华为：共话数智未来，携手开启企业转型新篇章

元戎首席科学家阮翀首秀：基座模型破局智驾困境，驱动组织AI变革

海康存储北京车展秀实力：多款车载新品亮相，赋能汽车智能化新未来

国家超算互联网限时免费开放DeepSeek-V4对话开启百万上下文普惠新篇

欣旺达北京车展秀实力：“欣星环”电池发布，“能量家生活馆”引领新能源生活

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.