ITBear旗下自媒体矩阵:

英伟达Blackwell Ultra架构能效跃升:每兆瓦吞吐量提升50倍 成本大幅降低

   时间:2026-02-18 14:44:39 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

英伟达近日宣布,其最新推出的Blackwell Ultra AI架构(GB300 NVL72)在能效与成本优化方面取得重大进展。基于DeepSeek-R1模型的测试数据显示,该架构每兆瓦吞吐量较前代Hopper GPU提升50倍,百万tokens处理成本降至原来的1/35。这一突破主要得益于技术架构的全面升级,其中NVLink技术将72个GPU整合为统一计算单元,互联带宽达130TB/s,较Hopper时代的8芯片设计实现质的飞跃。

在AI推理成本优化领域,Blackwell Ultra展现出显著优势。与Hopper架构相比,新平台将每百万token成本压缩至原有水平的1/35;即便与上一代Blackwell(GB200)相比,GB300在长上下文任务中的token成本也降低至1/1.5,同时注意力机制处理速度翻倍。这种性能提升使其特别适用于代码库维护等高负载场景,有效降低了企业级AI应用的运营门槛。

技术细节方面,全新NVFP4精度格式与协同设计结构的结合,成为巩固吞吐性能优势的关键。通过硬件与软件的深度优化,英伟达团队成功突破传统架构的性能瓶颈。例如,TensorRT-LLM库的迭代升级使GB200在低延迟工作负载中的性能四个月内提升5倍,Dynamo团队的优化工作则进一步释放了混合专家模型(MoE)的推理潜力。

市场趋势显示,AI推理需求正呈现结构性变化。OpenRouter最新报告指出,与软件编程相关的AI查询量在过去一年间从11%激增至约50%。这类应用要求AI代理具备跨代码库推理的长上下文处理能力,并在多步工作流中保持实时响应。英伟达的技术升级恰好契合这一市场需求,通过提升推理吞吐量和降低延迟,为开发者提供了更高效的工具链支持。

下一代技术布局已初现端倪。英伟达预告的Rubin平台预计将每兆瓦吞吐量较Blackwell再提升10倍,持续推动AI基础设施的能效革命。这种代际跃迁不仅体现在硬件性能上,更通过软件生态的协同优化形成完整解决方案。随着AI应用场景的不断拓展,能效比与成本控制的双重突破将成为决定技术普及速度的核心因素。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version