英伟达近日揭晓了其最新一代AI芯片——Blackwell Ultra GB300的详细规格,该芯片相较于上一代GB200,性能实现了显著提升,增幅高达50%。
GB300采用了创新的双光罩设计,集成了令人瞩目的2080亿个晶体管,内置2万个CUDA核心。其显存配置同样惊人,配备了288GB的HBM3e显存,带宽高达8TB/s,为大规模AI模型的运行提供了充足的内存空间和高速数据传输能力。
技术层面,GB300基于台积电先进的4NP工艺制造,拥有160个SM(流处理器)单元,每个SM单元包含128个CUDA内核,总计20480个CUDA核心。它还配备了640个第五代Tensor核心,以及40MB的TMEM(Tensor内存),进一步增强了其AI计算能力。
在存储方面,GB300的显存配置相较于GB200有了大幅提升。其288GB的HBM3e显存通过8组堆叠和8192-bit位宽连接,提供了前所未有的带宽和容量,能够轻松容纳超过3000亿参数的AI模型,支持更长的上下文长度和更高的计算效率。
互连技术方面,Blackwell Ultra支持第五代NVLink,实现了每GPU 1.8TB/s的双向带宽,最多可支持576个GPU的互连。同时,它还配备了PCIe Gen6接口,提供了256GB/s的带宽,并支持与Grace CPU的NVLink-C2C协同工作。这些特性使得GB300在系统层面能够构建出强大的GB300 NVL72机架系统,峰值算力可达1.1 EFLOPS FP4。
安全与管理方面,GB300引入了升级版的GigaThread调度引擎,支持多实例GPU(MIG)功能,能够灵活分配显存资源。同时,它还引入了机密计算和TEE-I/O特性,为AI模型和数据提供了全方位的安全保障。
英伟达此次发布的Blackwell Ultra GB300芯片,不仅在性能上实现了显著提升,还在存储、互连、安全与管理等多个方面进行了全面升级。这款芯片的推出,无疑将为AI领域的发展注入新的活力。