英伟达今日正式发布面向大规模上下文处理的专用GPU——Rubin CPX,这款硬件专为高负载任务设计,涵盖生成视频、大规模代码处理等需要处理海量上下文信息的场景。通过将AI提示理解与响应生成环节解耦,英伟达宣称该产品可显著提升客户的工作效率。
作为Vera Rubin超级计算平台的核心组件,Rubin CPX将与Vera CPU形成协同架构。全机架配置的Vera Rubin NVL144 CPX版本展现出惊人算力,其AI性能指标达到8 exaflops级别。独立运行的Rubin CPX GPU配备128GB GDDR7显存,采用4-bit NVFP4精度架构,可提供30 petaflops的峰值算力,注意力处理能力较前代提升3倍。
英伟达CEO黄仁勋在发布会上将该产品类比为图形处理领域的革命性产品RTX,强调其作为首款专为大规模上下文AI设计的CUDA架构GPU的里程碑意义。他特别指出,Rubin CPX具备同时处理数百万知识符号的模型推理能力,并透露1亿美元的硬件部署投资可带来50亿美元的预期收益。
软件生态方面,该硬件将获得英伟达全栈软件支持,其中Nemotron多模态模型系列成为重要配套。这套开放模型体系包含从设备端应用的Nano版本、单GPU部署的Super版本,到数据中心级的Ultra版本,旨在为企业级AI代理系统提供构建基础。英伟达官方确认,Rubin CPX预计将于2026年第四季度正式上市。