在2026年GTC大会美国加州圣何塞会场,英伟达面向智能体AI的长上下文推理需求,正式推出BlueField-4 STX模块化存储参考架构。这一创新方案旨在突破传统数据中心存储的性能瓶颈,为AI智能体的跨步骤交互提供硬件支撑。
传统存储架构在应对AI推理场景时暴露出明显短板。当上下文信息量激增时,数据从存储设备到计算单元的传输延迟会显著拉低推理效率,导致GPU资源利用率骤降。这种矛盾在需要持续调用历史数据的智能体应用中尤为突出,成为制约AI系统响应速度的关键因素。
STX架构通过重构存储节点与计算资源的物理布局解决这一难题。其核心设计理念是将存储单元深度集成至计算集群内部,使数据访问路径缩短至传统架构的1/5。配合全新的NVIDIA CMX上下文内存存储平台,该架构实现了GPU内存的横向扩展,在基准测试中展现出每秒处理Token数量提升5倍的性能表现。
硬件层面,STX架构基于Vera Rubin平台构建,搭载的BlueField-4处理器集成了专为存储优化的Vera CPU核心与ConnectX-9超级网卡。这种异构设计使单节点可同时处理存储I/O与网络通信任务,配合Spectrum-X以太网架构和DOCA软件框架,形成完整的端到端加速方案。
实测数据显示,采用STX架构的系统在能效比方面达到传统CPU架构的4倍。在企业级AI数据处理场景中,其数据摄取速度实现翻倍增长,特别在每秒页面处理量等关键指标上表现出色。这种性能跃升得益于架构对存储-计算协同的深度优化,有效减少了数据搬运过程中的能量损耗。
英伟达首席执行官黄仁勋在主题演讲中强调,智能体AI的进化正在重塑计算基础设施的范式。他指出:"当AI系统需要同时处理百万量级的上下文标记并保持持续学习能力时,存储子系统必须从被动的数据仓库转变为智能的数据管道。"这一观点直接指向STX架构的设计哲学。
产业合作方面,戴尔、HPE、IBM等存储领域头部企业已启动基于STX的联合研发项目。在云计算领域,甲骨文云(OCI)与Mistral AI成为首批技术采纳者,计划在下半年向市场推出商用化解决方案。这些合作将覆盖从硬件定制到软件优化的全链条,加速新型存储架构的落地进程。










