在近日举办的Google Cloud Next大会上,谷歌云服务部门Google Cloud正式推出了一款名为A5X的裸金属实例,该实例由NVIDIA(英伟达)Vera Rubin机架级系统提供核心支持。这一创新举措标志着谷歌在AI计算基础设施领域迈出了重要一步,旨在满足客户对超大规模AI工作负载的严苛需求。
裸金属实例,可视为云上的物理服务器,其独特之处在于资源完全独立,避免了虚拟化过程中可能产生的性能损耗和开销。A5X实例正是基于这一理念设计,通过集成英伟达的ConnectX-9 SuperNIC以及谷歌自主研发的Virgo Network超大规模扩展型AI数据中心架构,实现了前所未有的计算能力。
具体而言,A5X实例在单站点集群中可扩展至多达8万个Rubin GPU,而在多站点集群中,这一数字更是高达96万个。这样的配置使得客户能够轻松应对从基础模型训练到复杂智能体部署等各类AI工作负载,确保在性能、成本和可持续性方面达到最优平衡。
Google Cloud AI和计算基础设施副总裁兼总经理Mark Lohmeyer在大会上表示:“我们坚信,未来十年的AI发展将高度依赖于客户能否在真正集成且AI优化的基础设施堆栈上运行其高要求工作负载。通过将Google Cloud的可扩展基础设施和托管AI服务与NVIDIA的先进平台、系统和软件相结合,我们为客户提供了前所未有的灵活性。”
他进一步强调,这种合作模式使得客户能够灵活训练、调优和部署从前沿模型、开放模型到智能体和物理AI工作负载在内的各种场景,同时确保在性能、成本和可持续性方面实现最佳优化。这一创新不仅提升了AI计算的能力边界,也为整个行业树立了新的标杆。











