在AI数据中心规模日益壮大的背景下,云计算巨头们正面临一项新的挑战:如何高效利用现有的小型数据中心资源。针对这一难题,博通公司推出了创新的解决方案,特别针对地理位置相近的数据中心。
本周一,博通正式发布了其新版Jericho网络芯片。这款芯片凭借其卓越的性能,能够实现大数据量的高速传输。据博通核心交换业务集团的高级副总裁Ram Velaga介绍,借助Jericho芯片,客户可以将多个小型数据中心无缝连接,从而构建一个庞大的系统,用于开发或运行AI模型。
博通声称,其Jericho4产品具备连接超过百万个处理器的强大能力,能够跨越多个数据中心,处理的信息量相比前代产品提升了约四倍。这一突破性的进展,无疑为AI领域的数据传输和处理带来了全新的可能。
近年来,随着AI系统的快速发展,博通的网络组件需求持续增长。这些组件,如路由器和交换机,在GPU之间扮演着数据传输的重要角色。而GPU,作为构建AI模型的昂贵芯片,其需求也随之激增。
值得注意的是,虽然博通的部分设备专注于在同一机架或数据中心内部进行数据传输,但市场对于能够跨越建筑甚至实现远距离传输的组件需求同样迫切。大型GPU集群的功耗问题日益凸显,使得将所有GPU集中在同一位置变得不切实际。Velaga指出,当试图建立包含数十万个GPU的集群时,功耗很快就会达到数百万瓦,而单个物理建筑往往无法满足这样的电力需求。
“当考虑建立20万或10万个GPU的集群时,功耗很快就会逼近300兆瓦,而目前的单个物理建筑根本无法提供这样的电力供应。”Velaga说道。他进一步强调,Jericho系列网络芯片正是为了解决这一问题而生。
随着企业试图将数据中心容量迁移到更接近客户的位置,以加快用户从AI模型获取答案的速度,位于拥挤都市区的数据中心变得尤为重要。在这些地区,连接多个较小的设施可能更为实用。Velaga表示,这进一步凸显了Jericho芯片的重要性。
值得注意的是,博通的Tomahawk系列芯片主要用于连接数据中心内的机架,其连接距离通常限制在一公里以内。而Jericho设备则能够处理超过100公里的远距离连接,适用于跨建筑甚至更远距离的数据传输需求。
据Velaga透露,Jericho4芯片将从周一开始向云服务提供商和网络设备制造商等早期客户发货。这些客户将把芯片集成到他们的产品中,预计完全部署大约需要九个月的时间。
面对AI数据中心发展的新挑战,博通的Jericho4芯片无疑提供了一个创新的解决方案。通过高效连接多个小型数据中心,这款芯片不仅解决了大型GPU集群的功耗问题,还为云计算和AI企业提供了更灵活的数据中心布局选择。