ITBear旗下自媒体矩阵:

上海交大“致远一号”亮相:1024张昇腾910B卡,打造高校智算新标杆

   时间:2025-12-24 05:25:06 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

上海交通大学近日宣布,其自主研发的国产智算算力基础设施“致远一号”正式投入使用。该平台凭借其庞大的规模和先进的配置,成为全国高校中规模最大的同类设施,为教学、科研及管理提供了强有力的算力支持。

“致远一号”的硬件配置堪称豪华,平台内共部署了1024张华为昇腾910B加速卡,FP16峰值算力高达313P。同时,配合Pacific分布式存储与BurstBuffer架构,总存储容量达到了惊人的13.6PB。这一配置不仅满足了大规模数据处理的需求,也为复杂模型的训练提供了坚实的基础。

在计算能力方面,“致远一号”同样表现出色。平台配备了101台CPU节点,形成了拥有5000多个vCPU的通用计算池。云服务支持IaaS、PaaS、SaaS全栈功能,具备异构算力调度与云化弹性部署能力,能够灵活应对多样化的应用场景需求。

“致远一号”的网络与算力资源被精心划分为智算集群区、云平台区和存储区。智算集群区部署了128台Atlas 800T A2昇腾服务器,共1024张NPU卡,峰值算力达到320P。网络架构方面,参数面、业务面和样本面分别采用了不同的高速网络设备,确保了数据传输的高效与稳定。

云平台区则基于HCSO和ModelArts构建,配置了101台鲲鹏Taishan 200 2280 V2服务器及60台网络设备。同时,提供了2PB云对象存储、1PB云块存储和1.6PB云文件存储,为云服务提供了充足的资源保障。

存储区采用了全闪与混闪架构相结合的方式,全闪Pacific 9950提供了43节点、6.5PB的容量,而混闪Pacific 9550则提供了12节点、2.5PB的容量。这种设计不仅提高了数据存储的效率,也为并行计算与大规模模型训练提供了高效的数据支撑。

在机房建设方面,“致远一号”同样不遗余力。平台共设置了52个47U加高机柜,分布在3组封闭微模块中。其中,34个机柜用于智能计算服务器,单柜功率达到30kW;18个机柜用于存储和网络服务器,单柜功率为20kW。这样的布局既保证了设备的密集部署,又便于管理和维护。

供电系统方面,“致远一号”采用了额定功率960kW的供电系统,机房配电总功率达到1380kW。每个机柜都配备了双路PDU,存储和网络机柜还接入了UPS,确保在断电情况下能够维持15分钟的不间断供电,为数据的稳定性和安全性提供了有力保障。

制冷系统方面,“致远一号”配置了30台风冷列间精密空调,单台功率为60kW,按“N+2”冗余方案部署,总制冷功率达到1440kW。同时,采用了氟泵双循环自然冷却技术,使得全年综合PUE约1.3,有效降低了能耗和运营成本。

回顾上海交通大学高性能计算中心的发展历程,自2012年成立以来,该中心已经走过了十多个年头。从2013年建成的“交我算”第一个集群π1.0,到如今的“致远一号”平台全面落地,“交我算”品牌已经逐渐成长为国内高校高性能计算领域的佼佼者。

值得一提的是,上一代“思源一号”高性能计算平台建于2021年,总算力达到6 PFLOPS。而“致远一号”的建成,无疑将进一步提升上海交通大学在高性能计算领域的实力和影响力。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version