ITBear旗下自媒体矩阵:

上海交大“致远一号”全面启用:国产智算新标杆 赋能教学科研新突破

   时间:2025-12-24 06:27:52 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

上海交通大学高性能计算中心近日宣布,其最新打造的国产智算算力基础设施“致远一号”已全面投入使用。该平台凭借1024张华为昇腾910B加速卡,实现了FP16峰值算力313P的突破,成为全国高校中规模最大的同类设施。平台不仅在硬件层面具备强大性能,还本地部署了包括DeepSeek在内的8款主流大模型,为教学科研提供多元化支持。

在硬件配置方面,“致远一号”采用分层架构设计。智算集群区由128台Atlas 800T A2服务器组成,配备1024张NPU卡,峰值算力达320P。每台服务器采用5机柜部署方案,单柜功率30kW。网络系统采用三平面架构:参数面通过200GE RoCE网络实现1:1收敛,业务面依托100GE SDI智能网卡构建,样本面则采用25GE RoCE网络。云平台区基于HCSO和ModelArts框架,整合101台鲲鹏Taishan 200服务器与60台网络设备,提供总计4.6PB的混合云存储能力。

存储系统采用全闪与混闪混合架构,其中全闪存储区配备43台Pacific 9950节点,提供6.5PB容量;混闪存储区部署12台Pacific 9550节点,容量达2.5PB。这种设计既保障了并行计算的高效性,又能满足大规模模型训练的数据吞吐需求。通用计算池通过101台CPU节点形成5000+ vCPU资源,支持IaaS、PaaS、SaaS全栈云服务,具备异构算力调度与弹性部署能力。

机房建设充分体现节能理念,52个47U加高机柜分布在3个封闭微模块中。其中34个机柜用于智能计算服务器,单柜功率30kW;18个机柜承载存储和网络设备,单柜功率20kW。供电系统采用小母线架构,配备双路PDU供电,存储和网络机柜额外接入UPS设备,可在断电情况下维持15分钟持续运行。制冷系统配置30台60kW风冷列间精密空调,通过“N+2”冗余设计和氟泵双循环技术,将全年综合PUE控制在1.3左右。

该平台的计算节点配置呈现差异化特征。CPU节点采用双路Kunpeng 920处理器,内存配置包含2048GB、1024GB和512GB DDR5(4800MHZ)三种规格。NPU节点则搭载四路Kunpeng 920处理器,每节点集成8颗昇腾AI处理器。存储节点分为高性能与高容量两种类型:前者使用OceanStor Pacific 9950设备,配备7.68T NVMe SSD主存盘;后者采用OceanStor Pacific 9550设备,主存盘为16T SATA HDD。

网络设备方面,参数面交换机选用CE9855-32DQ型号,具备32个400GE端口和2个10GE端口,交换容量达25.6Tbps。样本面交换机采用CE8850-64CQ-EI型号,配置64个100GE端口,交换容量在12.8Tbps至204.8Tbps之间,包转发率4482Mpps。这种精细化的网络配置,确保了不同业务场景下的数据传输效率。

“致远一号”的建成标志着上海交通大学在高性能计算领域迈入新阶段。该校高性能计算中心自2012年成立以来,已形成完整的“交我算”品牌体系。2013年建成首个π1.0集群,2021年推出的“思源一号”平台总算力达6 PFLOPS,采用联想温水冷技术将PUE控制在1.10。新一代平台在算力规模、能效比和功能完整性等方面实现全面升级,为智慧校园建设提供了重要支撑。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version