在人工智能与高性能计算领域需求激增的今天,数据存储的效能与稳定性成为了推动算力发展的关键基石。近日,上海霄云信息科技有限公司震撼发布了其全新一代AI存储力作——霄云银河存储系统。该系统专为人工智能模型训练、高性能计算(HPC)及生命科学等前沿应用场景量身打造,凭借“极致速度、高可用性以及全链路可视化”的核心理念,重塑了企业级存储的性能标准。
霄云银河存储系统在三大核心场景中展现出了卓越的性能:
针对人工智能模型训练与推理,该系统内置GPU Direct Storage技术,实现了数据绕开CPU直达GPU显存的高效传输,读取速度高达90GB/s,写入速度也达到了75GB/s,极大提升了超大规模模型训练的效率。单个元数据服务器能够管理高达50亿个文件,优化了检查点存储,加速了模型训练的恢复过程。
在高性能计算领域,霄云银河存储系统支持百万级别的IOPS以及微秒级的延迟,通过并行文件系统和InfiniBand高速网络,轻松应对气象模拟、石油勘探等复杂场景对海量数据的并行处理需求。同时,Multi-Rail多网卡聚合技术确保了90%以上的带宽利用率,保障了多客户端并发访问的流畅无阻。
在生命科学领域,该系统能够高效处理基因测序、蛋白折叠等超大规模非结构化数据,结合RAID 10/5/6冗余架构,确保了科研数据的完整性和分析工作的连续性。
霄云银河存储系统的颠覆性设计构建在“应用-双控-存储”的三层架构之上,通过软硬件的深度协同创新,彻底革新了存储的底层逻辑。双控服务器层内置高性能并行文件系统,支持无缝横向扩展,性能随节点增加呈线性增长。同时,双控机箱具备10秒级故障切换能力,配合共享硬件RAID,实现了控制器故障时的业务零中断。
在存储节点层,全闪存RAID阵列支持热插拔和在线扩容,数据冗余无需软件同步,既简化了软件复杂性,又避免了节点间数据交换对网络带宽的占用。统一命名空间管理使得新增节点能够自动纳入资源池,极大提升了扩展性。
该系统还支持Infiniband/ROCE RDMA网络协议,提供400Gbps的高速传输能力,构建了低延迟、高带宽的数据通道。
霄云银河存储系统的六大功能特性引领了未来存储的发展潮流:GPU Direct Storage技术消除了CPU瓶颈,使模型训练速度提升了两倍以上;CheckPoint智能优化系统自动管理存储资源,加速了模型训练的恢复;极速故障恢复机制确保双控高可用系统在10秒内完成I/O接管,保障了关键业务的连续性;企业级安全与管理功能包括CSI私有客户端容器化部署以及用户配额和ACL访问控制,满足了金融、医疗等行业的合规要求;硬件级冗余支持RAID 10/5/6,硬盘故障时自动重建,提供了超越传统软件RAID方案的数据安全性;全链路监控系统采用独立模块化设计,实时可视化IO性能、硬件状态及网络负载,有助于精准故障定位。
在技术亮点方面,霄云银河存储系统通过专用硬件处理XOR运算,彻底释放了CPU资源,并避免了节点间数据交换对网络带宽的占用。统一命名空间技术实现了跨节点文件系统的无缝整合,提升了管理效率。同时,InfiniBand提供400Gbps的基础传输速度,配合Multi-Rail负载均衡技术,实现了大规模并行访问的无拥塞。
霄云银河存储系统不仅是存储领域的革新之作,更是AI基础设施的核心组件。它通过软硬件的协同优化,解决了传统存储在扩展性、延迟与管理复杂度上的难题,使数据流动与算力增长实现了完美匹配,助力企业在AI时代抢占先机。
上海霄云信息科技有限公司自2015年成立以来,一直深耕高性能分布式存储领域。其核心技术团队历经多年钻研,成功将上海市科委“PB级海量存储系统”课题的科研成果转化为实际应用。霄云科技自研的高性能分布式存储产品凭借其高品质、高可靠性以及自主知识产权和高技术壁垒,已经广泛应用于医疗、金融、电信、教育、制造等多个行业,赢得了用户的高度赞誉。