在近期举办的第四届创新数据基础设施论坛上,华为公司高层周跃峰博士发表了一场引人深思的演讲,聚焦数据觉醒与AI数据基础设施的发展。演讲中,他正式揭晓了华为的全新AI数据湖解决方案,旨在加速AI技术在各行业的应用步伐。
周跃峰博士强调,尽管数字化转型已历经多年,数据的核心价值始终未变。他指出:“AI-Ready的前提是数据Ready,随着行业数字化的深化,数据正逐步转化为信息和知识。”华为此次推出的AI数据湖解决方案,集成了数据存储、管理、资源管理和AI工具链,为高质量AI语料的高效提供创造了条件,从而大幅提升了模型训练与推理的效率。
在数据存储方面,华为展示了其持续创新的实力。OceanStor A系列高性能AI存储以其卓越性能,助力科大讯飞等AI企业显著提升了集群训练效率。同时,通过推理加速技术,降低了推理时延,优化了推理应用体验,加速了大型AI模型在生产系统中的应用。OceanStor Pacific全闪分布式存储凭借其出色的容量密度和极低能耗,轻松应对了如教育科研、医疗影像和媒资视频等行业所面临的海量数据存储挑战。
华为还通过OceanProtect备份存储,为油气、MSP等行业提供了强大的数据保护。其备份性能达到业界十倍,勒索攻击侦测准确率高达99.99%,有效守护了训练语料库和向量数据库等关键数据。
在数据管理层面,华为DME存储数据管理平台集成了统一数据空间,打破了数据中心多地部署中的数据孤岛现象。其千亿级文件数据秒级检索能力,促进了数据的高效处理和价值释放。
资源管理方面,华为基于DCS平台的虚拟化和容器技术,为客户提供了高效的xPU资源池化和智能调度能力,提升了资源利用率。同时,借助DME的DataMaster运维大模型,实现了AI Copilot智能运维,涵盖了AI智能问答、运维助手和巡检专家等全场景AI运维能力。