在近日于北京举办的2025全球数据技术大会上,华为公司副总裁兼数据存储产品线总裁袁远以《构建先进数据基础设施,激活AI时代数据价值》为主题发表演讲。这是袁远首次以新身份公开亮相,其前任周跃峰已升任华为公司高级副总裁兼华为云CEO。
袁远在演讲中指出,中国虽已成为全球数据大国,但在数据语料建设领域仍面临多重挑战。数据显示,我国数据留存率仅为2.8%,海量数据面临存储容量不足、成本高昂、能耗过大等技术瓶颈;行业高质量数据供给严重不足,以医疗领域为例,国内模型训练数据量仅为西方发达国家的十分之一左右;城市与企业数据普遍存在"孤岛"现象,数据共享率不足四分之一;全球年度数据泄露事件已达471.6亿条,数据安全成为跨境流动的核心风险点。
面对这些挑战,袁远提出应依托国家数据局《可信数据空间发展行动计划(2024—2028年)》的指导框架,从城市、行业、企业三个维度构建新型数据基础设施。在城市维度,建议发挥中心城市枢纽作用,建设先进存力中心,推动公共数据与行业数据汇聚治理。华为已与多地开展实践,例如在某城市汇聚50PB公共数据服务60余家企业,在部分城市构建汽车行业高质量数据集支持智能网联发展,并通过"聚数、治数、供数、用数"模式打造环京津数据要素产业园。
在行业维度,袁远强调需建设数据共享协作平台,促进数据从分散利用向智能融合转变。以国家级育种实验室为例,华为协助构建的全国一体化育种数据基础设施实现了百PB级跨域数据管理,通过统一数据标准和工具链将数据标注效率提升4倍,成功打造智慧育种智能体。这种模式正在农业、医疗、金融等多个领域复制推广。
针对企业层面,袁远提出应重点建设AI数据湖底座,强化全域数据共享与敏捷使用能力。以自动驾驶领域为例,华为通过AI数据湖整合路测、仿真、高精地图等多元数据,提供百万级车辆数据接入、EB级存储管理、全球站点数据流动等能力,支撑环境感知、行人避让等智能体协同运作,确保极端场景下的行驶安全。目前该方案已在多家车企落地应用。
技术革新方面,华为计划持续加大投入,重点突破AI数据湖关键技术。一方面将完善并开源端到端AI工具集,丰富国内AI技术生态;另一方面依托全局数据管理技术,研究可信数据跨域流通的合规治理、安全流转与跨境审计机制。同时通过存储技术创新降低向量、标量等新型数据存储成本,进一步释放数据要素潜能。
袁远在演讲最后表示,华为将持续与产业各方协同创新,通过构建先进数据基础设施,加速人工智能技术在各领域的深度应用,为数字经济高质量发展注入新动能。这场演讲引发与会者广泛共鸣,多位专家认为其提出的解决方案为破解数据要素流通难题提供了新思路。










