国家数据局最新发布的预测数据显示,中国人工智能领域的数据规模将在2025年迎来爆发式增长。用于模型训练和推理的数据总量预计突破199.48EB(艾字节),较当前水平增长42.86%,其中推理数据占比首次超过训练数据,达到101.34EB。这一结构性转变标志着人工智能应用从技术研发向实际场景落地的加速推进。
在数据类型分布上,系统软件与人工智能生成的数据总量将在2025年达到26.92ZB(泽字节),相当于传统物联感知数据的1.2倍。这种量级变化反映出智能终端设备与行业应用的深度融合,特别是自动驾驶、智慧医疗等场景产生的结构化数据呈现指数级增长态势。国家数据局专家指出,数据生成方式的转变将推动存储架构向分布式、边缘计算方向演进。
算力需求结构同样发生显著变化。预测显示,未来推理算力与训练算力的需求比将扩大至3:1,部分高并发场景可能达到5:1。为应对这种变化,国家数据局已启动城市算力网络建设规划,重点布局金融交易、工业控制等对时延敏感的领域,要求相关基础设施的响应时间控制在5毫秒以内,同时满足金融级安全标准。
应用层面的数据调用量印证了技术普及速度。全国日均词元调用量预计从2025年初的1.2万亿次跃升至年末的100万亿次,全年累计调用量达21100万亿次。这种增长主要来自智能客服、内容生成等消费级应用,以及供应链优化、药物研发等企业级服务。某头部科技企业透露,其开发的行业大模型日均处理请求已突破800亿次。
面对数据与算力的双重变革,标准化建设成为关键抓手。国家数据局正在牵头制定智能计算中心建设规范,明确单位功耗算力、数据吞吐效率等核心指标。同时启动"东数西算"升级工程,通过光缆直连和算力调度平台建设,将西部清洁能源基地与东部需求中心的有效衔接效率提升40%。相关技术标准预计在2024年底前完成试点验证。










