近期,中文数据在国内人工智能大模型训练效能提升上的作用日益凸显。据国家数据局最新公布的数据,目前国内大多数AI模型在训练过程中,中文数据的占比已超过六成,部分模型更是高达八成。
中文高质量数据的开发与供给能力不断增强,为推动我国人工智能模型的性能快速提升注入了强劲动力。国家数据局局长刘烈宏强调,我国人工智能领域的快速发展,与国家对数据工作的高度重视密不可分。
数据作为推动人工智能发展的重要基石,在“人工智能+”的进程中扮演着关键角色。因此,构建高质量的数据集显得尤为重要,对人工智能的发展具有深远影响。