ITBear旗下自媒体矩阵:

贵州大学团队发布全球最大天文AI数据集ADAM 开启“人工智能+天文”新篇章

   时间:2025-12-20 02:43:23 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

贵州大学张利教授团队近日取得重大科研突破,成功研制出全球规模最大的天文人工智能训练数据集——ADAM(Astronomical Data for AI Modeling)。该成果在贵阳面向全球发布,标志着我国在射电天文与人工智能交叉领域实现关键技术跨越,为应对天文观测数据爆炸式增长提供了系统性解决方案。

随着平方公里阵列射电望远镜(SKA)和中国500米口径球面射电望远镜(FAST)等新一代天文观测设施相继投入使用,全球天文界正面临前所未有的数据处理挑战。这些超级望远镜每秒产生的数据量相当于全球互联网流量的总和,其中复杂的天文效应耦合现象成为制约科学发现的核心瓶颈。传统数据处理方法已难以应对这种量级的数据分析需求。

研究团队历时五年攻关,通过构建虚拟射电望远镜阵列模型,系统复现了从星际介质干扰到仪器系统误差等12类关键观测效应。最终形成的ADAM数据集包含6.1248亿张模拟观测图像,总容量突破304TB,相当于152万张2GB存储卡的容量。该数据集以每日10万张的速度持续扩充,其规模与维度均创世界纪录。

项目创新性地采用"多效应协同模拟"技术路线,首次实现了SKA中低频阵列、FAST核心阵列及其扩展阵列的全场景覆盖。每张图像均包含空间坐标、频率响应、时间序列等200余个参数维度,能够精准还原真实观测中的复杂干扰模式。这种设计使人工智能模型得以在接近真实的环境中进行训练,显著提升天文规律识别的准确性。

在应用层面,ADAM数据集已展现出多维度价值。科研人员利用该数据集训练的脉冲星识别模型,在FAST实测数据中成功发现3颗新脉冲星;针对星系形成模拟的深度学习框架,将计算效率提升40倍。数据集还支撑了FAST观测计划的智能优化系统开发,使有效观测时间增加18%。其可视化模块已被纳入国家中小学天文教育课程资源库。

该成果构建了完整的射电天文数据处理技术体系,形成从数据生成、模型训练到应用部署的全链条解决方案。相关算法框架已通过开源平台向全球开放,被英国曼彻斯特大学、澳大利亚国际射电天文研究中心等机构采纳为标准测试集。数据集的模块化设计支持跨领域迁移,其噪声模拟技术已应用于医学影像处理领域。

作为"东数西算"工程在科研领域的典型应用案例,ADAM数据集推动建立了贵阳-上海-北京的天文数据传输专线,实现每秒20GB的实时数据流转。这种算力与数据的协同布局模式,为国家级科研基础设施的优化配置提供了示范样本。研究团队正与欧洲核子研究中心(CERN)合作,探索将数据集技术应用于粒子物理实验数据处理。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version