近期,DeepSeek公司原计划推出的最新AI模型DeepSeekR2遭遇发布延期。据路透社获取的消息,这一变动源于在使用华为芯片进行模型训练时遇到的技术障碍。
据了解,DeepSeek未能顺利完成在华为硬件上的完整训练流程,这反映出在尖端AI模型开发过程中,算力资源与硬件生态系统仍构成重要限制因素。
自2025年以来,DeepSeek凭借开源模型迅速崭露头角,吸引了国内外AI领域的广泛关注。然而,此次发布延期揭示了国产算力解决方案在应对超大规模模型训练时的稳定性与兼容性难题。
行业专家表示,尽管国产芯片在推理性能方面取得了显著进步,但在处理高强度训练任务时,其在生态系统成熟度与软件适配方面仍需时间以追赶国际顶尖水平。