近期,据国际媒体报道,英伟达H20芯片在中国大陆遭遇供应困境,这一变化直接影响到DeepSeek公司AI模型开发的进展。据悉,由于美国相关政策的限制,DeepSeek-R2模型的研发工作被迫推迟。
DeepSeek在训练其R1模型时,曾大量使用了Hopper系列GPU,具体包括3万块H20芯片、1万块H800芯片以及1万块H100芯片。这些高性能显卡均由其投资伙伴高毅资产负责采购。特别是H20芯片,在DeepSeek的技术架构中占据了重要地位。
据透露,DeepSeek团队近期正全力推进R2模型的研发工作,但公司CEO梁文锋对目前的模型性能仍持保留态度。因此,内部团队仍在持续优化与提升,尚未达到正式应用的标准。
不仅如此,H20芯片的供应短缺还波及到了DeepSeek-R1模型的现有部署。众多用户习惯于在H20芯片上运行该模型,但随着出口限制的实施,不仅给DeepSeek R2的研发带来了额外挑战,也对现有模型的广泛应用造成了不利影响。