近日,科技界传来了一则令人瞩目的消息。据知名科技媒体WccfTech报道,CoreWeave在最新的测试中利用DeepSeek R1推理模型,展示了英伟达Blackwell架构GB300芯片的强大性能。测试中,仅仅4块GB300芯片就完成了原本需要16块H100芯片才能完成的任务,这一成果让人眼前一亮。
CoreWeave在测试中对比了GB300 NVL72与上一代H100 GPU的性能差异。得益于英伟达对架构的升级以及内存和带宽的增强,GB300芯片展现出了惊人的效率。在仅使用4块GPU的情况下,就完成了原本需要H100芯片16倍数量才能处理的任务,单卡吞吐量提升了整整6倍。
GB300 NVL72平台不仅在算力上有所提升,其系统架构在实际业务场景下的效率也实现了质的飞跃。该平台支持高达37TB的内存容量(最高配置可达40TB),并配备了每秒130TB的内存带宽。为了减少GPU间数据分割的次数,GB300 NVL72采用了4路并行设计,并通过NVLink和NVSwitch高速互连技术,极大地提升了通信效率。
CoreWeave强调,这一提升不仅仅是浮点运算性能(FLOPs)的增加,更是系统架构在实际应用中的高效表现。对于需要运行复杂模型的企业客户而言,GB300 NVL72提供了更高的扩展性和更低的延迟,帮助他们以更快、更经济的方式部署和运行AI服务。这一创新无疑将为企业客户在人工智能领域的发展注入新的活力。