在2025 OCP全球峰会上,英特尔推出了一款创新的异构AI计算系统,该系统通过整合英特尔Gaudi3 AI加速器与英伟达B200 Tensor Core GPU,构建了混合计算架构。这一设计突破了传统同构计算模式的局限,为AI模型推理提供了更高效的解决方案。
系统采用分工协作模式:英伟达B200 GPU负责AI模型的预填充阶段,利用其强大的并行计算能力快速处理输入数据;而英特尔Gaudi3加速器则专注解码阶段,通过优化张量运算降低延迟。在Llama开源模型测试中,这种异构组合相较于纯B200方案,在总拥有成本(TCO)相同的情况下实现了最高70%的性能提升。
据技术分析机构SemiAnalysis披露,该系统的扩展能力得益于高端网络组件的集成。英伟达ConnectX-7 400GbE网卡与BlueField-3 DPU构成智能网络层,配合博通Tomahawk 5交换芯片提供的51.2Tb/s带宽,使系统能够支持更大规模的分布式计算集群。这种架构设计显著提升了数据吞吐能力,为训练超大规模AI模型提供了硬件基础。
此次技术展示标志着异构计算在AI领域的应用迈入新阶段。通过整合不同厂商的硬件优势,系统在保持成本可控的同时,实现了性能的指数级增长。这种跨平台协作模式或将成为未来数据中心架构的重要发展方向。