在人工智能芯片领域,英伟达长期占据主导地位,其市场份额一度高达90%。然而,近期一家名为Cerebras Systems的初创公司正积极发起挑战,试图打破这一格局。据知情人士透露,Cerebras Systems正在洽谈新一轮约10亿美元的融资,旨在强化自身在AI算力集群领域的竞争力,尤其是在性价比和能效比方面超越英伟达的GPU集群。
此次融资若成功,Cerebras Systems的估值将飙升至220亿美元,较去年9月的81亿美元大幅增长170%。尽管讨论尚处于私下阶段,但该公司仍计划推进在美股的首次公开募股(IPO)。在首席执行官安德鲁·费尔德曼的带领下,Cerebras Systems正全力以赴,试图在AI芯片市场占据一席之地。
Cerebras Systems的技术路线与英伟达截然不同。它采用“晶圆级引擎”(WSE)架构,将整个AI模型集成在单个超大芯片上,从而显著提升推理性能和内存带宽。这种设计避免了GPU集群间的数据拆分和高速通信开销,在单位推理量上实现了更高的能效比。据公司宣称,其算力硬件运行AI大模型的效率是英伟达系统的数倍。
在AI推理市场,Cerebras Systems的竞争优势尤为明显。其最新发布的CS-3系统(搭载WSE-3芯片)在多个公开对比中表现出色。据公司数据,CS-3在运行Llama 3 70B推理任务时,速度比英伟达的Blackwell架构B200 AI GPU系统快约21倍,同时总体成本和能耗更低。第三方分析也指出,在高参数推理基准任务中,Cerebras的输出吞吐量远超传统GPU。
尽管Cerebras Systems在特定推理场景中展现出显著优势,但英伟达在通用计算任务、AI训练算子以及CUDA生态兼容性方面仍占据上风。英伟达的AI GPU几乎垄断了AI训练市场,这得益于其强大的通用性和快速迭代能力。然而,随着AI推理需求的激增,市场对单位token成本、延迟和能效的关注度日益提高,这为Cerebras Systems等挑战者提供了机会。
为了应对竞争,英伟达近期与AI芯片初创公司Groq达成了一项重要协议,将其AI推理技术授权给英伟达,并吸纳了Groq的核心研发团队。这一举措旨在通过多元化硬件技术路线和端到端AI应用生态绑定,巩固其市场地位。英伟达还通过收购AI21 Labs等公司,补强软件和模型侧的能力。
与此同时,谷歌也在AI推理领域发力。其最新发布的TPU v7(Ironwood)展现了惊人的代际跨越,BF16算力高达4614 TFLOPS,是上一代TPU v5p的近十倍。针对特定AI应用场景,TPU v7在性价比和能效比方面更具优势,甚至能提供比英伟达Blackwell高出1.4倍的每美元性能。这无疑加剧了AI推理市场的竞争。
面对谷歌TPU和英伟达的双重压力,Cerebras Systems正积极寻求突破。其晶圆级单片设计、极高带宽和推理吞吐能力,使其在处理大型语言模型推理任务时表现出色。然而,要在通用计算任务和AI训练领域与英伟达竞争,Cerebras Systems仍需克服诸多挑战。随着AI推理需求的每六个月翻一番,这场关于AI算力未来的竞争将愈发激烈。











