在人工智能芯片领域,英伟达凭借卓越的训练芯片性能,稳坐市场头把交椅,短期内似乎难遇敌手。然而,随着AI推理市场的蓬勃兴起,这块利润丰厚的“大蛋糕”正吸引着众多科技巨头和初创企业的目光。
其中,一家名为Rivos的初创公司尤为引人注目。这家位于美国加州的年轻企业,近日被曝正寻求一笔高达4至5亿美元的融资。若此轮融资成功,自2021年成立以来,Rivos的融资总额将突破8.7亿美元大关,成为尚未大规模量产却已获得巨额融资的芯片初创公司之一。尤为英特尔首席执行官陈立武正是这家芯片公司的背后投资者之一。
为何这些初创公司和科技巨头纷纷选择从推理侧切入,试图打破英伟达的垄断地位?它们又凭借何种差异化技术和成本优势,在这片蓝海中开辟出自己的天地?
在AI领域,训练与推理如同双轮驱动,共同推动着行业的发展。训练阶段如同AI的“启蒙教育”,通过海量数据和高强度算法训练,让AI模型从无到有,成长为能够应对复杂任务的“智者”。然而,这一过程不仅成本高昂,而且耗时漫长,每一次训练都是全新的探索,难以复用。相比之下,推理阶段更像是AI的“实战应用”,将训练好的模型知识转化为实际生产力,解决现实世界中的各种问题。
进入生成式AI时代,技术架构迎来重大变革。以Transformer为代表的AI架构,使得基础模型训练趋向稳定和固化,大大降低了重复训练的成本。在此背景下,推理成为持续创造价值的关键,如同永不停歇的生产线,不断调用模型能力,满足多样化的场景和服务需求。从商业角度看,推理阶段更是成为了AI产业的“现金奶牛”,众多AI应用通过向用户收取推理服务费实现盈利。
根据第三方机构的数据,AI推理芯片市场正在经历爆发式增长,预计从2023年的158亿美元增长至2030年的906亿美元。市场需求与商业收入形成良性循环,推理需求的旺盛推动了企业营收的增长,进而吸引了更多资源的投入,推动了技术的迭代升级。
推理成本的大幅下降是市场增长的重要驱动力之一。硬件层面,企业AI硬件成本每年下降30%,能源效率每年提高40%。算法优化技术如量化、稀疏化和蒸馏等,显著降低了模型的计算复杂度和内存需求。这些技术的进步使得推理变得更加高效和经济。
面对如此诱人的市场蛋糕,科技巨头们纷纷选择在推理端布局,试图减少对英伟达的依赖。例如,AWS向其客户推销租用自研推理芯片Trainium支持的服务器,并提供了折扣优惠。OpenAI也开始租用谷歌的TPU,以降低推理计算的成本。尽管这些举措目前看来只是“小试牛刀”,但无疑释放了一个信号:科技巨头们正开始行动,试图在推理市场分得一杯羹。
在AI推理市场的盛宴中,初创公司同样不甘示弱。它们另辟蹊径,聚焦AI专用芯片(ASIC)的研发,以更低的成本实现高效运算。Rivos便是其中的佼佼者,其正在开发的软件能够将英伟达的CUDA软件代码翻译成在其芯片上高效运转的语言,无缝承接英伟达生态的软件资源,极大降低了用户迁移成本。还有Groq等初创公司,它们凭借独特的技术架构和性能优势,在推理市场展现出强劲的竞争力。
Groq由前谷歌TPU团队成员成立,开发了专门针对AI推理任务优化的语言处理单元(Language Processing Unit)架构,号称能提供“世界最快推理”性能。其提供的token处理成本远低于传统GPU,具有明显的经济优势。Groq已与多家知名企业达成合作,并在中东等英伟达渗透率较低的市场开始拓展自己的芯片生意。
除了这些初创公司和科技巨头外,还有一些微小角落的推理需求正悄然爆发。例如智能家居设备、智能穿戴产品等AI智能硬件的广泛应用,催生出海量边缘推理场景。这些场景对算力的需求呈现出多元化、精细化的特点,为初创公司提供了更多的市场机会。
在生成式AI时代,英伟达凭借“算力越大越好”的暴力美学叙事,成为了最大的受益者。然而,随着技术的不断进步和市场的不断变化,这一叙事是否还能持续下去?科技界永远在上演着颠覆与被颠覆的故事。对于英伟达而言,如何保持其在AI芯片领域的领先地位,将是一个长期的挑战。