在人工智能芯片领域,英伟达凭借其卓越的训练芯片性能,稳坐市场头把交椅,鲜有对手能撼动其地位。然而,随着AI推理市场的蓬勃兴起,这块利润丰厚的“大蛋糕”正吸引着众多科技巨头与新兴企业的目光。
其中,位于美国加州的初创公司Rivos尤为引人注目。据透露,该公司正寻求一笔高达4至5亿美元的融资。若融资成功,自2021年成立以来,Rivos的融资总额将超过8.7亿美元,成为尚未大规模量产却获得巨额融资的芯片初创公司之一。值得注意的是,英特尔的首席执行官陈立武也是这家芯片公司的背后投资者之一。
在AI的世界里,训练与推理如同双轮驱动,共同推动着技术的发展。训练阶段如同AI的“启蒙期”,需要海量数据与高强度的算法训练,成本高昂且耗时漫长。而推理,则是AI技术的“实战阶段”,将训练好的模型应用于实际场景,解决实际问题。
随着生成式AI时代的到来,AI架构趋于稳定,训练成本大幅降低,推理成为持续创造价值的关键。AI推理芯片市场因此迎来了爆发式增长,据第三方机构数据显示,2023年市场规模已达158亿美元,预计到2030年将达到906亿美元。
推理市场的利润之丰厚,让众多科技巨头与初创公司纷纷入局。摩根士丹利的一份报告揭示,AI推理工厂的利润率普遍突破50%,其中英伟达更是以高达77.6%的利润率傲视群雄。然而,这也引发了业界的担忧——“天下苦英伟达已久”,对英伟达CUDA生态的依赖成为行业痛点。
为了减少对英伟达的依赖,科技巨头们开始在推理端逐渐渗透市场。例如,AWS向客户推销租用自研推理芯片Trainium支持的服务器,并提供折扣优惠。同时,OpenAI也开始租用谷歌的TPU,以降低推理计算成本并减少对英伟达的依赖。
在这场推理市场的盛宴中,初创公司同样不甘示弱。他们聚焦于AI专用芯片(ASIC)的研发,以更低的成本实现高效运算。Rivos就是其中的佼佼者,它正在开发一款软件,能够将英伟达的CUDA软件代码翻译成在其芯片上高效运转的语言,无缝承接英伟达生态的软件资源,降低用户迁移成本。
除了Rivos,另一家初创公司Groq也在筹集资金,并开发了独特的语言处理单元(Language Processing Unit)架构,专门针对AI推理任务进行优化,号称能提供“世界最快推理”性能。Groq已与多家企业达成合作协议,并在中东市场开始拓展自己的芯片生意。
一些边缘侧的推理需求也在悄然爆发。从智能家居设备到智能穿戴产品,AI智能硬件的广泛应用催生了大量边缘推理场景。这些微小角落虽然英伟达尚未涉足,但却为初创公司提供了巨大的市场机遇。
值得注意的是,虽然英伟达在“算力越大越好”的叙事下取得了巨大成功,但这一路径是否真正通往通用人工智能,仍存在争议。一些科学家认为,对于某些实际任务,即使对孩子来说轻而易举,但当前的AI技术仍然无法实现。因此,在生成式AI时代,英伟达是否还能继续保持其垄断地位,仍是一个未知数。
在科技界,颠覆与被颠覆的故事永远在上演。随着AI推理市场的不断发展,更多创新技术与解决方案将不断涌现,为行业带来更多的可能性与挑战。