特斯拉创始人埃隆·马斯克的人工智能企业xAI,在万众瞩目中揭开了其最新科研成果的面纱——Grok 4大模型。这款模型的发布,不仅标志着xAI在人工智能领域的又一重大突破,也预示着AI技术竞赛的新一轮高潮。
7月10日,通过一场近一小时的线上直播活动,xAI向全球观众展示了Grok 4系列的两款力作:专注于单一智能体处理的Grok 4,以及支持四个智能体并行协作的Grok 4 Heavy。后者凭借其独特的并行思考机制,能够在复杂任务中展现更为精细和高效的推理能力。
Grok 4的问世,是xAI自2023年首推大模型以来的第四次重要迭代。在备受瞩目的“人类的最后考试”基准测试中,Grok 4以25.4%的准确率超越了谷歌Gemini 2.5 Pro和OpenAI o3(高版本),被誉为“全球顶尖AI模型”。该测试涵盖了数学、自然科学、工程及人文等多领域的高难度问题,对AI的综合能力提出了严峻挑战。
据xAI团队介绍,“人类的最后考试”共包含2500个博士乃至更高研究水平的难题,而Grok 4在这些领域均表现出色,甚至超越了人类博士的水平。马斯克在直播中自信地表示,尽管Grok 4尚未实现科学新发现,但这只是时间问题,他预计该模型将在年内取得这一成就。
Grok 4在GPQA、AIME25、LCB(Jan-May)、HMMT25等多项评估中也展现出了卓越性能,超越了包括OpenAI o3、Gemini 2.5 Pro在内的多个知名模型。这一连串的佳绩,无疑为xAI在AI领域的领先地位增添了浓墨重彩的一笔。
xAI之所以能够取得如此显著的进步,离不开其庞大的算力支持。据悉,Grok 4的训练是在一个拥有超过20万张H100 GPU的超级计算机集群上完成的,这一规模较Grok 3时期翻了一番。更重要的是,xAI调整了训练策略,加大了对“推理能力”的专项投入,使得Grok 4的训练量较Grok 2提升了整整100倍。
为了支撑这一庞大的算力需求,xAI在美国田纳西州孟菲斯投资建造了超级计算机。该项目初期已配备20万个英伟达GPU,并计划最终扩大到100万个。这一雄心勃勃的计划已经投入了数亿美元,并将持续吸引大量资金。
然而,高昂的算力支出也给xAI带来了巨大的成本压力。据外媒报道,xAI目前每月的运营成本高达10亿美元,其在构建先进大模型方面的投入远远超过收入增长。马斯克对此表示,这类亏损在AI行业并不罕见,主要是由于服务器建设和芯片采购的高昂成本所致。
在AI大模型的激烈竞争中,融资与技术研发成为了xAI前进的双轮驱动。就在Grok 4发布前夕,xAI成功完成了100亿美元的融资,包括50亿美元的债务融资和50亿美元的股权融资。这一轮融资不仅为xAI提供了充足的资金储备,也为其在技术研发上的持续突破奠定了坚实基础。
随着Grok 4的发布,xAI在追逐通用人工智能(AGI)的道路上又迈出了坚实的一步。然而,这条道路仍然漫长且充满挑战。在马斯克为Grok 4的卓越表现欢呼时,业界已经意识到,下一个“最强AI模型”或许已经在路上,等待着下一个突破的到来。