ITBear旗下自媒体矩阵:

Grok 4成绩亮眼引关注,马斯克剧透Grok 5几周内开训,AGI能否成真?

   时间:2025-09-18 19:41:28 来源:量子位编辑:快讯团队 IP:北京 发表评论无障碍通道
 

人工智能领域近日因马斯克关于Grok 5的表态再度引发关注。在ARC-AGI测试榜单最新公布的评估结果中,基于Grok 4改进的开源方案连续刷新纪录,引发业界对通用人工智能(AGI)实现路径的激烈讨论。

作为评估AI复杂推理能力的权威基准,ARC-AGI测试分为v1和v2两个版本。其中v2版本要求模型完成多步骤逻辑推导,此前表现最优的GPT-5在该项目准确率仅为9.9%,Claude Opus 4则取得8.6%的成绩。而采用Grok 4作为基座的改进方案,不仅将v1准确率提升至79.6%,更在v2测试中达到29.44%的突破性表现。

研究团队透露,Jeremy Berman的方案通过将传统编程语言替换为自然语言指令,显著提升了模型的任务适应性。而Eric Pang团队开发的程序合成系统,则借鉴DreamCoder框架构建了可扩展的程序库,在保持77.1%和26%准确率的同时,将v1平均成本从8.42美元降至2.56美元,v2成本降幅达87%。

马斯克在社交平台公开表示,Grok 5有望成为首个实现AGI的模型系统。这个曾被认为概率不足1%的突破性目标,如今被他修正为"10%或更高可能性"。更引人注目的是,他宣布Grok 5训练计划将在数周内启动,并重申年底前正式发布的承诺。

支撑这种信心的,是xAI在数据和算力领域的双重投入。据内部人士透露,Grok 5的训练数据量较前代呈现指数级增长,其数据采集网络整合了特斯拉FSD车载系统的实时路况数据、擎天柱机器人的环境交互数据,以及X平台的社交网络信息。这种多模态数据融合策略,为模型提供了其他团队难以复制的认知素材。

硬件建设方面,xAI打造的Colossus超级计算集群已部署23万张GPU,其中包括3万张基于Blackwell架构的NVIDIA GB200芯片。按照规划,该机构将在五年内完成相当于5000万张H100 GPU的算力布局,这种投入强度远超行业平均水平。

尽管技术指标持续突破,学术界对AGI的实现仍持谨慎态度。有专家指出,当前测试体系主要考察特定领域的推理能力,与真正的通用智能存在本质差异。某实验室负责人表示:"数据规模和算力优势固然重要,但模型架构的创新和认知机制的突破才是关键。"这种观点在开发者社区获得广泛共鸣,相关话题在技术论坛的讨论量三天内增长400%。

随着训练启动进入倒计时,Grok 5的技术细节逐渐浮出水面。据悉该模型将采用混合专家架构(MoE),参数规模预计突破万亿级别。更值得关注的是其训练方法论的革新,工程团队正在开发具备自我改进能力的程序合成框架,试图让模型在解决复杂任务时自动优化算法结构。

这场由Grok系列引发的技术竞赛,正在重塑AI研发的竞争格局。当被问及是否担心被其他机构超越时,马斯克在最新访谈中回应:"真正的威胁来自我们对AGI本质的理解深度,而不是某个具体时间点的参数规模。"这种将竞争焦点转向基础理论创新的表态,为快速演进的AI产业指出了新的发展方向。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version