滚动资讯

当前位置：首页 > 资讯 > 智能汽车 > 正文内容

Grok 4成绩亮眼引关注，马斯克剧透Grok 5几周内开训，AGI能否成真？

时间：2025-09-18 19:41:28 来源：量子位编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域近日因马斯克关于Grok 5的表态再度引发关注。在ARC-AGI测试榜单最新公布的评估结果中，基于Grok 4改进的开源方案连续刷新纪录，引发业界对通用人工智能（AGI）实现路径的激烈讨论。

作为评估AI复杂推理能力的权威基准，ARC-AGI测试分为v1和v2两个版本。其中v2版本要求模型完成多步骤逻辑推导，此前表现最优的GPT-5在该项目准确率仅为9.9%，Claude Opus 4则取得8.6%的成绩。而采用Grok 4作为基座的改进方案，不仅将v1准确率提升至79.6%，更在v2测试中达到29.44%的突破性表现。

研究团队透露，Jeremy Berman的方案通过将传统编程语言替换为自然语言指令，显著提升了模型的任务适应性。而Eric Pang团队开发的程序合成系统，则借鉴DreamCoder框架构建了可扩展的程序库，在保持77.1%和26%准确率的同时，将v1平均成本从8.42美元降至2.56美元，v2成本降幅达87%。

马斯克在社交平台公开表示，Grok 5有望成为首个实现AGI的模型系统。这个曾被认为概率不足1%的突破性目标，如今被他修正为"10%或更高可能性"。更引人注目的是，他宣布Grok 5训练计划将在数周内启动，并重申年底前正式发布的承诺。

支撑这种信心的，是xAI在数据和算力领域的双重投入。据内部人士透露，Grok 5的训练数据量较前代呈现指数级增长，其数据采集网络整合了特斯拉FSD车载系统的实时路况数据、擎天柱机器人的环境交互数据，以及X平台的社交网络信息。这种多模态数据融合策略，为模型提供了其他团队难以复制的认知素材。

硬件建设方面，xAI打造的Colossus超级计算集群已部署23万张GPU，其中包括3万张基于Blackwell架构的NVIDIA GB200芯片。按照规划，该机构将在五年内完成相当于5000万张H100 GPU的算力布局，这种投入强度远超行业平均水平。

尽管技术指标持续突破，学术界对AGI的实现仍持谨慎态度。有专家指出，当前测试体系主要考察特定领域的推理能力，与真正的通用智能存在本质差异。某实验室负责人表示："数据规模和算力优势固然重要，但模型架构的创新和认知机制的突破才是关键。"这种观点在开发者社区获得广泛共鸣，相关话题在技术论坛的讨论量三天内增长400%。

随着训练启动进入倒计时，Grok 5的技术细节逐渐浮出水面。据悉该模型将采用混合专家架构（MoE），参数规模预计突破万亿级别。更值得关注的是其训练方法论的革新，工程团队正在开发具备自我改进能力的程序合成框架，试图让模型在解决复杂任务时自动优化算法结构。

这场由Grok系列引发的技术竞赛，正在重塑AI研发的竞争格局。当被问及是否担心被其他机构超越时，马斯克在最新访谈中回应："真正的威胁来自我们对AGI本质的理解深度，而不是某个具体时间点的参数规模。"这种将竞争焦点转向基础理论创新的表态，为快速演进的AI产业指出了新的发展方向。

更多>同类资讯

雷军详解小米YU7紫水晶定制色：50小时精抛工艺打造澄澈紫调与流动光影

10-09

小米汽车车模尺寸引关注，李肖爽提醒：官方仅三种，谨防仿品

10-09

华为鸿蒙赋能人形机器人：8家核心企业引领产业新生态

技术定位：作为“汽车+机器人Tier1”供应商，均胜电子将自动驾驶传感器、芯片、雷达等硬件技术迁移至人形机器人领域，实现环境感知与决策能力的突破。合作进展：与华为共建基于鸿蒙操作系统的智能座舱域控产品，服…

10-09

华为鸿蒙赋能人形机器人：8家核心企业引领产业新变革

技术定位：作为“汽车+机器人Tier1”供应商，均胜电子将自动驾驶传感器、芯片、雷达等硬件技术迁移至人形机器人领域，实现环境感知与决策能力的突破。合作进展：与华为共建基于鸿蒙操作系统的智能座舱域控产品，服…

10-09

国庆期间XR产业热潮涌动：微光科技布局、苹果Meta新动向与文旅应用新篇

近期智能穿戴与 XR 领域动态丰富，企业层面，微光科技投入 3 亿布局亚太智能穿戴总部，以模块化创新与柔性生产冲刺全球 AR产能前三，苹果新款 AppleVision Pro相关设备 FCC 备案曝光，T…

10-09

英伟达黄仁勋谈投资：对xAI融资兴奋，遗憾未投更多资金

10-09

Sora引爆AI视频热潮，广告业如何在技术浪潮中重塑品牌价值？

10-09

华为鸿蒙赋能人形机器人：8家核心企业引领产业新机遇

10-09

黄金周喧嚣中，穷游网“复活”引怀旧，老派旅行攻略该何去何从？

10-09

数览“十四五”收官：数字基建跃升技术创新驱动经济民生共进

我国数字基础设施在规模、技术等方面处于世界领先地位，截至2025年6月底，5G基站总数与2020年相比增长了5倍达到455万个，千兆宽带用户增长了34倍达2.26亿户，算力总规模位于全球第二，有力带动了经济…

10-09

从楼梯到苍穹：中国创新以勇毅脚步踏出科技自立自强之路

10-09

中秋国庆“人机共舞”热度高机器人租赁市场潜力释放走向稳健增长

10-09

马斯克晒Optimus“功夫秀”：动作连贯能识招，强调全程AI自主决策

【环球网科技综合报道】10月6日消息，特斯拉首席执行官埃隆·马斯克近日在社交平台发布一段视频：人形机器人Optimus与人类工作人员“过招”练功夫，动作包括推掌、格挡、转身反击等连贯招式，甚至能实时识别对方出…

10-09

马斯克分享特斯拉人形机器人学中国功夫：AI驱动精准应对招式反击

【环球网报道记者张倩】印度“Latestly”新闻网、“今日俄罗斯”（RT）等外媒关注到，特斯拉公司首席执行官埃隆·马斯克4日在社交平台X上发布了一段该公司开发的人形机器人“擎天柱”学习中国功夫的视频。…

10-09

马斯克晒“擎天柱”机器人习武视频：精准应对招式并反击

当地时间10月4日，特斯拉CEO埃隆·马斯克在社交平台X发布了一段“擎天柱”人形机器人学习中国功夫的视频。视频显示，“擎天柱”机器人正与专业人士学习中国功夫，它展示了用于自卫的武术技巧，且并非单纯模仿专业…

10-09

点击查看更多 +

全站最新

雷军详解小米YU7紫水晶定制色：50小时精抛工艺打造澄澈紫调与流动光影

小米汽车车模尺寸引关注，李肖爽提醒：官方仅三种，谨防仿品

小米汽车合金车模遇仿冒：官方明确三种正品尺寸，消费者需谨慎甄别

消费市场“冷”与“热”交织：年轻群体引领制造业新变革

19.29万起售！2026款途观LPro与途昂Pro携端到端NOA，开启燃油车智能新赛道

新蔚来ES8起售40.68万正式交付，李斌承诺产能不足补购置税，纯电SUV市场迎新篇

热门内容

本栏最新

欧美固态电池“纸上谈兵”？中国2026年全固态量产，国产车将迎新突破

特斯拉Model 3与Model Y标准版新车型上线美国官网，国产版价格或大幅下探

破解机床车间物料流转困局：万可搬运机器人实战优势深度剖析

冲刺港股：岚图汽车以“高端”为刃，能否劈开新能源市场新天地？

2025京津冀新能源汽车挑战赛落幕多元活动助力产业升级与绿色出行

全球非上市企业估值榜：OpenAI居首引热议，马斯克质疑其估值合理性

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.