埃隆·马斯克近日在社交媒体上透露,其旗下人工智能企业xAI正在开发的Grok 5大型语言模型,有10%的可能性达成通用人工智能(AGI)目标,且这一概率正稳步提升。作为特斯拉与SpaceX的掌舵人,马斯克此次的预测引发了科技界对AGI实现路径的广泛讨论。
xAI的技术路线与马斯克对AI效率的追求一脉相承。以Grok系列模型为例,2023年11月问世的Grok-1凭借330亿参数,在性能上逼近参数规模翻倍的LLaMA 2(70B),且训练资源消耗仅为后者的一半。2024年4月推出的多模态版本Grok-1.5V更进一步,不仅能通过视觉信息生成Python代码,还在RealWorldQA基准测试中超越同类模型,展现了跨模态理解与代码生成能力的结合。
Grok 5被视为xAI技术突破的关键里程碑。据内部消息,该模型采用全新架构设计,可能摆脱对海量数据的依赖,通过更高效的自我学习系统降低训练成本。这一方向与当前主流模型依赖大规模数据标注和算力堆砌的模式形成鲜明对比,若能实现,将大幅缩短AGI的研发周期。
在回应网友质疑时,马斯克以幽默方式提及,Grok 5在AI工程领域的表现已超越加拿大深度学习专家安德烈·卡帕斯。卡帕斯曾主导meta AI实验室研究,并提出“模型规模即性能”的范式。而xAI通过自主研发的训练堆栈(基于Kubernetes、Rust和JAX的定制框架),在资源利用率上取得突破,为模型效率优化提供了新思路。