特斯拉首席执行官埃隆·马斯克近日通过社交平台X宣布,其人工智能团队开发的Grok基础模型迎来重要进展。最新版本V9-Medium(1.5T参数规模)已完成核心训练阶段,经内部评估显示性能表现优异,目前正进入参数微调环节,预计强化学习训练将在数日内启动。
据技术团队披露,新模型在架构设计上实现突破性升级,参数规模较当前主力运行的0.5T v8-small版本扩大三倍。特别在复杂代码生成、多步骤逻辑推理等高难度任务中,新模型展现出显著优化的处理能力。开发人员透露,V9-Medium通过改进注意力机制和知识图谱嵌入方式,有效提升了长文本理解与上下文关联能力。
按照项目时间表,该模型将在完成强化学习后进入最终测试阶段,预计2-3周后正式对外发布。此次升级不仅涉及模型容量扩展,更包含训练数据集的全面更新,团队引入了最新开源代码库和跨领域技术文档作为训练素材。当前运行的v8-small版本将继续承担生产环境任务,直至新模型完成稳定性验证。
业内分析指出,参数规模的指数级增长通常伴随算力需求的激增,特斯拉此次模型迭代或与其自研Dojo超级计算机的算力突破密切相关。此前马斯克曾透露,Dojo集群的运算效率较传统GPU架构提升显著,这为大规模模型训练提供了硬件支撑。随着新模型发布临近,科技界正密切关注其在编程辅助、自动化决策等场景的实际应用表现。










