埃隆·马斯克在社交平台发布消息称,SpaceX与特斯拉已启动最新大语言模型Grok 4.5的内部私测。这一举措标志着该模型研发进入从理论验证转向真实场景应用的关键阶段,研发团队正通过复杂业务场景检验模型的实际效能。
据技术披露文件显示,Grok 4.5基于参数规模达1.5万亿的V9架构开发。为增强模型在结构化任务处理方面的表现,研发团队在预训练阶段特别融入了AI编程工具Cursor的核心数据集。这种训练策略使模型在代码生成、算法优化等专项领域展现出显著优势,测试数据显示其代码执行准确率较前代提升37%。
第三方评测机构获取的早期数据表明,Grok 4.5在多维度评估中已达到行业顶尖水平。特别是在逻辑推理和复杂任务拆解能力上,该模型在特定测试场景中表现优于Anthropic公司当前旗舰产品Claude Opus。为确保模型稳定性,研发团队正通过强化学习技术持续优化决策路径,同时构建名为"Grok Build"的专项测试体系,包含超过2000个工业级应用场景的压力测试模块。
马斯克在技术路线说明中强调,SpaceX将加速AI模型迭代进程。根据最新规划,2024年剩余时段内,公司将保持每月推出新模型的研发节奏,所有模型均采用从零训练的开发模式。这种高强度研发策略不仅需要持续投入巨额算力资源,更考验团队在算法架构、数据工程等领域的综合创新能力。行业观察人士指出,这种技术竞赛模式或将重新定义商业航天领域的AI应用标准。










