马斯克旗下xAI公司推出的Grok 4.2公测版在争议声中正式上线。这款参数规模为5000亿的AI模型,凭借每周自我迭代的特性引发行业关注。尽管马斯克宣称其性能超越现有所有AI系统,但用户反馈呈现明显两极分化态势。
该模型研发过程充满波折,自去年12月以来经历多次跳票。就在五天前,xAI联合创始人集体离职引发外界对项目存续的质疑。马斯克紧急召开发布会强调:"Grok 4.2在预测能力上横扫所有榜单",但至今未公布完整技术报告。目前用户需手动切换才能体验公测版,其快速学习能力成为最大卖点——模型可根据实时反馈持续优化,形成每周更新的进化节奏。
首批测试结果引发激烈争论。支持者展示其代码生成和多模态处理能力,特别在通过"Caitlyn Jenner性别测试"时表现突出,该测试曾让ChatGPT和Gemini陷入舆论争议。但反对声音指出,在复杂逻辑推理场景中,5000亿参数规模明显不足,有开发者直言:"处理高阶数学问题时,模型表现甚至不如三年前的开源系统。"
成本问题成为另一争议焦点。有用户对比发现,相同任务下Grok 4.2的运算成本比主流模型高出40%。更尴尬的是,测试显示模型输出存在显著个人偏好,其回答风格与马斯克公开言论高度吻合,这与宣称的"无偏见设计"形成鲜明反差。Reddit平台出现大量调侃帖,网友戏称这是"马斯克数字分身2.0版"。
面对质疑,马斯克在社交平台展开密集公关,连续转发数十条正面评价,并承诺:"这还是个婴儿模型,每周更新会让你们震惊。"AI工程师Mark Krechman透露,当前版本仅为"轻量级测试版",中大型版本正在研发中,该说法获得马斯克本人转发确认。值得注意的是,xAI至今未公布任何基准测试的详细数据,仅在排行榜展示部分指标。
在模型争议之外,xAI同步推出Grok imagine视频生成工具,目前仅限iOS用户使用。这项新功能允许用户通过文本指令生成短视频模板,为马年主题内容创作提供支持。随着公测持续推进,这场由科技狂人引发的AI模型争论,或将持续影响行业技术路线的发展走向。











