ITBear旗下自媒体矩阵:

马斯克xAI再发力:Grok 4.1发布,情商智商双提升,团队引关注

   时间:2025-11-20 02:47:30 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

马斯克旗下人工智能公司xAI近日推出全新大模型Grok 4.1,以"双商在线"为卖点,直接对标尚未正式发布的GPT-5.1。这款模型分为Thinking(推理版)和标准版两个版本,现已在Grok官网、X平台及移动端应用全面开放免费体验。

在权威评测平台LMArena的最新榜单中,Grok 4.1 Thinking以1483分登顶全球大模型排行榜,较第二名Gemini 2.5 Pro高出31分。其标准版同样表现强劲,直接占据榜单次席。更引人注目的是情商测试EQ-Bench3的结果:Thinking版以1586分刷新纪录,标准版紧随其后,国产模型Kimi K2位列第三。

实测体验显示,新模型在交互方式上发生显著变化。相比前代产品,Grok 4.1展现出更强的共情能力,回复结尾会主动添加爱心符号,被用户形容为"更有耐心的倾听者"。其创意写作能力提升尤为突出,评分较前代激增600分,文本生成更具画面感和叙事性。同时,模型幻觉率从12.09%大幅降至4.22%,信息准确性显著改善。

技术突破源于强化学习框架的全面升级。xAI后训练负责人Dustin Tran透露,团队在支撑前代模型的基础设施上,通过优化模型风格特征和个性表达,开发出利用智能体推理模型作为奖励机制的新方法。这种自主评估体系使大规模迭代响应成为可能,强化学习规模较前代扩大10倍。

团队构成成为另一关注焦点。近期流传的xAI合影显示,核心研发团队以亚裔面孔为主,有消息称原Grok团队白人成员已全部离职。这种人员调整被外界解读为马斯克的人才战略转型,但公司尚未对此作出正式回应。

关于备受期待的Grok 5,马斯克在最新访谈中透露,这款预计参数规模达6万亿的模型将推迟至明年发布。他解释称,作为迈向通用人工智能的关键里程碑,Grok 5需要前所未有的计算资源支持,目前仍在进行极其严格的测试验证。这与此前报道中提到的资源限制和测试难度问题形成呼应。

行业观察人士指出,Grok 4.1的发布既是技术迭代的成果展示,也暗含马斯克构建AI生态的深层布局。不过随着谷歌Gemini 3.0等竞品即将入场,大模型领域的竞争格局仍存在变数。这场由科技巨头主导的AI竞赛,正在持续改写人工智能技术的发展轨迹。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version