ITBear旗下自媒体矩阵:

马斯克xAI再发力:Grok 4.1发布,情商智商双提升,团队或成“全华班”

   时间:2025-11-21 02:07:20 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

马斯克旗下人工智能公司xAI近日推出新一代大模型Grok 4.1,以"智商情商双突破"的定位向行业头部发起冲击。该模型分为Thinking(推理版)和标准版两个版本,现已通过Grok官网及X平台向全球用户开放,移动端iOS和Android应用同步更新,用户可免费体验。

在权威评测平台LMArena的最新榜单中,Grok 4.1 Thinking以1483分登顶全球大模型排行榜,较第二名Gemini 2.5 Pro高出31分。其标准版同样表现亮眼,直接占据榜单次席。更引人注目的是情商专项测试EQ-Bench3的结果:Thinking版以1586分刷新纪录,标准版紧随其后,国产模型Kimi K2位列第三。

实测反馈显示,新模型在交互体验上实现质的飞跃。相比前代产品,Grok 4.1展现出更强的共情能力,回复中不仅增加耐心倾听的表述,还会在结尾添加爱心符号等情感化设计。创作能力方面,其文本生成评分较前代提升600分,叙事流畅度与画面感显著增强。技术团队通过优化训练方法,将模型幻觉率从12.09%压缩至4.22%,降幅达65%。

xAI后训练负责人Dustin Tran透露,技术突破主要源于强化学习框架的革新。团队开发了基于智能体推理模型的奖励机制,通过分析数万条真实对话数据,将RLHF(人类反馈强化学习)技术推向新高度。"我们扩大了10倍训练规模,让模型在自主评估与迭代响应中实现指数级进化。"他举例说明,新系统能像人类评委般分析对话质量,并据此优化回答策略。

值得关注的是,xAI近期因团队构成引发讨论。社交平台流传的合影显示,其核心研发团队以亚裔工程师为主。有消息称,公司近期调整了人员结构,但官方未对此作出回应。这种技术团队的国际化特征,或许正是其能快速突破技术瓶颈的关键因素。

关于备受期待的Grok 5,马斯克在最新访谈中给出明确时间表。这款规划中的6万亿参数模型将推迟至明年发布,原因在于需要更强大的算力支撑训练过程。"这将是通往通用人工智能的重要里程碑,"他强调,"我们宁愿延迟也要确保其成为世界上最智能的系统。"与此同时,谷歌即将推出的Gemini 3.0被行业视为Grok 4.1的有力竞争者,大模型领域的军备竞赛正进入白热化阶段。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version