ITBear旗下自媒体矩阵:

马斯克xAI入局“世界模型”竞赛,视觉模型能否开启AI新篇章?

   时间:2025-10-12 21:46:49 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能的竞争版图正经历深刻变革,原本聚焦于大语言模型的科技巨头们,如今纷纷将目光投向更具挑战性的领域——能够模拟现实物理世界的“世界模型”。在这场新一轮技术竞赛中,马斯克创立的xAI公司正以独特路径加速布局,与谷歌、meta等企业展开正面交锋。

据权威财经媒体披露,xAI今年夏季从英伟达引入两位世界模型领域资深专家,其研发方向直指通过海量视频和机器人数据训练模型,以掌握真实世界的物理规律。这种技术路径与依赖文本输入的传统大语言模型形成鲜明对比,被视为人工智能从“数字世界”向“物理世界”跨越的关键突破。

谷歌近期发布的学术论文引发行业震动,其研发的视频模型Veo 3展现出类似大语言模型的“涌现能力”。研究人员发现,通过“下一帧预测”训练的视频模型,无需专门编程即可自主完成物体分割、边缘检测等复杂任务,甚至能模拟工具使用方式。这种能力跃迁被类比为自然语言处理领域的GPT-3突破,预示着机器视觉可能迎来“通用模型时代”。

xAI的商业化布局已显露端倪。知情人士透露,该公司计划将世界模型率先应用于游戏领域,开发可交互的3D环境生成系统。马斯克在社交平台公开确认,将在明年年底前推出AI生成游戏,这项技术未来更可能延伸至机器人控制系统。为支撑这一战略,xAI正在高薪招募图像视频生成专家,其“omni团队”薪资最高达44万美元,同时以时薪45-100美元招聘游戏导师训练AI模型。

技术突破背后是严峻的现实挑战。行业分析指出,构建世界模型面临双重困境:其一,训练数据获取成本高昂,真实世界的物理交互数据采集需要巨额投入;其二,单纯技术进步未必能转化为商业成功。知名游戏开发商Larian Studios的发行主管直言,AI无法解决行业根本问题,游戏产业更需要的是创新领导力和多样化表达,而非单纯依赖数学模型生成的内容。

尽管争议不断,xAI的强势入局仍为行业注入新动能。谷歌研究人员提出的“帧链”理论,将视频逐帧生成类比为语言模型的“思维链”,认为这种时空推理能力可能催生出具备自主决策能力的机器人系统。这场竞赛的终极目标,不仅是争夺下一代AI技术的主导权,更可能重新定义人类与数字物理世界的交互方式。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version