滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

马斯克xAI入局“世界模型”角逐，“视觉模型”能否开启AI新纪元？

时间：2025-10-13 11:38:16 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域正经历一场新的技术跃迁——从基于文本的大语言模型转向能够理解并模拟物理世界的“世界模型”。这场变革吸引了谷歌、meta等科技巨头竞相布局，而马斯克旗下的xAI也悄然加入战局，试图在下一代AI技术中占据先机。

与传统依赖文字训练的模型不同，世界模型通过分析海量视频和机器人操作数据，试图掌握真实世界的物理规律。例如，谷歌研究人员在最新论文中提出，视频模型可能像语言模型一样，通过“下一帧预测”任务，自发解锁物体分割、工具使用等未经专门训练的能力。这种“涌现能力”被类比为语言模型中的“思维链”，研究人员称之为“帧链”，暗示视频模型可能通过时空推理实现更复杂的智能。

xAI的入局策略颇具针对性。据知情人士透露，该公司已从英伟达挖角两位AI专家Zeeshan Patel和Ethan He，这两人在世界模型领域经验丰富。英伟达凭借Omniverse平台在该领域处于领先地位，而xAI的招聘动作显示其正加速技术积累。目前，xAI的“omni团队”正高薪招募图像和视频生成技术人员，薪资范围高达18万至44万美元，旨在“创造超越文本的AI体验”。

游戏领域成为xAI的首个商业化目标。公司计划利用世界模型生成可交互的3D游戏环境，并已启动相关招聘——以时薪45至100美元招募“视频游戏导师”，训练其AI模型Grok开发游戏。马斯克在社交平台确认，xAI将在“明年年底前发布一款AI生成游戏”，并暗示这些技术未来可能应用于机器人系统。这一路径不仅明确了商业化方向，也凸显了世界模型在虚拟与现实交互中的潜力。

行业对视频模型的期待正达到新高度。谷歌近期论文指出，其视频模型Veo 3已展现出与大语言模型相似的“涌现能力”，例如通过“下一帧预测”任务，零样本实现边缘检测和模拟工具使用。研究人员Jack Clark比喻，这如同自然语言处理从特定任务模型转向通用模型，机器视觉领域可能迎来“视觉领域的GPT-3时刻”。若此预判成立，更智能的视频模型或将催生能力极强的机器人“代理”。

然而，技术突破背后是巨大的挑战。训练世界模型需要处理海量真实世界数据，成本高昂且技术难度极大。例如，模拟物理交互的准确性、数据标注的复杂性，以及模型对动态环境的适应能力，均是当前亟待解决的问题。业界对AI的作用也存在理性反思。游戏开发商Larian Studios的发行主管Michael Douse指出，AI无法解决游戏行业的“核心问题”——领导力和愿景。他强调，行业需要的是对世界的多样化表达，而非“数学方式生产的游戏循环”。

尽管如此，xAI的入局仍为这场竞赛注入新动力。英伟达上月曾预测，世界模型的潜在市场规模可能接近全球经济总量。随着AI焦点从数字信息处理转向物理现实模拟，视觉模型能否复刻大语言模型的辉煌，不仅将决定下一代AI霸主的归属，更可能重塑人类与数字及物理世界的交互方式。这场变革中，技术、商业与创意的碰撞，正推动AI向更复杂的维度演进。

更多>同类资讯

AI仿文险入中学生课外读物，茅盾文学奖得主刘亮程打假

04-05

小龙虾OpenClaw被Anthropic封杀国产大模型抢市场

04-05

十部门联合发布新规：聚焦六大方面筑牢人工智能科技伦理防线

04-05

Django联合创始人威利森：AI或开启编程“无人化”新纪元

04-05

英伟达与Marvell强强联合共筑AI基建新生态开启网络发展新篇章

这一战略合作的主要目标是将Marvell连接到英伟达生态系统，为基于英伟达架构构建的客户提供更多选择和灵活性，以开发下一代基础设施。"通过将Marvell在高性能模拟、光学DSP、硅光子和定制硅片方面的领导…

04-05

2026奔驰GLE家族焕新登场：星标闪耀三联屏吸睛 V8混动齐发力

04-05

石化老旧装置改造、移动电源新国标、新能源车险……本周财经热点速览

04-05

优必选2025财报：人形机器人成收入主力，商业化验证仍待破局

这意味着，一个关键变化已经发生，人形机器人不再只是展示性的技术，而开始成为可以带来收入的业务；但另一个更现实的问题也随之出现：当人形机器人第一次成为收入核心，优必选究竟是走到了商业化拐点，还是仍停留在验证阶…

04-05

深圳南山企业布局全国建数据工厂，为具身智能备足“数据粮仓”

面对这一全球性产业瓶颈，位于深圳南山创新沃土的帕西尼，给出了开创性的解决方案——采用“以人为中心”（Human-Centered）含稀缺触觉模态的全模态感知高精度实采具身数据体系。从深圳南山出发，一场以数据…

04-05

新型气动人工肌肉突破局限，柔性轻量化助力机器人解锁多元应用场景

IT之家 4 月 4 日消息，科技媒体 interestingengineering 今天（4 月 4 日）发布博文，报道称美国亚利桑那州立大学团队研发出新型气动人工肌肉，突破了传统电机驱动的性能瓶颈，让机器…

04-05

豆包大模型日均Token使用量破120万亿火山引擎助力企业AI转型升级

火山引擎总裁谭待指出，Token使用量是衡量AI发展速度的核心指标，近期豆包大模型使用量高速增长，核心驱动因素是AI视频创作的爆发与AI智能体的加速普及。谭待认为，企业 Agent 未来将沿双路径并行发展…

04-05

零基础入局AI存储：解锁大模型数据燃料泵，开启商业新蓝海

对于零基础的创业者或转型者而言，投身“AI分布式存储”这一赛道，不仅仅是学习一项技术，更是掌握了一把开启数据资产化大门的金钥匙。在2026年，懂得如何利用分布式存储为大模型“供血”的人才，将成为连接技术与商业…

04-05

米哈游创始团队捐资上海交大助力“AI未来基石”基金探索前沿领域

4月4日，据上海交通大学，米哈游联合创始人、总裁、董事长、上海交通大学2005级信息工程专业本科、2009级通信与信息系统专业硕士校友刘伟，代表米哈游创始团队蔡浩宇、罗宇皓，共同捐资助力学校设立的“AI未来基…

04-05

Tiiny AI外接盒子众筹火爆：精准填补市场缝隙，开启个人AI工作站新篇

04-05

上海三本新刊破局：科学家主导+数字赋能，让学术创新跑出“加速度”

04-05

点击查看更多 +

全站最新

澳大利亚北领地发生6级地震

澳大利亚北部地区发生5.5级地震

NASA发布“猎户座”飞船新自拍，任务进入第四天准备阶段

电动车换电池别盲目！修车师傅揭秘铅酸与锂电差距选对才省钱省心

2026奔驰GLE家族焕新登场：星标闪耀三联屏吸睛 V8混动齐发力

人生首辆车选油车还是插混？不跟风不纠结，按自身需求选才不后悔

热门内容

本栏最新

2026奔驰GLE家族焕新登场：星标闪耀三联屏吸睛 V8混动齐发力

极豆科技携手银联等四方全球首发车载智能体支付场景新体验

上汽奥迪E5 Sportback智驾升级：Momenta大模型赋能，多场景辅助驾驶再进化

上海交大携手蚂蚁健康共建AI实验室共探医疗专科智能体创新应用

优必选科技高薪招贤：具身智能首席科学家年薪最高1.24亿

大厂“打工人”的AI生存实录：提效、内卷与被替代的隐忧

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.