滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

专访智源研究院王仲远：世界模型尚处早期，却是机器人未来“大脑”关键

时间：2026-06-15 18:33:00 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

近期，“世界模型”成为人工智能和机器人领域的热门话题。随着具身智能在过去两年快速发展，人们逐渐意识到当前AI在物理世界中的局限性——机器人能够识别物体，却难以理解“推杯子会掉”的物理规律；能听懂指令，却无法预判“拧瓶盖需要多大的力”。世界模型的出现，正是为了弥补这一短板，让机器人真正学会物理世界的因果关系。

具身智能与世界模型的关系，本质上类似于“身体”与“大脑”的协作。与此同时，大模型在经历了语言、视觉和多模态的探索后，正面临从虚拟世界向真实世界跨越的关键阶段。然而，尽管资本和技术资源大量涌入，世界模型的具体实现路径仍不清晰。

北京智源人工智能研究院院长王仲远指出，当前全球对世界模型的探索正沿着四条主要路线展开：第一条是以语言为中心，如VLM和VLA模型，通过文本空间预测下一个词元，但无法理解背后的物理后果；第二条是以像素为中心，如Sora等视频生成模型，在视觉空间中学习图像和视频，但缺乏对物理因果的把握；第三条是以三维结构为中心，如3D重建和李飞飞团队的World Labs Marble模型，虽然能够重建3D空间，但几何结构并不等同于物理状态；第四条是以视觉表征为中心，如杨立昆的JEPA系列模型，通过压缩视觉表征进行预测，但视觉嵌入的演化并不代表物理规律的演化。

作为国内世界模型领域的重要力量，北京智源人工智能研究院提出了第五条路径——以语言和视觉为中心，融合统一的“潜空间表征”。这一方法将所有模态数据压缩到同一个潜空间中，再通过不同的“解码器”还原成视频、动作或位置信息。王仲远比喻说，潜空间就像一张“万能草稿纸”，机器人可以将看到的画面和听到的指令压缩成一种只有AI能理解的“密语笔记”，并在需要时根据同一份笔记生成后续场景或执行动作。

王仲远认为，世界模型的发展仍处于早期阶段，类似于深度学习在2012年前后的状态。当时，数据孤岛问题严重，技术路线尚未明确，行业标准也未统一。他指出，世界模型要真正“上岸”，需要在多个维度上取得突破：首先，模型生成的画面必须符合真实物理规律，而不仅仅是看起来真实；其次，模型需要具备长时序一致性，能够理解连续变化的状态；最后，模型必须能够进行因果逻辑推断，理解动作与结果之间的关系。世界模型还需要作为基座模型应用于多种场景，而非仅服务于单一任务或演示。

在应用层面，王仲远认为世界模型的价值将主要体现在两个方向：一是突破具身智能的瓶颈，服务于机器人领域；二是广泛应用于严肃工业、物理仿真和科学研究等真实场景。他表示，世界模型有望成为真正的“机器人大脑”，解决当前VLA和VLM模型无法处理的泛化、长程任务和主动探索问题。不过，这一过程可能需要三年甚至更长时间。

王仲远进一步解释了世界模型与具身智能的关系。他认为，具身智能目前仍处于非常早期的阶段，大多数模型只能执行单一场景下的被动任务，难以泛化到复杂多变的真实世界。世界模型的出现，正是为了弥补这一短板。他以酒店或家庭环境中的机器人为例，说明世界模型如何帮助机器人根据当前环境和历史记忆做出复杂推理，并选择最优动作执行任务。

在技术难点方面，王仲远指出，真实物理世界数据的缺乏是当前世界模型发展的最大障碍。与大语言模型依赖互联网数据不同，世界模型需要足够多、高质量的真实物理数据。尽管视频数据易于规模化，但其中蕴含的物理信息尚未被充分挖掘。真实交互数据、异构感知数据和动作轨迹数据也同样重要。他提到，仿真数据可以弥补部分不足，但完全依赖仿真数据训练的模型能否真正理解物理世界仍需验证。

对于世界模型的短期落地，王仲远认为，具身智能将首先在特定场景中实现应用，如工厂分拣、打包或酒店服务等To B领域。这些场景不仅能够产生商业价值，还能为未来世界基座模型的训练提供宝贵数据。他强调，技术路径的探索不能等待所有数据准备就绪，而是需要技术与产品同步推进。

当被问及世界模型与大语言模型的发展阶段对比时，王仲远表示，世界模型目前大约处于2012年深度学习初期的水平。尽管数据缺乏和技术路线未定是主要挑战，但他认为，随着视频数据的进一步挖掘和具身机器人在真实场景中的落地，世界模型可能会在三到五年内进入爆发阶段。他还指出，在世界模型领域，中国与海外处于同一起跑线，没有明显差距。

关于未来竞争的核心，王仲远认为，真正的世界基座模型必须具备真实物理可验证能力、长时序一致性、因果逻辑推断能力以及通用泛化能力。他强调，世界模型的价值最终需要通过系统和产品来证明，只有在机器人、物理仿真和科学实验等真实任务中发挥作用，行业才会逐渐形成对世界模型的统一定义和技术路线。

更多>同类资讯

《“AI+钢铁”白皮书发布：宝信宝钢携手勾勒钢铁行业智能化转型新蓝图》

会上，由中国钢铁工业协会指导、宝信软件携手宝钢股份联合编制的《“AI+钢铁”白皮书——以AI重新定义钢铁（2026）》（以下简称“白皮书”）正式发布。2025年2月，中国宝武全面启动“2526”工程，将“人工…

07-20

2026世界人工智能大会：首发技术闪耀，创新成果引领AI新未来

正在上海举行的2026世界人工智能大会上，多项重要举措和创新成果公布。《中国智·惠世界（2026）》案例集收录了我国在人工智能领域开展国际合作的10个生动故事。此外，《国际人工智能伦理治理行动计划》《智能体…

07-20

2026世界人工智能大会：具身进阶、兴业赋能、善治护航共绘AI新蓝图

文章称，千余家企业携3000余项前沿成果集中亮相，超300款新品首发落地……2026世界人工智能大会暨人工智能全球治理高级别会议（WAIC　2026）立足前沿技术、产业落地与AI治理多重维度，清晰勾勒出具身、…

07-20

海尔智家承建全国首个家居家电领域AI应用中试基地推动AI走进千家万户

IT之家 7 月 20 日消息，2026 世界人工智能大会暨人工智能全球治理高级别会议（WAIC）于 7 月 17日在上海启幕。在当日下午举行的“人工智能 + 消费”主题论坛上，海尔集团高级副总裁、海尔智家…

07-20

爱芯元智发布元曦系列新品，A系列AI推理卡超强算力助力企业AI高效落地

IT之家 7 月 20 日消息，爱芯元智 (AXERA) 在 WAIC 2026 上揭晓了其全新元曦系列大算力产品线。爱芯元智还带来了其具身智能大脑控制器。该产品拥有 1500TOPS 算力与约 2 倍行业…

07-20

灵巧智能WAIC展实力：全栈自研打通链路，引领具身智能走向产业新篇

在此背景下，灵巧智能携全链路技术体系与多场景落地成果亮相WAIC，系统展示其在类人灵巧操作领域的全栈能力与产业化路径。未来，灵巧智能将持续完善全栈技术底座，迭代国产化核心能力，并联动制造、能源等重点行业头部…

07-20

Netflix豪掷5.87亿美元收购InterPositive 加速AI影视生产体系布局

07-20

昆仑万维2026世界模型元年启幕：Matrix-Game3.5实时交互，音乐模型版本化创作新突破

07-20

从软件到智能汽车生态，大连如何借AI之力开启产业升级新篇章？

07-20

从机械到智能：AI浪潮下汽车产业变革，传统车企如何破局争先？

07-20

从软件到车联网：大连如何借力AI技术，在智能汽车时代抢占新赛道？

07-20

2026WAIC昆仑万维重磅发布：世界模型元年开启，AI从生成迈向理解交互新纪元

07-20

AI重构营销逻辑：益普索刘立丰谈如何以心智洞察破局供需失灵

07-20

赛思极限CEO：以“通专一体”基础模型推动科研范式重塑

07-20

开发者在多款游戏中藏匿木马被捕，最高面临10年刑期

07-20

点击查看更多 +

全站最新

华为靳玉志详解自动驾驶路径：L3是必经阶段，L4需分步推进

零跑B系列焕新登场：精准契合年轻需求，强势布局10万元级纯电赛道

智己LS9 Hyper上市：34.98万享线控转向等高配，重塑中大型增程SUV格局

MINI JCW三门版高能玩家系列上市专属改装方案解锁纯粹驾驶乐趣

张雪机车首款电摩来袭！50kW电机续航300km，3W+大踏板能否引领新潮流？

鼎力担当守护家庭圆满！长城H10开启预售，限时21.48万元起

热门内容

本栏最新

从软件到智能汽车生态，大连如何借AI之力开启产业升级新篇章？

从机械到智能：AI浪潮下汽车产业变革，传统车企如何破局争先？

从软件到车联网：大连如何借力AI技术，在智能汽车时代抢占新赛道？

《“AI+钢铁”白皮书发布：宝信软件与宝钢股份共绘钢铁智能化转型新蓝图

微光集电2026上海低碳智慧出行展亮相车规CIS芯片助力汽车产业自主发展

中国新能源车产能“被过剩”？市场缺口大欧美需求旺成新机遇

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.