滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

北大EvoPhys团队发布5D世界模型：AI新路线竞争驶入关键赛道

时间：2026-06-06 09:26:04 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当斯坦福教授李飞飞为“世界模型”划出功能分类的学术地图时，北大EvoPhys团队与摩尔线程正用一款名为EvoPhys-World的5D模型，在物理世界与数字空间的交界处架起一座新桥。这款模型突破了传统视觉语言动作框架，将感知、预测、决策与行动压缩进同一隐空间，试图让机器人从“条件反射式执行”进化到“预演后果后决策”。

在机器人操作场景中，传统VLA模型如同条件反射的机械臂：看到杯子后直接抓取平移，中间缺乏对物理规则的理解。4D世界模型虽能预测动作后果，却仅停留在“观看物理电影”的层面——它知道用力推杯子会翻倒，却无法理解翻倒阈值与杯中水量、桌面摩擦力的关联。而EvoPhys-World的5D架构引入动作与因果维度，使模型能同时推演多条世界线：当手指触碰杯沿时，杯子可能因受力点偏移而旋转；若桌面存在水渍，滑动距离会因摩擦系数变化而缩短。这种能力让机器人从“预测观众”升级为“剧本导演”，在行动前完成对物理后果的快速模拟。

模型的核心架构由“世界引擎”与“世界策略”双螺旋构成。前者承担“想象”功能，输入动作指令后生成符合物理规律的世界状态变化；后者负责“行动”，根据目标反向推导最优动作序列。二者形成闭环：策略执行结果反馈至引擎优化预测精度，引擎生成的精准预测又反哺策略生成。这种设计摒弃了传统机器人训练中“仿真-决策”的割裂模式，转而通过“知行互训”实现螺旋进化——机器人不再机械重复预设动作，而是在虚拟空间中进行万次实验后选择最优方案。

在技术路线上，EvoPhys选择与英伟达截然不同的“人本主义”标准。当Cosmos 3将动作定义为机械臂关节角度时，EvoPhys优先训练模型理解人类五指操作：捏杯子、拧瓶盖等动作的数据采集设备、机器人本体与远程操控设备共享统一数据接口。这种设计使人类交互数据可直接用于模型训练，学到的行为能无缝迁移至机器人本体。在机器人形态尚未统一的当下，这种“以人为本”的工程标准，让模型摆脱了对特定硬件的依赖。

硬件层面的博弈同样激烈。EvoPhys团队将模型部署在摩尔线程MTT S5000千卡集群上，这款芯片的特殊性在于保留完整图形渲染管线——世界引擎需要实时“绘制”杯子被推倒的画面，世界策略则需基于渲染结果计算下一步动作。英伟达数据中心卡为追求极致算力阉割了渲染模块，而摩尔线程的“全功能GPU”恰好满足世界模型对“渲染-训练”一体化的需求。这种架构差异暗示着新的行业标准争夺：若5D模型证明需要“会画画”的芯片，英伟达可能被迫在下一代产品中恢复渲染功能。

李飞飞的学术框架为行业指明“渲染器-仿真器-规划器”的融合路径，但EvoPhys的实践已超越这一阶段。其“一个基模，两种形态”的架构，将仿真器与规划器从诞生起就嵌入同一隐空间，通过动态闭环实现功能互馈。这种设计消解了“先分后合”的渐进论，转而追求知行合一的持续进化——没有静止的“大一统”终点，只有不断优化的螺旋上升。

当英伟达用20万亿token构建开放生态时，EvoPhys团队更关注物理世界的真实数据积累。据行业估算，GPT-5训练语料约100亿小时，而高质量具身数据仅50万小时，差距达万倍。这揭示出当前AI竞赛的深层矛盾：算力可通过资本堆砌获取，但物理世界的因果理解必须依赖真实交互数据的缓慢积累。EvoPhys选择押注“仿真器”这一价值最深远却最难啃的领域，或许正因看透了这场竞赛的本质——定义权不在数据规模，而在对物理规则的理解深度。

更多>同类资讯

联想拯救者Y700无极平板散热出色，握持区温度比主动散热手机还低4℃

07-17

安卓17 QPR1 Beta更新：任务栏停靠区末尾改显最近应用，提升操作便利性

07-17

宜家出售八处自持物业资产，关店止损同时探索即时零售新路径

作为英格卡中国的自持物业，上述资产目前已全面清空，无租约限制，可现状即时交付。宜家方面对第一财经记者表示，此举是对中国市场部分已停运商场的自持物业开展后续处置工作，是持续评估并优化全渠道生态系统的举措之一，…

07-17

中国航天网系回收技术突破全球垄断，马斯克沉默背后是中国科技硬实力崛起

中国独创的火箭网系回收技术测试大获成功，直接终结马斯克在可回收火箭领域长达7年的全球垄断。而中国的网系回收技术，直接颠覆了美国沿用多年的固有逻辑，实现了降维突破。这次网系回收技术的成功，不止是一次简单…

07-17

SpaceX第13次星舰飞行测试中止升空前4引擎未点火致任务推迟

根据路透社报道在本次飞行测试中，在升空前最后一刻触发了中止程序，目前 SpaceX 公司正在研究背后原因。2023 年 11 月的第二次试飞在成功分离后失去联系。第九次试飞中，超重型助推器在尝试着陆点火后解…

07-17

SpaceX星舰第13次试飞意外中止一级发动机点火即停原因待查

当巨型火箭第一级的发动机开始点火启动时，系统触发了中止程序，整个发射尝试在倒计时归零前被紧急叫停。其中，超重型一级助推器未能在预定目标区域实现受控溅落，而星舰上面级也未能按计划在太空中完成猛禽发动机的二次点…

07-17

月之暗面发布Kimi K3：全球首个开源3万亿级模型，赋能长程编程与复杂推理

07-17

Kimi K3正式上线：2.8万亿参数加持，能力直逼顶尖模型Fable 5与GPT-5.6

07-17

谷歌NotebookLM升级更名Gemini Notebook，将逐步支持安全云计算机与代码执行

07-17

SpaceX第13次星舰试飞突生变故：升空前中止，或因4引擎未点火

07-17

Meta AI推新举措：青少年谈自杀自残话题时系统将通知家长并加强审核

07-17

小米Robotics-U0：以统一模型打造低成本具身数据引擎，赋能机器人规模化落地

在由清华大学、北京大学等机构联合建设的 WorldArena 基准测试中，U0 以匿名代号 UNIS参评，取得全球总分第一；在真机评测中，使用 U0 扩增数据训练后的机器人策略，在未知光照、陌生背景等 O…

07-17

OpenAI前CTO穆拉蒂创业首推AI模型Inkling：借鉴中国技术平衡成本性能

穆拉蒂领导的Thinking MachinesLab在周三发布了公司的首款AI模型，并采用了“开放权重”模式，这意味着其他开发者可以结合自己的数据对模型进行修改。 Thinking Machines表示，…

07-17

Kimi发布2.8T开源模型，逼近GPT-5.6与Fable 5

07-17

谷歌NotebookLM更名Gemini Notebook：支持代码编写

07-17

点击查看更多 +

全站最新

宜家出售八处自持物业资产，关店止损同时探索即时零售新路径

比亚迪新车“组团”登场！秦MAX、海狮08等五款车型各有亮点等你pick

31.98万起全系标配线控转向智己LS9 Hyper上市重塑大六座SUV体验

零跑曹力“放话”：10万级车配“四张王牌”，友商追赶或需时日不再低调

高能数造干湿结合实验线：为全固态电池研发降本增效保长期价值

吉利全球首发雷霆16合1智能电驱赋能银河TT创多项纪录引领技术跃升

热门内容

本栏最新

宜家出售八处自持物业资产，关店止损同时探索即时零售新路径

小米澎程系列新车续航电池双突破，插电增程动力助出行无忧

小米发布Xiaomi-Robotics-1：10万小时数据验证，具身智能迈入“工业化”新阶段

阿里ATH事业群架构变动：通义万相团队转至张迪麾下未来生活实验室

IDC报告：2025年百度智能云再夺金融大模型市场榜首引领行业价值释放

百度推进香港联交所主板双重主要上市布局全栈AI或迎股价新表现

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.