2011年,Judea Pearl因在因果推理领域的开创性贡献获得图灵奖,他提出人工智能必须跨越关联、干预、反事实三层认知阶梯。十五年后,当大语言模型(LLM)沿着数据驱动路径席卷全球时,AI产业却面临新的瓶颈:基于统计相关性的模型无法理解物理世界的因果机制。这种局限性在机器人控制、生物医学等领域尤为突出——模型能预测疾病进展却无法区分病因与症状,能模仿动作轨迹却不懂背后的物理规律。
2026年,世界模型成为AI领域最炙手可热的赛道。meta前首席AI科学家Yann LeCun创立AMI Labs,投入10.3亿美元研发JEPA架构;李飞飞团队融资超12亿美元推出商用产品Marble;Google DeepMind的Genie 3与NVIDIA Cosmos下载量双双突破百万级。然而,这些技术路线均未将因果推理置于系统底层,导致模型在环境变化时性能骤降。在圣地亚哥,一支由20人组成的团队正试图打破这种局面——Aether AI凭借其因果世界模型框架,在成立初期即获得经纬创投2000万美元融资。
创始人黄碧薇博士的学术背景为这项技术突破提供了关键支撑。作为UCSD助理教授,她师从因果发现领域奠基人Clark Glymour、Kun Zhang和Bernhard Schölkopf,在马普所、CMU、UCSD三处顶尖机构积累了12年研究经验。其团队提出的四层技术栈包含革命性设计:底层Causation Transformer直接学习因果关系而非相关性;模块化架构允许动态组合不同因果机制;因果世界模型可模拟干预效果;顶层智能体具备自主规划与策略调整能力。这种设计使机器人在操作任务中成功率提升25%-50%,样本效率提高5-10倍。
传统视觉-语言-动作模型(VLA)的缺陷在具身智能领域暴露无遗。这类模型通过大规模示教数据训练泛化能力,但在部署时面临性能不可预测退化、抗干扰能力差等问题。黄碧薇指出:"VLA本质是死记硬背训练数据中的模式,桌面高度变化两厘米就可能导致失败。"这种局限性源于模型混淆了观察概率P(Y|X)与干预概率P(Y|do(X))——前者描述被动观察到的关联,后者反映主动干预后的真实因果效应。
因果世界模型与传统路线的本质差异体现在数学表达上。该框架包含三个核心方程:状态转移方程描述动作如何改变系统状态;观测函数定义状态变量与传感器数据的映射关系;奖励函数量化行为产生的反馈。这种结构使模型不仅能预测下一步动作,更能回答"如果改变某个变量,世界将如何演变"的反事实问题。相比之下,视频生成模型虽能产生视觉合理的画面,却无法保证物理规律的一致性;3D重建技术可还原空间结构,却不编码力学与动力学关系。
在CVPR 2026展会上,Aether AI的展台引发学术界与产业界的广泛关注。多位高校教授与大厂研究员表示,这种将因果推理嵌入系统底层的设计才是世界模型的终极形态。团队透露,其基础模型将于2027年上半年发布,首批应用场景聚焦机器人决策大脑。内部测试显示,该系统在长程任务中展现出显著优势——当任务环境或奖励函数发生变化时,模型仍能保持稳定性能,这得益于其对摩擦力、接触面等因果变量的显式建模。
黄碧薇将团队定位为"下一代AI范式的开拓者"。她强调:"我们不是为现有系统添加因果模块,而是从Transformer到智能体整个链条都采用因果思维。"这种技术路线不仅适用于机器人领域,还可延伸至生物医学、科学发现等需要因果推理的场景。在长寿研究领域,团队正探索利用因果模型解析T细胞动态变化,试图从海量数据中提取可解释的生物学规律。
当前AI产业正经历范式转变的关键期。黄碧薇预测,未来五年机器人行业将经历剧烈洗牌,最终形成类似大语言模型领域的寡头格局。Aether AI虽以模型研发为主,但已开始组建本体技术团队,为构建完整智能系统做准备。当被问及因果模型能否彻底消除AI幻觉时,她指出:"统计相关性模型会因概率误导产生错误,而因果模型通过理解决策路径实现可控输出,这为解决幻觉问题提供了根本性方案。"







