henry 发自 凹非寺
量子位 | 公众号 QbitAI
世界模型主线,提前进入春季躁动!
据彭博社消息:李飞飞创办的World Labs正在以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美元。
如果融资完成:World Labs的估值将从2024年的10亿美元,直接乘5到50亿美元。
一年多时间,5倍重估。
“LLM之后的下一条主线”,太有含金量了。
World Labs新融资
放在一年前,这样的估值几乎不可想象;但现在,飞飞老师已经把它摆上了谈判桌。
50亿估值,融资5亿。
如果交易最终落地,这将不是一轮对AI教母个人光环的信仰充值,而是资本对World Labs及其世界模型路线的重新定价。
在此之前,World Labs已完成累计2.3亿美元融资,估值达到10亿美元。
World Labs成立于2024年4月。当月完成首轮融资,估值约2亿美元。
首轮投资方包括Andreessen Horowitz(a16z)和加拿大投资机构Radical Ventures,后者也是李飞飞担任科学合伙人的机构。
紧接着,在2024年6–7月,World Labs又完成一轮1亿美元融资,由NEA领投,公司估值被抬升至超过10亿美元,正式跻身独角兽行列。
据彭博社披露,这两轮融资的投资方还包括英伟达(NVIDIA)、沙特阿拉伯的Sanabil Investments,以及新加坡主权基金淡马锡(Temasek)。
个人投资者方面,则包括Google首席科学家Jeff Dean、演员兼投资人Ashton Kutcher,以及AI教父Geoffrey Hinton。
融资干什么?
当然是搞“世界模型”。
World Labs正在研发能够在三维世界中进行导航和决策的AI系统,构建其所称的“大世界模型(large world models)”。
它解决的,并不是“生成一张好看的图”,而是让模型真正理解真实物理世界的结构与演化方式。
在产品层面,World Labs已于去年11月推出首款3D世界生成模型Marble。
Marble可以根据文本或图像提示,直接生成可探索的3D世界。
在传统流程中,3D内容通常从人工构建的多边形网格(polygon meshes)开始:
场景由大量微小的三角形拼接而成,再交由渲染引擎处理,工程成本高、制作周期长,也很难规模化。
Marble则采用了3D高斯溅射(3D Gaussian Splatting,3DGS)技术,用数以百万计的半透明点来表示场景结构,从而在保持较高渲染效率的同时,实现更细腻的视觉效果。
更重要的是,Marble并不只追求“看起来真实”。它还会同时输出所谓的“碰撞网格(collider meshes)”——
这是一种牺牲外观细节、换取计算速度的几何表示,专门用于物理仿真和机器人模拟。
在交互层面,Marble还提供了Chisel工具:用户可以先用简单几何体快速“搭骨架”,再生成不同风格的细节版本,这是朝着可控、可编辑的世界构建迈出的一步。
World Labs近期还开放了World API,开发者可以在应用中通过文本、图像或视频,直接生成可探索的3D世界,把“世界模型”嵌入到具体产品之中。
在战略层面,李飞飞本人也曾多次明确表态:
世界模型是实现空间智能的关键,是继大语言模型(LLM)之后,AI下一个十年的核心主线。
在她的框架中,真正具备空间智能的世界模型,至少需要三种能力:
生成(Generative):能创造遵守物理定律、空间一致的世界;
多模态(Multimodal):能处理从图像、视频到动作的多模态输入;
交互(Interactive):能预测世界随时间演变或互动的状态。
也正因如此,世界模型被视为一种“基础设施型能力”。
一旦成立,它的影响将不只局限在单一应用场景,而会向多个方向扩散:
AIGC:3D资产生成、游戏世界构建、影视制作与虚拟拍摄。
具身智能:机器人、仿真环境、现实世界任务执行。
以具身智能为例,世界模型提供的是对环境的可预测表示,在此之上,才能叠加真正有效的决策与控制。
包括DP(Diffusion policy)、RL等控制方法,以及对智能体行为进行系统性评估(如光轮智能)。
One more thing
值得一提的是,世界模型的另一条路线,也迎来了资本押注。
最近,由前meta首席科学家,图灵奖得主Yann LeCun创办的AMI Labs(Advanced Machine Intelligence,AMI)吸引了包括Cathay Innovation在内的潜在投资者,传闻其融资估值可能达到35亿美元。
与李飞飞押注显式、可生成的三维/视频世界模型不同,LeCun走的是一条更偏向“内在认知”的路线——
他坚持采用隐式世界模型,即基于JEPA(联合嵌入预测架构),在抽象的潜在空间中预测世界如何演化,而不是去还原每一个像素。
如果用一个直观的类比来理解当下的世界模型版图,世界模型大致分三层,而LeCun的JEPA则处于抽象层级的最上层:
可观看、可编辑的世界界面,如李飞飞的Marble
可反复试错的模拟器,如谷歌DeepMind的Genie 3
以状态与预测为核心的认知世界模型,如LeCun的JEPA路线
站在这个坐标系里就能看清楚:资本押注的,不只是AI教母/教父的个人光环,更是对不同世界模型技术路径的提前下注。
各位董事长,你怎么投?










