ITBear旗下自媒体矩阵:

复旦系团队五年磨一剑!STI-WM模型首创时空一体架构 引领物理世界AGI新突破

   时间:2026-06-04 02:55:02 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

在通用人工智能(AGI)的赛道上,竞争的焦点正从虚拟世界加速向物理世界延伸。具身智能与机器人大脑技术,已成为当前行业最受瞩目的核心领域。然而,现有主流方案普遍面临空间感知精度不足、物理逻辑约束缺失、长时序规划能力薄弱等瓶颈,难以满足机器人自主感知、推理、决策与稳定交互的实际需求。

近日,一家深耕世界动作模型底层技术的复旦系科创企业眸深智能,正式推出STI-WM时空一体世界动作模型(Spatiotemporally Integrated World Model),为机器人打造原生具身大脑。该模型以时空一体化建模、物理一致性约束和端到端原生融合为核心,突破传统技术框架,为物理世界AGI落地开辟了新路径。其核心团队由复旦大学深度学习实验室的科研力量、英特尔与英伟达的工程专家以及年轻创业者组成,形成"学术-工程-商业"三位一体的顶级架构。

团队自2021年起便前瞻性布局世界模型、三维感知和时序动作生成三大底层技术,经过五年迭代,已完成七代动作模型技术更新。其原创成果包括全球首个人形动作生成大模型MotionGPT、三维世界模型HL3DWM,并斩获ICCV2023三维目标识别冠军、CVPR2024三维密集语义推理冠军等国际顶级学术荣誉。技术负责人更入选2025年中国具身智能新秀EAI榜单20强,相关成果被英伟达DAIR实验室等国际顶尖机构引用。

与传统方案依赖通用世界模型与VLA拼接的改良模式不同,STI-WM模型从AGI本质出发,确立了世界动作模型原生融合路线。该模型将空间结构、时间演化、物理一致性和执行鲁棒性四维统一,构建出"理解世界-推演未来-规划动作-执行纠错"的完整闭环。通过兼容多模态感知输入,模型可将复杂环境编码为紧凑的时空潜在状态,支撑百秒级长时程任务规划与精准动作生成,同时依托实时观测动态纠偏,确保真机执行的稳定性。

技术突破背后是六大核心壁垒的支撑:时空一体化原生建模消除多模块拼接的信息损耗;原生三维感知能力规避2D视觉的深度缺失;内置物理一致性引擎通过碰撞检测和动力学约束杜绝不合理动作;长时程高阶规划突破传统短片段动作局限;端侧轻量化部署技术降低产业化算力门槛;小样本强泛化能力通过虚拟预训练与真机微调结合,高效适配陌生场景。这些特性使STI-WM模型在动作精度、推理速度和任务泛化性上持续领跑行业。

资本与商业的双重认可印证了技术价值。眸深智能在半年内完成五轮融资,其中3亿元Pre-A轮融资获5倍超额认购,国家级投资平台、头部产业资本和券商机构纷纷入局。商业化落地方面,公司已与宇树科技、禾川科技、颐家养老等十余家上市公司达成战略合作,覆盖工业制造、居家康养、商业服务等多场景。未来三年,其技术产业化订单预计突破10亿元,速度远超行业平均水平。

当前,AGI竞争已进入物理智能新时代。以世界动作模型为核心的原生具身大脑,正成为通用机器人的核心底座。STI-WM模型的推出,不仅为机器人技术提供了全新解决方案,更推动中国原生物理AI技术迈向全球领先梯队。随着模型体系的持续迭代,其全品类硬件赋能能力将进一步加速通用具身智能的规模化落地。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version