在具身智能领域,越疆公司凭借其自研的空弈DobotWAM具身大模型引发行业关注。该模型在具身智能标准评测基准LIBERO上的表现堪称卓越,成功完成LIBERO-Spatial、LIBERO-Object、LIBERO-Goal和LIBERO-10四个标准任务套件,这些任务覆盖了空间关系理解、物体泛化、目标指令理解以及长时序任务执行等关键能力维度。最终,空弈DobotWAM具身大模型平均成功率高达99.25%,超越了π0.5、π0、GR00T-N1.5、π0+FAST等公开模型,以及行业内已有数据公布的其他模型结果,彰显出强大的技术实力。
具体来看,空弈DobotWAM具身大模型在各任务套件中的表现可圈可点。在LIBERO-Object任务中,它实现了100/100的完美成绩,全部成功完成挑战;在LIBERO-Spatial、LIBERO-Goal和LIBERO-10三个套件中,也均达到99/100的高成功率。如此出色的成绩,标志着越疆在具身智能行业已跻身头部阵营。这一成就并非偶然,而是源于越疆近三年积极推进从协作机器人到具身智能的产品战略升级,基于对机器人“身体”操作能力的深刻理解,空弈DobotWAM具身大模型形成了独特的具身优势。
当前,具身智能的发展方向正发生转变。过去,机器人的演示多集中在预设轨迹的舞蹈、翻跟头等,虽具观赏性,但与实际生产应用相差甚远。如今,越疆将研发焦点聚焦于插接、抓取、对准等高精度接触作业,致力于让具身智能真正走向可用、可靠、可落地,引领行业朝着具备真实操作能力、可落地复用的方向迈进。
机器人走向真实应用面临着诸多挑战。真正的难题不再局限于“识别物体”,而是在动态、多变的开放场景中,理解空间关系、拆解任务目标、生成符合运动结构的动作,并在多步执行过程中始终保持全局一致。近年来,视觉—语言—动作模型成为具身智能动作生成的主流范式,在数据覆盖充分、任务边界清晰的场景下展现出较高效率。然而,过度依赖二维图像模式或离线轨迹模仿,在面对空间扰动、物体变化、长流程任务和真实接触反馈时,容易出现动作漂移、目标丢失,或局部动作正确但整体任务失败的情况。这就要求机器人模型必须超越单纯的“模仿”,建立起对动作深层次结构的真正理解。
空弈DobotWAM之所以能取得高成功率,得益于其在感知、理解、控制与数据闭环上的系统性设计。该模型在视觉—语言—动作建模的基础上,进一步引入三维空间理解、机器人运动几何约束和真实数据闭环机制,使机器人不仅学会“模仿动作”,更学会“理解动作为何要这样做”。
其核心技术突破主要体现在四个方面。一是3D-Aware Spatial Representation技术,将3D空间信息引入视觉—语言—动作建模,使模型不再仅依赖2D图像纹理和像素特征,能够显式感知物体位置、空间关系与操作目标之间的几何结构,从而具备更强的泛化能力。二是Joint Dynamic Geometry Loss技术,将机器人关节动态信息与末端执行器几何约束融入训练loss,让模型从“模仿动作”升级为“理解真实动作结构”,有效减少轨迹漂移、姿态不连续和抓取失败等问题,提升长时序任务中的执行稳定性。三是Advanced VLM Task Decomposition技术,基于高级VLM backbone对复杂语言指令进行语义理解与任务拆解,将长流程操作分解为更清晰的阶段目标和可执行子步骤,避免局部动作正确但全局任务失败的情况。四是High-Quality Data Flywheel + Real-Robot Recap技术,构建高质量数据飞轮,以Recap真机实验为核心,实现闭环采集、训练、评测与反馈,持续吸收成功、失败及长尾场景的真实经验,提升从仿真benchmark到真实环境执行的迁移能力。这四项技术相互耦合,使空弈DobotWAM能够更稳定地完成多物体、多阶段、长时序的机器人操作任务,为具身智能的大规模落地提供了可复用的系统性框架。
以多场景任务分类抓取、插充电器和插笔帽三项典型任务为例,这些任务看似日常,实则对机器人提出了极高要求。它们属于高精度接触作业,要求模型不仅要识别目标物体的位置,还需理解插头与插座、笔身与笔帽之间的空间关系,并连续完成对准、接近、插入和闭合等动作,直接考验小目标定位与姿态估计、强几何约束下的末端控制以及接触过程中的稳定执行与误差修正三项关键能力。在测试中,空弈DobotWAM大模型能够基于视觉观测完成目标定位,结合机器人自身状态实时生成动作,使机械臂在真实环境中稳定完成抓取以及充电器插接流程。在插笔帽任务中,模型准确判断笔身与笔帽的相对位置及开口方向,完成轴线对齐和精细插入动作,全程保持姿态稳定。三项任务的连续稳定完成,充分验证了空弈DobotWAM在真实物理世界中从空间理解、姿态控制到接触执行的完整闭环能力。
具身智能走向真实世界,不能仅仅依赖更大的模型参数,也不能只看重单次演示中的亮眼表现。真正能够推动机器人规模化落地的,是一套同时具备空间理解、任务规划、精准执行和持续进化能力的模型系统。越疆空弈DobotWAM具身大模型正是沿着这一路径迈出了关键一步,未来,越疆将继续围绕真实机器人场景推进该模型的迭代升级。











