ITBear旗下自媒体矩阵:

高德发布ABot系列具身基座模型,具身智能迈向通用底座新征程

   时间:2026-02-12 19:32:47 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

过去几年,大模型技术彻底改变了自然语言处理领域的发展格局。在GPT系列模型问世前,自然语言处理领域呈现出明显的碎片化特征:不同任务需要定制专用模型,不同场景依赖独立数据集,不同企业构建专属技术栈。这种模式导致技术迁移成本高昂,应用边界清晰固化。随着GPT等通用基座模型的出现,自然语言处理领域完成了从专用系统到通用平台的范式转换,为人工智能发展开辟了新路径。

当前机器人行业正经历着类似的转型阵痛。不同厂商生产的机器人采用差异化的动作表示体系,数据格式互不兼容,训练模型难以复用。这种技术割裂状态导致每个新应用场景都需要从零开始构建系统,机器人展现的能力更像是特定场景下的预设表演,而非具备泛化能力的通用技能。这种发展模式严重制约了机器人技术向开放场景的拓展进程。

阿里巴巴旗下高德地图发布的ABot系列具身基座模型,为破解行业困局提供了创新方案。该系列包含ABot-M0操作模型和ABot-N0导航模型两大核心组件,分别针对机器人的"手部"操作和"腿部"导航能力进行系统性突破。通过构建统一的技术底座,这两个模型实现了跨形态、跨场景的能力迁移,为具身智能发展树立了新标杆。

ABot-M0模型聚焦解决机器人操作领域的核心难题。该模型通过建立标准化动作表示体系,将不同机器人的操作数据统一为末端执行器坐标系下的增量动作。这种数据统一策略打破了机械臂、移动机器人等不同形态设备间的数据壁垒,构建了包含600多万条轨迹的混合训练集。在算法层面,创新提出的动作流形学习方法,使模型能够聚焦于物理约束下的有效动作空间,显著提升了操作稳定性和任务成功率。实验数据显示,该模型在复杂场景下的任务完成率较前代方案提升近30%。

ABot-N0模型则致力于攻克机器人导航领域的关键挑战。该模型采用视觉-语言-动作统一架构,在单个模型中整合了点位导航、目标物导航、指令跟随等五大核心导航任务。通过构建包含8000个高保真3D场景的导航数据引擎,模型获得了强大的空间理解和任务拆解能力。特别在动态环境导航方面,该模型在权威基准测试中创造了40.5%的成功率提升纪录,展现出在复杂场景下的可靠性能。其创新的代理式导航系统,实现了从指令理解到动作执行的完整闭环控制。

高德在空间智能领域的深厚积累,为模型研发提供了独特优势。经过二十余年发展,高德构建了覆盖道路网络、建筑结构、语义信息的三维空间知识体系。这些经过脱敏处理的真实世界数据,为模型训练提供了其他机构难以复现的高质量数据资产。在工程化能力方面,高德将地图服务中积累的系统稳定性经验,成功迁移至具身智能领域,确保模型能够在边缘计算设备上高效运行。

ABot系列模型的发布,正在重塑机器人技术的开发范式。统一的数据格式和预训练权重,使中小团队无需重复建设百万级轨迹数据库,开发周期和成本大幅压缩。开发者可以将精力聚焦于场景适配和功能微调,显著提升研发效率。这种转变类似于自然语言处理领域从专用模型到通用基座的跨越,预示着机器人技术正在进入标准化开发的新阶段。

项目技术报告显示,ABot-M0和ABot-N0已实现跨形态机器人的部署应用。在真实场景测试中,系统展现出强大的环境适应能力和任务泛化性能。相关技术文档和开源代码的同步发布,为行业技术进步提供了重要参考。随着统一技术底座的逐步完善,机器人能力有望像语言模型API一样,成为可灵活调用的标准化服务模块。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version