ITBear旗下自媒体矩阵:

全球最大开源具身大模型Pelican-VL问世,中国机器人从能跑到会思考

   时间:2025-11-14 23:10:57 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

全球具身智能领域迎来重要突破——北京人形机器人创新中心近日开源全球参数量最大的多模态大模型Pelican-VL 1.0,该模型首次打通了从环境感知到物理操作的完整智能链路,在空间理解、物理推理等核心维度实现系统性提升,为机器人产业注入全新动能。

这款覆盖7B至72B参数规模的模型,通过视觉、视频与语言指令的深度融合,构建起"感知-认知-行动"的闭环系统。相较于传统模型仅能处理单一模态数据的局限,Pelican-VL可同时解析三维空间信息、物体物理属性及动态因果关系,在12项国际权威评测中超越多数百亿级开源模型。其独创的"刻意练习"训练机制,使模型能通过自我诊断持续优化决策路径,形成类似人类的学习进化能力。

在精密操作领域,该模型展现出颠覆性突破。基于主动预测、触觉适应与记忆更新的三阶段控制框架,机器人可完成从鸡蛋抓取到复杂装配的柔性操作。测试数据显示,搭载Pelican-VL的机械臂在接触物体前即能预判材质特性,接触瞬间通过毫秒级触觉反馈调整抓力,任务完成后自动更新操作经验库。这种类人化的感知运动能力,使机器人抓取成功率较传统方法提升40%,且能自适应处理未知物体。

多模态指令理解方面,模型构建了视觉-语言-行动的转换桥梁。在模拟家居场景测试中,面对"整理房间"的复合指令,系统自动拆解为23个子任务,动态规划行动序列并实时调整策略。当遇到障碍物时,模型能重新规划路径而不中断任务流程,这种长程规划能力使其在商超理货、医疗护理等场景具有显著优势。

针对多机器人协作难题,研究团队开发了分层任务调度系统。在灯泡质检流水线案例中,Pelican-VL将任务分解为电控检测、结构分析等模块,分别调度轮式机器人与双臂机器人协同作业。通过函数调用接口,模型可精准控制不同机器人的关节轨迹与操作力度,实现跨本体协作效率最大化。这种架构已应用于汽车制造产线,使多机协作效率提升65%。

开源策略显著降低技术门槛。创新中心同步开放模型权重与推理框架代码,提供从训练到部署的全链条工具包。制造业企业可基于预训练模型快速开发特定场景应用,开发周期从传统方式的6-8个月缩短至2-3周。某家电企业利用该平台,两周内即完成冰箱装配机器人的智能升级,故障率下降30%。

技术突破背后是持续的数据积累。创新中心正在推进"千台机器人真实场景数据采集计划",已部署的500余台机器人在12类工业场景中持续收集多模态数据。这些数据将用于训练下一代模型,预计可使机器人对复杂指令的理解准确率提升至98%,操作泛化能力覆盖90%以上工业场景。

作为全球首个斩获人形机器人马拉松冠军的团队,北京人形机器人创新中心已构建起完整的研发体系。其推出的"具身天工"硬件平台与"慧思开物"软件平台,与Pelican-VL形成技术闭环。这种软硬协同的创新模式,正在推动具身智能从实验室走向产业化应用,预计未来三年将催生超百款新型智能机器人产品。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version