北京人形机器人创新中心近日宣布,正式开源其最新研发的具身智能多模态大模型——Pelican-VL1.0。这一举措标志着国内在具身智能领域的技术突破迈出了重要一步,也为全球开发者提供了更强大的工具支持。
Pelican-VL1.0模型包含7B和72B两种参数规模版本,是目前全球范围内规模最大的开源具身多模态大模型。根据第三方测试数据显示,该模型在多项性能指标上表现优异,不仅超越了国际领先的GPT-5同类模型15.79%,还在国内通义千问、书生万象等知名模型中脱颖而出,成为当前性能最强的开源具身多模态大模型。
该模型的核心优势在于其强大的视觉-语言感知能力,能够通过多模态交互实现复杂场景下的多步任务规划。在实际应用中,Pelican-VL1.0可显著提升具身智能系统在商业服务、工业泛工业、高危特种作业以及家庭服务等多个领域的适应性和执行效率。例如,在工业场景中,机器人可以更精准地识别设备状态并完成维护任务;在家庭服务中,则能更好地理解用户需求并提供个性化服务。
此次开源不仅提供了完整的模型架构和训练代码,还包含详细的文档说明,方便全球开发者快速上手和二次开发。北京人形机器人创新中心表示,希望通过开源共享推动具身智能技术的快速发展,加速其在各行业的应用落地,为人工智能技术赋能实体经济提供新的解决方案。











