智元近日宣布,在具身智能VLA模型的端侧部署领域取得重大技术进展。通过整合算法优化与工程创新,该公司成功将π0.5 VLA模型在英伟达Jetson Thor芯片上的推理帧率从1.4Hz提升至22.1Hz,实现超过15倍的性能跃升。这一突破标志着机器人计算模式从依赖外挂桌面显卡向完全端侧推理的转型迈出关键一步。
技术团队通过全栈推理系统重构、算法逻辑深度优化、编译工具链定制及低精度量化技术,系统性解决了端侧部署的算力瓶颈。据研发人员透露,优化后的方案不仅在Jetson Thor芯片上实现了模型完整运行,更通过真机验证确保了实际场景中的稳定性。以精灵G2机器人为载体的测试显示,端到端推理延迟显著降低,作业流畅度达到行业领先水平。
该成果直接回应了具身智能规模化落地的核心挑战。传统方案中,机器人需通过外接高性能显卡完成复杂计算,导致系统成本高昂且场景适应性受限。智元的新方案将计算单元完全集成至端侧芯片,使机器人具备自主决策能力的同时,大幅降低了硬件部署成本。测试数据显示,优化后的系统在动态环境中的响应速度提升3倍以上,为工业巡检、家庭服务等场景的应用奠定技术基础。
行业分析师指出,此次突破重新定义了VLA模型的端侧性能标准。此前业内最佳端侧推理帧率约为15Hz,智元通过软硬件协同创新将这一指标推至22.1Hz,为具身智能的实时交互能力开辟了新维度。随着技术方案逐步开源,预计将加速推动机器人产业从实验室原型向商业化产品的转化进程。











