ITBear旗下自媒体矩阵:

具身智能未来何在?行业大佬激辩:机器人“能干活”方显真功夫

   时间:2025-06-10 19:51:12 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道

在科技日新月异的当下,机器人领域的发展令人瞩目。舞台上翩翩起舞的机器人、格斗赛场上灵活翻转的机器人身影,已不再是新鲜事。然而,在这股“技术炫风”背后,一个核心问题亟待解答:具身智能如何才能真正融入我们的生产和生活?目前面临哪些技术障碍?哪些技能才是最具实际应用价值的?

近期,在为期两天的2025北京智源大会上,多位行业领袖就此展开了深入探讨。智源研究院理事长黄铁军、北京人形机器人创新中心总经理熊友军、宇树科技CEO王兴兴、Physical Intelligence联合创始人兼CEO Karol Hausman、北京大学助理教授及银河通用创始人兼CTO王鹤、穹彻智能联合创始人卢策吾等,共同聚焦具身智能的现实挑战与未来趋势。

宇树科技CEO王兴兴和Physical Intelligence的Karol Hausman认为,尽管机器人比赛更多被视为技术展示窗口,有助于提升公众认知和产业关注度,但其本质仍是迈向实用化的重要步骤。王兴兴指出,人形机器人在实用性上虽未全面突破,但通过表演、比赛等形式展示全身动作能力,有助于市场教育和科普,同时具备一定的商业价值。他强调,这些“炫技”表演是通往真正实用化阶段的中间桥梁。

王兴兴进一步解释,他们希望通过参与这些活动,展示技术成果,并进行商业化拓展。他坚信,当AI技术,尤其是具身智能技术发展到一定阶段时,家用机器人不仅能跳舞、参加格斗赛,更能胜任家务、工厂作业等多种任务。他坦言,目前让人形机器人立即进入家庭和工厂还不太现实,但这些活动为技术落地提供了宝贵的实践机会。

北京大学助理教授王鹤及穹彻智能联合创始人卢策吾则提出,未来机器人比赛应从观赏性向实用性转变,聚焦实际应用场景,通过“生产力比赛”推动核心技能的形成与优化。他们认为,“移动抓取与放置”是最具突破潜力的通用任务,既适用于药房、仓储等多种场景,又是实现具身智能商业化的关键。

卢策吾强调,力反馈和对物理世界的深度理解,对于机器人应对真实复杂环境至关重要。他提出,在视觉语言行动模型(VLA)框架内引入物理世界知识,尤其是力反馈等多模态信息,能够提升模型对复杂任务的应对能力和系统鲁棒性。

在具身智能的发展路径上,VLA逐渐成为行业共识。Karol Hausman认为,VLA是通往通用智能的重要基石,能够从多源数据中学习并转化为具体行动。他致力于构建一个通用模型,以跨平台控制不同机器人完成多种任务。他指出,当前挑战在于提升算法效率与模型稳定性,尤其是在陌生环境中的泛化能力。

王鹤同样视VLA为核心技术路径,但更强调其实用导向。他提出,应优先突破如“移动抓取与放置”等核心技能,并在端到端模型中融入合成数据训练,以提高效率和落地性。他认为,目前具身智能在学术研究与产业应用之间存在差距,需要触觉和力反馈等数据来提升鲁棒性和成功率。

卢策吾则提出“数字基因”理念,结合高精度仿真数据与物理反馈,以模拟人类的下意识操作行为。他指出,仿真与真实世界的融合是提升系统表现的关键。同时,他也提到,人形机器人硬件的标准化和通用性对具身智能算法发展和落地有显著影响,数据瓶颈部分原因正是由于机器人硬件平台缺乏统一性。

对于未来通用机器人的形态,王兴兴表示,他不坚持一定要做人形机器人。他认为,人形机器人因人类数据可用性而具备训练优势,但长远看应根据任务需求发展多样化形态。他甚至指出,轮子底盘在实现移动方面也是“非常实用的”选择。他预测,在通用人工智能(AGI)出现后,机器人的形态将会多样化。

而北京人形机器人创新中心总经理熊友军则坚定看好人形机器人。他指出,人形机器人在市场容量、自然交互和人类环境适配性方面具有长期竞争力。尽管短期内面临成本与技术门槛,但未来潜力巨大。他的团队正致力于提升人形机器人的能力。

智源研究院理事长黄铁军从宏观视角指出,全面媲美人类的AGI(包括具身)仍需数十年。在未来5-10年,具身智能更可能专注于帮助人类完成危险或体力活。他强调,具身机器人的最终使命是超越人类,探索人类无法到达的未知领域。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version