在2025甲子引力年终盛典的具身智能技术专场圆桌对话中,行业专家们围绕具身智能的发展路径、技术挑战与商业化前景展开了深入探讨。伯牙智能创始人兼CEO刘欣担任主持人,与原力无限资深研究科学家陈佳玉、极佳科技联合创始人兼首席科学家朱政、千寻智能联席首席科学家解浚源、星源智联合创始人何嘉伟共同剖析了这一领域的核心议题。
关于具身智能的“ChatGPT时刻”,嘉宾们认为其特征可能体现在技术突破与场景落地的双重共振。陈佳玉提出,这一时刻需满足三个阶段:从单场景单任务稳定执行,到单场景多任务稳定执行,最终实现多场景多任务通用化。朱政强调,智能化水平是当前最大瓶颈,尽管通用性已显著提升,但与专用模型相比仍存在差距。解浚源则指出,需通过开放场景中的泛化体力劳动展示破圈效应,例如机器人自主完成叠衣服等任务。何嘉伟补充道,零样本学习能力是关键,即解决未训练任务的泛化问题。
技术路线选择方面,世界模型与VLA(视觉语言动作模型)的争议成为焦点。朱政解释,世界模型通过生成合成数据降低真机采集成本,并支持强化学习训练,最终可能演进为融合状态预测与动作决策的WA模型(World-Action Model)。陈佳玉认为,软硬解耦并非完全分离:大脑层级应聚焦泛化知识,而运控算法需针对硬件适配。何嘉伟分享了星源智的实践,其通过大小脑分层模式实现跨本体泛化——大脑负责空间感知与任务规划,小脑处理硬件相关操作,结合2D3D融合与世界模型技术突破3D空间理解瓶颈。
数据获取难题的解决路径引发讨论。解浚源预测,随着数据采集流程标准化,到2026年底头部企业将积累百万小时级真实数据,届时算力成本将超过数据成本。朱政指出,自动驾驶与具身智能在数据与模型层面存在共性,例如均需海量数据支撑,且模型架构向VLA收敛。但他强调,具身智能对物理交互的要求更高,需处理刚体、流体等复杂动态场景。
商业化场景优先级方面,嘉宾普遍看好商业服务领域。陈佳玉分析,工业场景对效率要求严苛,家庭场景存在安全与成本挑战,而商业服务场景(如酒店清洁、餐饮服务)对安全性与效率容忍度较高,更易形成闭环。何嘉伟透露,星源智已与物流企业合作开发具身装卸技术,通过部署通用大脑模型实现卡车货物装卸自动化。解浚源补充,工业场景虽技术可行,但面临场景碎片化与数据采集难题,短期难以规模化。
面对资本热潮,嘉宾们强调技术沉淀的重要性。陈佳玉建议,企业应选择细分赛道深度耕耘,避免盲目追随技术潮流。朱政透露,极佳科技坚持“先提升智能化水平,再拓展场景”的策略,拒绝过早商业化导致技术稀释。解浚源批评低水平重复的Demo展示现象,强调需聚焦Scaling Law验证,通过数据与模型规模的指数级增长推动技术突破。何嘉伟则认为,Demo展示与产品化可并行,具身大脑的进化能直接赋能下游落地。
在团队建设层面,跨学科协作成为共识。陈佳玉介绍,原力无限团队分为本体、数据与算法三部分,算法团队以学术背景为主,探索前沿技术。朱政表示,极佳科技研发人员占比80%,融合计算机视觉与机器人背景,通过统一目标打通世界模型到本体的技术链路。解浚源强调务实态度,认为优秀人才可来自各行业,早期需依靠标杆成果吸引后续资源。何嘉伟补充,星源智依托智源研究院与北京大学的技术积累,同时重视工程化能力,在嵌入式开发与算法部署方面持续投入。









