滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

对话自变量CTO王昊：家庭场景，如何成为具身智能突破的关键战场？

时间：2026-04-04 03:03:43 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

深圳零一学院内，首届具身智能开发者大会的决赛现场气氛热烈。20支顶尖队伍齐聚于此，他们要在三天内完成从数据采集、模型训练到真机部署的全流程，这无疑是一场极具挑战的“真机演武”。自变量机器人联合创始人兼CTO王昊在访谈中表示，家庭场景是具身智能的终极目标，是“通往通用机器人”的关键战场。尽管多数同行优先布局工业场景，自变量却选择与58同城合作，在深圳试点让机器人与家政阿姨搭档，探索家庭服务领域的应用。

本次大会的赛制设计独具匠心。所有参赛队伍使用同一套硬件平台，在极短时间内完成从零开始的搭建。专业研究实验室通常需要6个月才能完成类似工作，而选手们仅用三天就要实现目标。比赛首日便出现明显分化：有的团队还在调试环境，有的已取得初步成绩。王昊观察到，频繁评测、注重数据和硬件观察的团队表现更为突出。他强调，具身智能的本质是交互学习，通过测试和人工观察发现问题，才能找到应对真实世界复杂性的解决方案。一位参赛选手回忆，最初完成“将环套在柱子上”任务的成功率仅20%至30%，经过多次迭代才提升至60%至70%。

比赛设置了A榜和B榜，A榜环境可控，便于快速验证模型能力；B榜则完全黑盒，考验模型在光照、背景、操作对象和位置变化下的泛化能力。王昊指出，举办此次比赛的初衷是降低开源项目对开发者的使用门槛，建立通用标准接口。在长期依赖仿真评测的具身智能行业，仿真环境虽能加速迭代，却难以还原真实世界的复杂性，sim2real的差距始终存在。王昊坦言，过度依赖仿真评测会掩盖模型能力的真实边界，而此次比赛将评测、训练和数据采集重新拉回真实世界。

自变量机器人从创立之初就选择了“大小脑统一的端到端大模型”路线，尝试将世界模型与VLA（视觉-语言-动作）模型融合在一个联合框架下。王昊解释了这一路线的底层逻辑：大语言模型仍是训练基础，但需将语言和动作置于同一空间，而非让视觉仅服务于语言。语言描述的信息宏观，而物理世界交互发生在厘米级和秒级尺度，两者存在巨大鸿沟。采用原生多模态方式，动作可在宏观和微观层面清晰表现，使视觉从静态观察转变为理解运动。这与当前许多简化设计的VLA模型形成对比，多数模型仍依赖单帧图像输入。

端到端模型面临训练复杂度和规模要求的挑战。王昊认为，若不具备这两个条件，端到端模型的效果可能不如垂类小模型或分层模型。端到端需要规模效应，数据量和模型参数量必须足够大。具身智能的评测比语言大模型更复杂，语言大模型可通过loss曲线评估，而具身智能的loss无法反映真实表现，因为真实世界是闭环系统。自变量的另一核心策略是坚持真实世界的真机数据采集。王昊表示，所有交互式学习和强化学习的关键数据都来自真机，数据采集将持续进行。2026年，数据采集方式将发生重大变化，越来越依赖人的穿戴式或Ego-Centric方式。

进入家庭场景面临两大难点：零样本泛化能力和长程操作的精细度。模型需通过推理探索成功路径，而非依赖预先训练；在长程任务中，现有基模虽能完成动作意图，但精细度不足，错误累积导致失败。王昊提出，解决长程精细度问题需激发模型推理能力，让语言、视觉、动作形成思维链，使机器人自主规划和反思；同时需在大规模真机情况下进行强化学习，提升空间精度。他预估，普通清洁、收纳等任务可在1至2年内实现完全自主，但所有家庭任务闭环需更长时间。这与自变量CEO王潜的观点呼应，后者曾表示今年内机器人将以正ROI方式实现商业化落地，家庭场景推进虽慢但更长远。

关于技术路线与商业化的关系，王昊认为，为商业牺牲技术难以取得高成就，真正的发展需技术推动商业。自变量的主线是让基模持续迭代，避免在垂直场景做过多模型系统。例如，发现机器人视觉有盲区时，不应通过小模型检测弥补，短期虽能加快落地，但长期会损害基模提升。他透露，自变量在数据、算力和基础设施上投入巨大，建立规模化效应后，资源聚集效应会愈发明显，投入10倍资源取得领先时，速度优势将以数量级超越对手，越早开始越有优势。

05-07

众擎机器人注册资本增至320.7万经营范围广泛股东结构多元

05-07

Snap与Perplexity4亿美元合作“和平分手” 用户增长亮眼但四月裁员千人

05-07

Mininglamp开源两大利器：Cider与Mano-P，Mac端侧AI体验全面升级

05-07

Genesis AI发布GENE-26.5模型：单模型驱动机器人，复杂任务自主完成成现实

05-07

福田汽车2026年4月销量亮眼中重卡增势强劲新能源与海外业务双突破

05-07

福田汽车2026年4月销量亮眼：中重卡增近五成新能源与海外销售双增长

05-07

Token：从哲学思辨到AI基石，再到数字经济“硬通货”的进化之路

05-07

清华团队构建Agent安全新防线：从行为到生态，全方位守护生产环境

05-07

法拉第未来战略调整：暂停400V项目，聚焦800V与EAI机器人新赛道

05-07

AI记账“吐槽”变“冒犯”：给父亲买衣遭调侃，AI边界感何在？

05-07

苹果2026年MacBook Neo产量目标升至千万台，芯片供应或成关键阻碍

05-07

三星One UI 9.5研发消息首曝，Galaxy S27或成首发搭载机型

05-07

红杉AI峰会聚焦未来：理解力、审美与人际链接，铸就人类核心优势护城河

05-07

国产芯片与DeepSeek“双向奔赴”：中国AI摆脱依赖，握紧发展主动权

05-07

点击查看更多 +

全站最新

二三十万买车似买菜？小米SU7锁单超8万，月销多少能验真实力？

五一热点聚焦：上海宅地出让金领跑全国，520多地结婚登记预约爆满

小米SU7再掀购车热潮！48天锁单8万台，雷军引领小米汽车持续领跑

雷军：从程序员到跨界造车“闯入者”，SU7年销24万背后的热血与波折

从60万跌至40多万，月销440台的沃尔沃XC90，降价后还值得入手吗？

十年热销237万台！吉利博越十周年冠军版5月9日登场，增配不加价，能否再掀购车热潮？

热门内容

本栏最新

福田汽车2026年4月销量亮眼中重卡增势强劲新能源与海外业务双突破

福田汽车2026年4月销量亮眼：中重卡增近五成新能源与海外销售双增长

米哈游全资成立新公司注册资本千万聚焦游戏与科技开发

FF战略调整：Super One升级800V架构，AIHER混增项目加速推进

安健天窗二期项目投产：5000万投资助力六安新能源汽车配套产业升级

云南电网携手华为SPN：数智赋能，打造电力通信新“高速路”

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.