2026年的具身智能赛道,热得发烫。
仅一季度,国内披露融资就超过50起、累计约200亿;百亿独角兽批量涌现;春晚上四家机器人公司集体登台,翻跟头、耍双节棍、后空翻,观众看得很尽兴。
但冷静下来问一句:这些机器人,有多少台真的进了家?
截至今天,几百个亿投进去,人形机器人还没有规模化进到家里。一家都没有。
最狠的吐槽,来自图灵奖得主、纽约大学教授、meta前首席AI科学家Yann LeCun。
他直言:目前几乎没有人形机器人的公司,知道如何让机器人真正「聪明到实用」。
然而在四足领域,有家公司已经卖了2.5万台,其中家庭用户占比90%,覆盖295座城市,累计使用时长超9.5亿分钟,交互次数超6548万次。
就在前不久,他们发布了新一代消费级四足机器人BabyAlpha A3,主打的真聪明、真有用——1000倍算力跃迁,人类级感知,让机器人终于有了具身之后的智能。
当人形机器人还在实验室和发布会上轮番亮相的时候,四足机器人已经在两万五千个家庭里住下了。
这组数据和这款产品,让我们不禁重新思考一个被行业忽略的问题:不进家庭,机器人能真正变聪明吗?要进家庭,非得从人形开始吗?
家庭为王消费级才是机器人决胜场
前两年,主流的人形机器人叙事是「进厂打工」。
这个故事不新鲜,也不性感,最重要的是不赚钱。
投资人也听腻了。
因此,人形机器人也开始扎堆喊出「进家庭」的口号了。最近,仅国内就有3家人形机器人公司把机器人往家庭里塞。
自变量把机器人定义为「家庭成员」,极佳推出家庭通用人形机器人,破壳从成立之初就押注家庭数据场,要机器人给人类做一道松鼠桂鱼。
机器人行业的主流叙事,变了。
为什么机器人必须进入家庭?To C是具身智能拿到真实世界门票的路线,而家庭场景是消费级机器人最重要的市场(可能没有)之一。
首先,家庭场景是唯一能持续「喂」出Physical AI的真实数据源。
图灵奖得主Richard Sutton反复强调:真正的智能来自与真实世界的持续交互,而不是对静态数据的模仿。
To B的工厂里,机器人路线相对固定,任务相对固定,物体相对固定。
家庭不是。家庭里有拖鞋、线缆、玻璃门、突然窜出来的猫、边跑边笑的孩子、半夜起身的老人,还有人类自己都说不清楚的临时需求。
机器人如果只会在实验室里搬箱子,那不叫理解世界。
它必须在客厅、卧室、厨房、玄关这些乱糟糟的地方活下来,才算真正摸到Physical AI的门槛。
其次,消费级市场才是机器人的决胜场。
观察过去四十年的科技产业史,会发现一个反复出现的规律:最先进的技术,往往诞生于实验室或巨头企业的内部。
但真正改变产业格局、甚至决定谁能坐稳王座的是消费市场的规模化引爆。
以iPhone为例。2007年之前,企业级移动市场是黑莓和Palm的天下,产品做得再扎实,也撑不起一个真正的移动互联网生态。
iPhone用全触控的消费级体验,把用户群体从几百万商务人士扩大到几亿普通人。App Store转起了开发者与用户的双向飞轮,一旦生态壁垒成形,后来者再难追上——说到底,是消费端的规模效应,把整个行业的主导权牢牢锁死了。
同样的剧本在更早的时候就上演过。1980年代,大型机和小型机统治着计算世界,太贵、太复杂,普通人用不了。
破局的是Apple II——一台切进家庭和中小企业的消费级产品,配上VisiCalc这款杀手级应用,电脑第一次从极客圈走进了千家万户,为后来整个企业IT革命打下了用户和市场的地基。
再看新能源车。最早一批电动车企扎堆网约车、物流车等To B场景,靠补贴续命,规模始终起不来。
真正破局的是特斯拉和比亚迪——主攻个人消费市场,用家用车型放量,规模化生产摊薄了成本。没有消费端的规模,电动车至今可能还是一个实验性品类。
三次先例,背后同一条铁律:消费级市场一旦形成规模,会产生三重正向飞轮——规模驱动技术迭代、规模驱动成本下降、规模驱动生态锁定。飞轮一旦转动,后发者几乎不可能追平。
这正是Christensen「颠覆式创新」的经典剧本:真正掀翻牌桌的,往往是被巨头瞧不上、从低端市场悄悄长起来的小角色。
具身智能没有理由例外。
甚至,它比PC、手机、电动车更依赖消费级市场。因为机器人需要的不是静态数据,而是经验。
它要踩到拖鞋,才知道拖鞋会挡路;它要听见电视声里的呼唤,才知道噪音中如何识别指令;它要一次次绕开孩子和宠物,才知道安全边界到底在哪里。
所以,To C不只是商业选择,更是技术必需:不进家庭,就没有真实数据;没有真实数据,就没有通用智能。
现阶段,为什么人形机器人进不了家门?机器人该以什么形态进家庭?行业默认的终点是人形机器人。
但拿数据和事实去检验,会发现现阶段人形进家庭,面临的不是一个障碍,而是一面墙。
核心障碍是价值价格比倒挂。而且有一个真相,行业很少讨论:目前所有关于人形机器人的成本估算,可能全都错了。
为什么?因为市面上能看到的人形机器人,大都是「表演型机器人」:动作预编排,靠后台遥控,不需要真正自主决策的大脑,也不需要全套感知和灵巧手。
但用户买回家后,对它的期待是「人」的标准:听得懂、看得见、能自主决策、能灵巧操作、能长时间工作。
要满足这些,需要配齐大脑、小脑、全方位感知、灵巧双手、高自由度躯干和大容量电池——目前全球没有一台人形机器人真正配齐这些能力,一旦配齐,成本将远超现有估算。
即便按马斯克的说法,Optimus量产后目标价2到3万美元(至今不对个人开售,公开零售要等2027年往后),以人形在家庭中极为有限的实际能力,价值价格比仍然严重倒挂。
五年内,人形机器人都很难达到让大众消费者接受的价值价格比。
除此之外,人形进家庭还有三道硬关。
一是底层技术。从「大脑」到感知、双足平衡、灵巧手、全身协调,全是至今没解开的世界级难题,说「只差临门一脚」是严重低估工程难度。
二是量产鸿沟。从demo到面向消费者的规模化量产,中间隔着供应链、良率、品控、售后一整套工程能力,目前无一家跑通。
三是安全与责任悖论。6月1日,新疆一景区内,人形机器人在表演中误踢了一名围观的小孩,孩子痛苦的画面冲上热搜。这并非孤例——今年3月陕西也发生过类似事件,人形机器人舞蹈时掌掴了一名近距离观看的男孩。
根本原因在于,人形机器人关节众多、自由度高、力矩大,一旦运动轨迹偏差或环境感知失灵,对周围人的伤害几乎无法避免。而在法律层面,机器人伤人的责任归属——制造商、运营方还是使用者?目前仍然是一片空白。
这四道障碍叠在一起,结论很清晰:人形不是做不出来,是现阶段做出来也很难在消费市场卖得动。
这时候,四足机器人的价值就出来了。
四足不是低配,而是启动器
很多人把四足看成人形的低配版,好像人形没成熟之前,先做一只「机器狗」凑合一下。
这个理解太浅了。 更准确的说法是:四足不是人形的替代品,而是人形时代的启动器。
电脑开机时,真正运行的是操作系统,但最先启动的不是操作系统,而是Boot-Loader。
它的任务不是完成所有复杂工作,而是把系统加载起来。四足之于人形,很可能就是这个角色。
它解决的不是「四足不够高级,所以以后要升级成人形」;它解决的是「人形现在还启动不了」。
人形卡在价格、数据、安全三件事上。
四足恰好可以先跑通这三件事。
第一,四足先解决价格和价值问题。它不需要一上来承担所有家务,也不需要背负「像人一样干活」的过高期待。
它可以用更低复杂度、更稳定形态和更可控成本进入家庭,先证明一件事:具身智能产品能不能让普通家庭愿意买、愿意用、愿意留下。
第二,四足先启动数据飞轮。它进入家庭后,得到的是实验室买不到的数据:拖鞋、线缆、玻璃门、宠物、孩子、噪声、暗光、逆光、误唤醒、情绪化指令。
每一次避障、每一次互动、每一次用户吐槽,都是未来Physical AI的训练燃料。
第三,四足反哺人形。感知、交互、安全、端侧智能、运动控制、家庭场景理解,这些能力并不只属于四足。
它们是通用技术栈。四足先在家庭里把这些能力磨出来,未来迁移到人形平台,才不是空中楼阁。
所以,四足和人形不是「低配vs旗舰」。它们更像能力积累的先后序列。
先做四足,不是妥协,是策略。
蔚蓝真正拿到的,不只是销量
当前四足赛道大致分两派:
以宇树科技、云深处为代表的性能派,深耕多年,方向偏To B/G;
以蔚蓝科技、维他动力为代表的家庭陪伴派,瞄准消费级。
值得注意的是,维他动力今年5月完成近5亿元融资,但同步宣布资金将用于「新一代人形机器人研发」,战略重心已移向人形。
在消费级四足赛道,真正从成立至今始终坚定深耕的,只有蔚蓝科技一家。
市场上很容易给蔚蓝贴上「机器狗厂商」、「四足玩具」之类的标签。
但蔚蓝真正领先的地方,不是做出了两万多只机器狗,而是以四足为突破口,拿到了具身智能时代最稀缺的资源——真实家庭入口。
历史已经反复证明,改变世界的技术往往不是从最终形态开始的。Apple II 远不是最强大的电脑,第一代 iPhone 也远不是最成熟的智能手机。
但历史记住它们,不是因为形态完美,而是因为它们率先完成了消费级验证,率先进入了普通人的生活,并由此建立起规模、生态和难以撼动的用户关系。
蔚蓝走的,正是这条路。
他们的路线不是简单的产品迭代,而是一条能力积累路线:通用四足 → 通用人形 → 通用生产力技术。
四足阶段解决消费级验证和真实世界反馈,人形阶段承接已有能力、拓展更复杂的任务边界,最终沉淀为面向通用机器人的底层能力平台。
这种先发优势真正重要的地方,不在于销量本身。
消费市场有一个很有意思的特点:用户不会单纯因为你技术最先进就长期留下来,他们更会因为产品体验足够好而留下来。
而体验这种东西,很难在实验室里设计出来,只能在真实使用中一点一点打磨。
所以,当很多厂商还在思考机器人如何进入家庭时,蔚蓝已经开始面对另一个问题:机器人进入家庭之后,究竟应该怎样生活在家庭里?
这是两个完全不同阶段的问题,而且没有标准答案,只能靠长期真实使用后的不断修正来回答。
过去七年,蔚蓝完成了七代产品迭代。
虽然他们在消费电子展上不如有些厂商抢眼,在融资规模上不如人形公司耀眼,但它建了自己的工厂,铺了自己的渠道,搭起了一条从研发到量产再到销售服务的全业务链——早在 2023 年就实现了规模化量产。
而这种积累最大的特点在于,它会随着时间不断放大。
产品越成熟,用户越愿意使用;用户越多,反馈越丰富;反馈越丰富,产品又会变得更成熟。
PC、智能手机、新能源车的发展中,都出现过这样的正循环。
此前用户对 BabyAlpha 初代机最集中的吐槽是三点——不够聪明、噪音偏大、自主能力有限。
蔚蓝据此推出 A3:算力提升 1000 倍、视觉感知提升 33 倍、空间感知提升 558 倍、听觉感知提升 72 倍、运动噪音降低 70%。
这些数字意味着 A3 能在端侧运行 70 亿参数大模型,真正做到「听得懂话、看得清人」,在真实家庭地形中自主移动避障——从「能动」跨越到「能想」,从工具变成真正的智能伙伴。
从这个角度看,A3 不是一个突然出现的产品节点,而是七年积累自然长出来的结果。
安全维度尤其值得展开说。
当一台机器人要和你的孩子在同一个房间里生活,你最关心的不是它跑多快、看多远,而是它会不会伤到家人。
对比前面提到的人形机器人在景区误伤儿童,A3 在安全上做了一个根本性的不同选择:不靠算法兜底,靠结构设计从源头消除风险——关节全隐藏在壳体内,没有外露的夹点和锐角;独立制动系统可在毫秒内锁定关节,即使系统故障也不会失控摆动。
同时,端侧部署「360 安全大脑」实时拦截异常行为,5nm 专用芯片保障算力本地运行和数据加密。从物理安全到数据隐私,A3 构建的是一套让家庭「敢用」的信任体系。
在消费级具身智能领域,安全不是加分项,是入场券。
从行业角度看,蔚蓝的实践验证了一个判断:四足不是通向人形的弯路,而是通向消费级具身智能的捷径。
当这个规模从 2.5 万台扩展到 10 万台的时候,数据飞轮将真正高速运转,行业格局可能就此改写。
写在最后
今天的具身智能,不只是商业竞赛,也是一场产业窗口期的竞赛。
在全球产业格局加速分化的当下,高端芯片供应日趋收紧。
具身智能的供应链自主化和产品规模化,正在变成同一件事的两面——而留给中国抢跑的时间窗口,正在一天天变短。
好在中国手里有一副好牌:全球最强的制造业基础、最低的供应链成本、最大的消费市场、最活跃的 AI 应用生态。
但手握好牌和打赢牌局之间,差的就是一个字:快。
谁能率先以无可替代的用户价值价格比,让具身智能产品进入千家万户,真正撬动消费市场,谁就能构筑起难以撼动的先发优势。
而规模一旦锁定,数据飞轮、成本优势、生态壁垒将同步转起,后来者几乎不可能追平。











