具身智能领域近期迎来一笔重磅融资——灵初智能宣布完成天使轮及Pre-A轮共计20亿元融资,投资方阵容涵盖“国家队”资本与产业龙头。其中天使轮由国开金融、国中创投、央视融媒体产业投资基金等机构参与,并获得千亿上市公司战投及长飞光纤旗下基金支持;Pre-A轮则由上海国资徐汇资本领投,地方国资及市场化基金跟投,老股东超额追投。值得注意的是,徐汇资本近期还参与了阶跃星辰B+轮超50亿元融资,并通过母基金布局机器人赛道,出资45亿元参与上海人工智能母基金。
在技术定位上,灵初智能选择“小全栈”路线,区别于传统全栈企业,其将研发重心聚焦于端到端VLA模型为核心的软件体系与数据采集工具链。本轮融资将主要用于物流场景的规模化应用及数据采集解决方案的构建。公司创始人王启斌指出,当前具身智能发展的核心瓶颈在于真实物理交互数据的获取,而数据采集正成为行业竞争的新焦点。
数据采集领域已形成四大技术路径:遥操作、仿真、UMI(通用人类交互接口)和视频学习。其中UMI模式因无需依赖机器人硬件、通过手持设备即可低成本采集数据而备受关注。海外公司Generalist凭借27万小时UMI数据验证了Scaling Law在机器人领域的适用性。灵初智能在此基础上创新开发多模态数据手套,相比传统夹爪采集方式,手套采集的数据在机器人泛化能力上表现更优。
团队背景构成灵初智能的技术壁垒。创始人王启斌拥有超二十年机器人与消费电子行业经验,联合创始人陈源培作为00后学者,在北大人工智能研究院及斯坦福大学期间深耕具身智能领域。团队中既有学术中坚力量,也有具备商业化经验的成员,这种复合型配置成为投资人看重的关键因素。
公司成立初期选择灵巧手操作作为切入点,源于对数据采集逻辑的深刻理解。陈源培解释,人类双臂五指的形态决定了灵巧手是获取高质量人类操作数据的最优解。尽管2022年时灵巧操作领域鲜有关注者,但团队坚持算法优先策略,通过强化学习训练模型,摒弃模仿学习阶段,实现操作成功率与节拍的双重提升。2024年UMI模式的爆发验证了其前瞻判断,促使公司加速数据战略布局。
在数据采集模式上,灵初智能摒弃行业主流的自建工厂重资产模式,转而采用分布式采集方案。其自主研发的21自由度外骨骼手套支持众包式采集,用户佩戴手套完成日常工作即可生成数据,成本较传统遥操作降低90%以上。这种“以人为中心”的模式不仅解决数据跨环境复用问题,更能通过少量后训练适配不同机器人形态。目前北京地区已部署100套设备,计划年内突破100万小时真实数据采集量。
商业化路径选择上,灵初智能避开家庭场景的数据极端化与工厂场景的数据封闭性,聚焦半结构化的物流及零售场景。以服装仓储为例,该场景涵盖从仓库到门店再到C端的全链条,涉及近万种SKU的扫码操作,对成功率与作业节拍要求严苛。王启斌透露,团队将物流场景拆解为上百个具体环节,首站选择服装仓储作为突破口,正是看中其数据多样性与商业闭环潜力。
针对数据采集的长期价值争议,王启斌认为数据始终是具身智能发展的核心要素。他设想未来机器人形态将呈现生物多样性,不同形态的数据流动与模型迭代机制将成为关键。公司正探索Web3.0结合模式,用户通过租赁数据手套完成简单操作即可获得报酬,形成规模化数据采集网络。陈源培则从技术演进角度指出,当前行业处于数据积累阶段,未来必将涌现新的技术架构。
在模型架构选择上,灵初智能采用分层VLA设计。陈源培坦言,在现有数据量不足的情况下,模块化设计能提升数据利用效率。他以特斯拉FSD进化史为例,强调当前争论模型架构意义有限,真正重要的是持续扩大数据规模。对于灵巧手的自由度争议,他认为参数设计应服务于具体场景,在商业闭环验证前过度追求硬件指标并无实际价值。
当被问及具身智能的终极形态时,王启斌描绘了一幅人机共生的图景:未来智能载体将呈现多样化形态,从无人机到水下设备,各类生物机器人将与人类环境深度融合。这种进化过程不仅需要技术突破,更依赖数据采集模式的持续创新。正如他所言:“真正的智能革命,始于对数据本质的理解与重构。”











