ITBear旗下自媒体矩阵:

专访北大副教授卢宗青:具身智能“软硬分化”是趋势,专注大脑研发破偏见

   时间:2026-01-24 23:53:02 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

当具身智能赛道仍在追逐“软硬一体”的全栈模式时,北京大学计算机学院副教授卢宗青选择了一条逆行之路。他创办的“智在无界”专注机器人大脑模型研发,近日宣布完成数千万元天使轮融资,由拉卡拉旗下考拉基金领投,领航新界、灵心巧手跟投,老股东联想之星和星连资本持续加注。这家成立不足一年的公司,正试图用“纯软”方案打破行业固有认知。

在北京鼎好大厦的AI机构集群中,卢宗青的“软硬分化”论调显得格格不入。当前估值超390亿美元的Figure与估值56亿美元的Physical Intelligence形成鲜明对比,前者凭借软硬一体策略获得资本青睐,后者专注模型研发却估值悬殊。但2026年初美国机器人圈的14亿美元C轮融资事件,为模型公司价值重估埋下伏笔——Skild AI凭借跨本体通用大脑模型,估值三个月内飙升至140亿美元,成为行业首个千亿级纯模型企业。

“自研模型年成本超亿元,外采大脑仅需数万元。”卢宗青用经济账揭示行业悖论。他带领团队开发的Being-H0.5模型已实现跨30种机器人本体的控制能力,在英伟达Orin-NX芯片上达到实时运行标准。与PND合作的Adam-U Ultra机器人演示显示,接入模型后设备可立即获得整理桌面、扫码分拣等通用技能,通过增值服务Being-Dex进行数小时后训练,即可掌握新任务。这种“开箱即用+快速迭代”的模式,正在动摇传统全栈方案的技术壁垒。

支撑模型泛化能力的核心,是超过3万小时的预训练数据集。区别于行业普遍采用的遥操作采集模式,智在无界独创的“人类动作视频”方案通过头戴摄像头记录第一视角操作,在保持自然工作状态的同时实现低成本大规模数据获取。卢宗青透露,该数据集已覆盖4.5万小时真实操作视频,包含不同场景下的复杂任务流程,相较传统动捕数据成本降低90%以上。

技术路线争议背后,是具身智能商业化路径的深层博弈。全栈企业面临的技术栈过长问题逐渐显现,2025年涌现的“套壳Demo”现象引发投资界警惕——部分企业通过包装现有模型获取融资,却无法在真实工业场景落地。卢宗青指出:“当技术尚未收敛时,分散资源投入硬件制造会削弱模型研发深度,这解释了为何特斯拉Optimus等头部项目在2025年后开始转向人类视频数据方案。”

在灵巧手操作模型Being-H系列基础上,智在无界正在研发双足机器人移动操作模型Being-M。该模型采用多模态对齐技术,将1500万个“文本+动作”配对与第一视角视频融合,实现三维空间动作生成与机器人控制的无缝衔接。实验室测试显示,基于宇树G1采集的快递分拣数据训练的模型,首次部署即成功控制PND机器人完成相同任务,验证了跨本体迁移学习的可行性。

行业对模型泛化能力的评估标准仍在完善中,LIBERO、RoboCasa等基准测试框架持续迭代。卢宗青坦言,当前模型能力仍处于0.5阶段,但Being-H0.5的跨本体部署速度已实现质的突破。他特别强调原创性:“市面上存在套壳Physical Intelligence 0.5模型的伪研发企业,我们的模型从视觉基座到控制算法均为自主开发。”

对于备受关注的“世界模型”技术,卢宗青保持审慎态度。他认为将该技术作为数据生成器具有现实意义,但若试图直接用于机器人控制,将面临算力消耗与轨迹预测的双重挑战。“在机器人每步行动中生成可行轨迹并预测所有可能性,这种复杂度远超当前技术能力边界。”这种技术判断,折射出模型公司对实用主义路线的坚持。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version