在马年春晚的舞台上,一款名为“小盖”的银河通用机器人凭借一系列令人惊叹的操作成为全场焦点。它不仅能精细地盘核桃、捡玻璃碎片、从货架取物,还能完成叠衣服、串烤肠等生活化任务,动作灵巧自然,仿佛拥有与人类无异的手部协调能力。与传统机器人依赖预编程的表演不同,“小盖”的所有操作均基于端到端的自主感知、决策与执行,展现了具身智能领域的重大突破。
“小盖”的核心能力源于银河通用自主研发的“银河星脑 AstraBrain”大模型。这一全球首个集成“大脑-小脑-神经控制”的全身全手端到端模型,突破了传统机器人技术路径。它基于百亿级具身智能数据集,通过虚实融合的训练方式,让机器人在虚拟世界中积累经验,再通过少量真实世界操作微调,实现了从感知到行动的闭环。
以盘核桃为例,这一动作看似简单,实则对机器人提出极高挑战。核桃表面不规则、重量分布不均,手指受力点需实时调整,任何细微偏差都可能导致滑落。AstraBrain通过灵巧手神经动力学小脑模型破解难题:先在虚拟世界中让机器手接触各种虚拟核桃,通过试错掌握基础操作;再在真实环境中积累“物理手感”,利用真实摩擦力与机械误差数据微调动作指令。最终,“小盖”能像人类一样灵活搓动、翻转核桃,完成这一世界级灵巧操作难题。
捡玻璃碎片则考验了机器人的感知极限。透明物体在视觉上近乎“隐形”,传统算法难以识别其三维轮廓与抓取点。AstraBrain通过在仿真环境中生成海量透明物体数据——涵盖不同厚度、碎裂形状与光照条件——让机器人“见过”各种可能形态。结合多模态感知融合技术,“小盖”能从微弱反光边缘与阴影变化中“看见”玻璃,并通过力觉感知控制抓取力度,既避免捏碎又防止滑落。这一能力为家庭清洁、工业回收等场景的透明物体处理提供了新可能。
货架取货场景中,“小盖”需从紧密排列的商品中取下一瓶矿泉水,稍有不慎便会碰倒邻品。AstraBrain通过强化学习框架,让机器人在虚拟世界中经历亿万次“取货试错”:碰到旁边商品扣分,成功取下加分。经过自我博弈,它“悟”出最优路径——先以手指扣住瓶盖处,微微倾斜避让邻品,再调整角度稳稳抽出。这一过程完全自主决策,每一次扣动、倾斜与抓取均在毫秒级时间内根据环境实时调整。
叠衣服被视为机器人操作领域的终极挑战之一。衣服作为柔性物体,每次拿起的状态均不同,需实时判断褶皱、预测折叠形态并规划动作序列。AstraBrain在仿真环境中生成数万种柔性物体变形数据,让机器人“见过”各种褶皱形态,并学会从当前状态推演最优路径。当“小盖”轻轻抚平衣角、精准对折时,它并非执行程序,而是调用海量仿真经验进行实时决策,展现了“举一反三”的泛化能力。
串烤肠则是对双手协作与工具使用的双重考验。“小盖”需一手操控烤钳烤制,另一手抓取签子,双手协同完成串肠并递给明星。AstraBrain的端到端架构让“大脑”同时处理双手独立指令流,并在执行中实时调整。更关键的是,通过对海量仿真数据的学习,“小盖”理解了工具的本质——烤钳是手的延伸,是完成任务的媒介。这种泛化能力让它能像人类一样快速上手新工具。
“小盖”的“类人”动作源于AstraBrain对人类数据的大规模仿真生成机制。相比采集机器人生硬动作,人类日常动作数据更丰富且易获取。通过结合仿真生成,AstraBrain将人类动作先验利用到极致,成为突破机器人大模型技术的关键方向。这一机制让“小盖”的举手投足更贴近真人,透着亲切感。
AstraBrain的技术框架可拆解为四步:首先通过少量人类示范理解任务核心意图;其次在仿真环境中生成海量场景数据,让机器人遍历各种可能性;再通过强化学习闭环进行亿万次试错迭代,优化操作精度;最后在真实世界中用少量数据微调,打通虚实隔阂。这一逻辑不仅适用于货架取物,同样能支撑盘核桃、叠衣服等复杂任务,让机器人掌握快速学习新技能的通用能力。










