阿里云在机器人与具身智能领域迈出关键一步。据通义千问大语言模型负责人林俊旸在社交平台X披露,其团队已组建专注于机器人技术及具身智能研究的小型实验组。该团队聚焦多模态基础模型向智能体(agents)的进化方向,试图通过强化学习机制让智能体具备工具调用能力与长程推理能力,最终实现从虚拟交互到物理世界落地的技术突破。
在科技巨头竞逐机器人赛道的背景下,阿里云的布局呈现加速态势。上月,该公司以领投方身份参与中国机器人企业自变量机器人(X Square Robot)1.4亿美元融资,这是其首次在具身智能领域进行资本运作。值得关注的是,该笔投资发生在阿里巴巴明确加大AI基础设施投入的节点——今年2月,阿里宣布未来三年将投入3800亿元用于云服务与AI硬件建设,而在两周前的2025云栖大会上,CEO吴泳铭进一步透露将追加投资规模,并预测全球AI领域五年内投资总额将达4万亿美元。
作为通义千问核心技术开发者之一,林俊旸在多模态处理领域具有深厚积累。其主导研发的模型已实现语音、图像、文本的跨模态交互,这项技术积累为当前机器人团队探索物理世界智能体奠定了基础。据内部人士透露,新组建的团队正尝试将大语言模型的语义理解能力与机器人运动控制相结合,目标开发出能自主感知环境并完成复杂任务的实体智能体。