在2025中国国际信息通信展览会(PT展)的展台上,具身智能机器人正以全新姿态打破人们对传统机器人的认知。点击屏幕输入祝福语,机器人便能即兴弹奏乐曲;当非遗文化邂逅人工智能,手持双槌的机器人以刚劲舞姿演绎潮汕英歌舞的豪迈。这些场景不再是科技秀场的噱头,而是具身智能从实验室走向生产、文旅、服务领域的真实写照。
相较于展区的热闹表演,9月24日举办的“具身智能前沿”论坛上,产业界与学术界专家展开了更深刻的思考。中国信息通信研究院人工智能研究所所长魏凯指出,具身智能的本质是人工智能从虚拟世界向物理世界的延伸,“不仅要处理信息,更要搬运原子”。这种转变意味着,机器人必须在环境不确定、交互复杂的现实场景中完成学习与执行。
为突破这一瓶颈,全国今年新增11个具身智能训练场,这些封闭测试区如同自动驾驶的“模拟考场”,让机器人通过反复试错积累数据。与此同时,国内首个具身智能国际标准已在ITU立项,其意义不仅在于技术规范,更关乎产业国际话语权的争夺。标准决定数据能否复用、产品能否对接、市场能否形成规模,若缺乏统一体系,具身智能可能重蹈早期AI“碎片化、不可规模化”的覆辙。
技术突破是具身智能落地的另一大挑战。中国科学院计算技术研究所研究员阚美娜以视障人士导盲场景为例,传统设备存在提示负担重、信息单一的问题。她团队研发的可穿戴系统通过头盔视觉采集、耳机语音提示、腰带触觉反馈的多模态感知,使盲人出行速度提升40%,提示频率大幅降低。这一案例证明,具身智能不仅能完成任务,更能在交互中传递技术温度。
在更宏观的技术架构上,中国电信人工智能研究院白辰甲提出“大小脑协同”模式:大脑负责感知、规划与推理,小脑承担高速控制与运动执行。这种分工借鉴人类神经系统,既能保证复杂任务的智能决策,又能解决高频控制对延迟和能耗的严格要求。相比单一大模型驱动机器人存在的延迟高、成本大、场景依赖重等问题,大小脑协同通过“思维框架”与“技能落地”的分离,提供了更可行的路径。
国际上,特斯拉人形机器人、OpenAI机械臂均在此方向探索,但中国产业界更强调“训练场+标准+架构”的三重结合。这种模式旨在通过可控成本实现规模化复制,避免陷入资本驱动的研发陷阱。
生态共建与算力支撑是具身智能走远的两大基石。中国信通院张明钟介绍,开放社区“鲸智”已汇聚300余家企业和多模态数据集,通过开源降低开发门槛。对于硬件昂贵、数据稀缺的具身智能而言,开源不仅是技术共享,更是降低试错成本、加速场景普及的关键。这如同互联网早期的开源运动,只有更多参与者加入,生态才能真正壮大。
算力则是具身智能的“隐形地基”。以中国电信“智能云”为例,其通过“算力+平台+数据+模型+应用”的一体化能力,为机器人提供实时感知与决策的支撑。未来,边缘算力将扮演更关键角色——只有将算力下沉到机器人端,才能实现低时延控制,确保机器人在复杂环境下的实时反应。