滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

商汤悟能平台亮相WAIC，具身智能机器人迈向“觉醒”新时代

时间：2025-07-28 17:24:05 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

在人工智能领域的热门赛道上，具身智能正掀起一场前所未有的风暴。然而，这一领域的发展并非一帆风顺，数据瓶颈和多场景泛化难题如同两座大山，阻挡着前行者的脚步。近日，在世界人工智能大会（WAIC）上，一个名为“悟能”的全新具身智能平台横空出世，为行业带来了新的曙光。

“悟能”平台以世界模型为引擎，旨在赋予机器人强大的感知、导航和多模态交互能力。在WAIC的展览现场，各式各样的机器人吸引了众多目光，但行业内的专业人士深知，这些机器人虽火爆一时，却普遍面临着数据短缺和训练效率低的困境，导致自主解决问题能力较弱。

商汤科技，作为人工智能领域的佼佼者，在此次大会上推出了其精心打造的“悟能”平台。该平台能够仅凭一句自然语言描述的场景，生成符合物理规则、多视角统一、真实世界还原度极高的多视角视频，从而破解了仿真数据输出的难题。

想象一下，你仿佛置身于城市的街头，手握方向盘，脚踩油门，周围的光影变幻莫测，而这一切，都通过七个摄像头构建出的无比真实的世界呈现在你眼前。但这并非游戏场景，而是你与AI共同“开悟”的体验。

“悟能”平台的出现，标志着AI将不再仅仅是工具，而是成为了人类的合作者、探索者和创造者。这一平台之所以能为具身智能带来如此显著的赋能，得益于其四大核心功能：感知、导航、交互以及世界模型的构建。

在感知方面，商汤凭借其强大的视觉感知能力，为机器人提供了对世界万物的识别和理解。无论是机器狗还是机器人，都能通过其视觉系统，实时感知周围环境，识别场景中的物件和行人。这一能力被完美嵌入到机器人的核心芯片中，实现了端侧的高效处理。

导航功能则是“悟能”平台的另一大亮点。尽管全自主的无人驾驶车已经问世，但全自主的机器狗和机器人仍属罕见。商汤的绝影团队，在无人驾驶领域积累了丰富的经验，这些技术同样可以应用于机器狗和机器人的导航上。通过实时路径规划和避障功能，机器狗和机器人能够在复杂环境中自如穿梭。

交互功能则展现了“悟能”平台的幽默感和全局记忆能力。在现场演示中，一个机器人通过AI生成的PPT，绘声绘色地讲解了《长安的荔枝》的故事。它不仅能够自己翻页，还能在嘈杂环境中保持主线任务，继续讲解。这一功能同样适用于机器狗，展现了“悟能”平台在不同形态硬件上的广泛适用性。

而世界模型的构建，则是“悟能”平台的核心所在。通过“人、物、场”的构建，平台能够生成一个4D的真实世界。用户只需给出一张具身关节模型和简单的指令，平台就能生成连续的视频和位姿。这些视频和位姿具有时空一致性，可以从多个角度进行观察，为机器人的交互训练提供了高质量的数据。

在自动驾驶领域，“悟能”平台已经能够用一句自然语言生成一个七视角摄像头的视频。这些视频在空间和时序上都具有一致性，甚至可以进行实时编辑和替换。这些新生成的数据，为AI进入现实世界提供了闭环交互训练的解决方案。

如今，商汤将“开悟”世界模型进一步扩展到具身智能领域，并赋予了它新的名字——“悟能”。这一平台不仅解决了具身智能领域的数据瓶颈问题，还为机器人的多场景泛化提供了可能。未来，随着“悟能”平台的不断推广和应用，机器人将成为人类生活中不可或缺的“超级队友”，在智能制造、医疗护理、家庭服务等多个领域发挥巨大作用。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

商汤科技发布“悟能”平台，赋能人形机器人，开启智能交互新篇章

【环球网科技综合报道】7月27日，在“大爱无疆·模塑未来”WAIC 2025大模型论坛上，商汤科技发布具身智能平台“悟能”。据介绍，“悟能”具身智能平台以商汤具身世界模型为核心引擎，依托商汤大装置提供端侧和…

07-28

云深处科技引领四足机器人潮流，赋能多行业智能巡检与应急应用

此外，在现场产品能力展示区，云深处科技重点展示了覆盖多场景的机器狗产品矩阵及行业应用解决方案，演示了其智能感知与交互、运动控制等具身智能关键技术的最新进展。云深处科技将持续加大研发投入，推动硬核技术不断突破…

07-28

上海理工研发机器人“学霸01”成上戏首位机器人博士新生

IT之家 7 月 28 日消息，7 月 27 日，在 2025世界人工智能大会现场，由上海理工大学李清都教授团队研发的卓益得“行者二号”优化版机器人“学霸 01”，被录取为上海戏剧学院戏剧与影视（全日制）专…

07-28

广州职位大放送！京东、科大讯飞、百度、网易校招社招全面开启

07-28

GPT-5来袭，国产AI大模型频发，关注人工智能ETF投资机会

CEOAltman称GPT-5为AI能力重大跃升，或助力微软Copilot等产品实现模块升级，预计GPT-5将通过免费或低门槛API策略，加速商业化落地与市场渗透，推动AI产业步入新一轮增长期。基金资产投…

07-28

WAIC2025盛况：智能体、机器人与AI眼镜共舞，打造未来科技新图景

银河通用联创兼产品负责人傅强向搜狐科技介绍，“今年现场的一些机器人已经脱离了遥操，实现自主任务能力，这是相较于去年最大的变化。” 作为头部大厂的阿里巴巴，今年也是正式卷入了智能眼镜赛道，在WAIC首日发布了…

07-28

AI大模型新选择！Windows一键部署DeepSeek，轻松解锁本地高效体验

DeepSeek本地部署，指的是将DeepSeek大模型的程序、数据及相关依赖组件，安装并运行在用户自己的本地计算机（如Windows系统）上，而不是依赖云端服务器来调用模型功能。一键部署：这是软件核心的…

07-28

2025年AI基础架构革新：分布式缓存如何赋能多GPU集群IO优化

在数据加载环节，它会将高频访问的训练数据缓存到GPU集群附近的高性能存储中，让数据传输延迟降到最低，确保GPU能持续获得“粮草”。它能根据数据的访问频率和重要性动态调整缓存内容，既可以提前将训练数据加载到缓存…

07-28

蚂蚁数科推出金融AI新成果：Agentar-Fin-R1大模型正式发布

IT之家 7 月 28 日消息，在今日举办的世界人工智能大会论坛上，蚂蚁数科正式发布金融推理大模型 Agentar-Fin-R1，为金融 AI应用打造“可靠、可控、可优化”的智能中枢。数据层面，蚂蚁数科构…

07-28

蘑菇车联MogoMind亮相WAIC 2025：解锁AI与物理世界深度融合新篇章

07-28

宇树科技王兴兴回应网友质疑：机器人跳舞拳击非无用，乃行业趋势

07-28

启明创投周志峰详解2025年AI发展十大趋势

07-28

PLAUD NOTE AI录音笔：卡片式设计，解锁录音新体验

为全面了解PLAUD NOTE AI录音笔的实际表现，我爱音频网对其进行了详细的测试与体验，主要为外观设计、使用体验和数据实测。连接上PLAUD NOTE AI录音笔后，APP会自动同步设备上的录音，能够…

07-28

云天励飞陈宁展望：2030年AI推理芯片将普及至各类终端设备

如今，研发11年NPU之后，云天励飞再进一步，全面发力大模型推理算力，发布针对于推理算力的AI芯片以及算力卡，布局一体机、智算中心等方案，产品将广泛应用于智算中心、智慧城市和具身智能等领域。一、其采用自…

07-28

宇树科技王兴兴：人形机器人行业爆发，AI写代码成功率大幅提升至90%以上

07-28

点击查看更多 +

全站最新

云深处科技引领四足机器人潮流，赋能多行业智能巡检与应急应用

上海理工研发机器人“学霸01”成上戏首位机器人博士新生

华硕独家：详解RTX 50系列笔记本显卡功耗规格

本土冰淇淋品牌崛起，重塑市场格局，国际巨头面临挑战

八亿时空业绩承压，光刻胶树脂新业务能否成业绩反转关键？

三全食品业绩下滑，海外建厂能否成为破局关键？

热门内容

本栏最新

上海理工研发机器人“学霸01”成上戏首位机器人博士新生

广州职位大放送！京东、科大讯飞、百度、网易校招社招全面开启

WAIC2025盛况：智能体、机器人与AI眼镜共舞，打造未来科技新图景

AI大模型新选择！Windows一键部署DeepSeek，轻松解锁本地高效体验

2025年AI基础架构革新：分布式缓存如何赋能多GPU集群IO优化

蚂蚁数科推出金融AI新成果：Agentar-Fin-R1大模型正式发布

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.