ITBear旗下自媒体矩阵:

商汤悟能平台亮相WAIC,具身智能机器人开启“开悟”新篇章

   时间:2025-07-28 19:48:58 来源:新智元编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在人工智能领域,具身智能正成为备受瞩目的焦点。WAIC大会上,商汤科技推出的全新具身智能平台“悟能”引发了广泛关注。该平台以世界模型为引擎,为机器人赋予了强大的感知、导航及多模态交互能力,为解决数据瓶颈和多场景泛化难题提供了创新方案。

“悟能”平台的亮相,标志着商汤科技在具身智能领域的又一重大突破。通过自然语言描述场景,该平台能够生成符合物理规则、多视角统一、真实度极高的多视角视频,为机器人的仿真数据输出提供了前所未有的便利。这一技术不仅适用于机器人,同样可以赋能机器狗等智能设备。

在WAIC大会上,各式机器人的火爆表现让人印象深刻,但行业面临的数据短缺和训练效率低等问题同样不容忽视。许多机器人的性能因此受到限制,自主解决问题的能力较弱。商汤科技的“悟能”平台,正是为了解决这一难题而生。

“悟能”平台的核心优势在于其四大功能:感知、导航、交互以及世界模型的构建。在感知方面,商汤凭借强大的视觉感知能力,使机器人能够准确识别和理解世界万物。无论是机器狗还是机器人,都能通过核心芯片处理感知信息,识别场景中的物件和行人。

导航功能则是“悟能”平台的另一大亮点。商汤在自动驾驶领域的积累,使得该平台能够为机器人提供全自主视觉导航能力。通过实时路径规划和避障,机器人能够在复杂环境中自主行动。这一能力同样适用于机器狗,使其能够在非车道环境中灵活行驶。

交互功能则让机器人从工具转变为合作者。在现场演示中,商汤科技董事长兼CEO徐立展示了用AI生成的《长安的荔枝》PPT,并让机器人进行讲解。机器人不仅讲解得绘声绘色,还具备全局记忆能力,能够在嘈杂环境中保持主线任务,继续讲解。

而“悟能”平台的世界模型构建能力,更是将AI带入了全新的交互时代。通过“人、物、场”构建4D真实世界,该平台能够生成具有时空一致性的多视角视频。无论是手动切黄瓜的指令,还是机器人在公园跳跃的场景,都能同时生成第一人称和第三人称视角的视频。

这一技术的突破,意味着机器人将不再局限于单一视角的感知和理解,而是能够通过多视角的融合,更全面地理解世界。这不仅提升了机器人的交互能力,还为其在智能制造、医疗护理、家庭服务等多场景中的应用提供了无限可能。

商汤科技在“悟能”平台的研发中,充分发挥了其在多模态大模型、算力基础设施以及产业生态方面的深厚积累。通过预填充和解码分离等优化技术,商汤的大装置SenseCore 2.0为平台提供了强大的算力支持。商汤还通过投资具身智能企业,构建了庞大的生态体系,加速了技术的验证和迭代。

“悟能”平台的发布,不仅是对商汤技术基因的延伸,更是其在具身智能领域布局的重要一步。随着AI技术的不断发展,具身智能将成为推动社会进步的重要力量。而商汤科技,正以领先者的姿态,引领这一变革的到来。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version