在近期于上海举行的2025世界人工智能大会上,商汤科技隆重推出了其最新的“悟能”具身智能平台。该平台以商汤独有的具身世界模型作为核心动力源,借助商汤大装置所提供的强大算力支持,为各类机器人和智能设备带来了感知、视觉导航以及多模态交互的全新能力。
这一创新平台标志着商汤科技在具身智能领域迈出了坚实的步伐,为智能设备的未来发展开辟了新的技术路径。具身世界模型作为“悟能”平台的心脏,是一个高度复杂的动态系统,它并非简单地复制物理世界,而是通过持续学习和整合海量数据,实时构建一个能够反映物理世界变化的数字化镜像。
这些数据涵盖了物理环境的空间布局、物体的物理特性、事件的发生规律以及人类行为模式等多方面信息,使得具身世界模型能够像人类一样理解和感知世界。通过传感器等设备收集环境数据,再经过算法的深度处理,模型能够形成对世界的“认知”,并为智能设备提供决策支持。
“悟能”平台在感知层面表现出色,能够整合多种传感器数据,利用具身世界模型精准分析环境信息。无论是在家庭环境中识别家具布局、家庭成员及温湿度,还是在办公环境中区分办公设备和文件资料,都能游刃有余。这种感知能力在与环境的持续交互中不断完善,能够在常规条件下稳定输出高质量的环境信息。
在视觉导航方面,“悟能”平台通过解析空间结构,为机器人规划出最优路径,有效避开障碍物。在仓库等结构化环境中,物流机器人能够借助该平台高效完成货物转运任务;而在室内走廊等场景中,服务机器人则能够沿着预设路线行进,实现精准的点对点移动。
“悟能”平台还支持多模态交互,包括语音和视觉两种方式。用户可以通过语音传达基础指令,同时平台还能识别简单手势和表情,以更全面地理解用户意图。例如,智能音箱在接入该平台后,不仅能够响应语音指令,还能根据用户的手势调整音量,极大提升了日常交互的便捷性。
“悟能”平台在硬件适配方面展现出极高的灵活性。它能够应用于人形机器人、服务机器人及各类智能设备,为硬件厂商提供了丰富的技术集成选项。这种适配性使得平台能够在不同场景中进行测试和应用,进一步推动了具身智能技术的落地和发展。
从技术体验的角度来看,“悟能”平台支持嵌入端侧芯片,这一特性显著提升了其实际应用价值。通过减少对云端算力的依赖,设备在网络不稳定时仍能维持基本功能;同时,端侧处理加快了响应速度,降低了数据传输延迟。以智能家居设备为例,智能门锁在嵌入平台后,本地处理人脸信息的速度大幅提升,减少了数据上传云端的需求,时延显著降低,从而提升了家庭安防场景中的用户体验。
在应用场景方面,“悟能”平台同样表现出色。在家庭领域,机器人能够协助完成清洁、搬运等简单家务;在办公场景中,智能设备则能够辅助文件分类、会议室预约等工作;而在工业环境中,机器人则能够参与零部件搬运、基础质检等任务。这些应用场景的拓展进一步彰显了“悟能”平台的技术实力和应用潜力。
在大会现场,商汤科技董事长兼CEO徐立亲自展示了搭载具身世界引擎的人形机器人讲解PPT的效果。该机器人语言自然流畅,幽默风趣,能够自动翻页并回答观众提出的各类问题,还能进行阶段性小结。这一展示生动直观地展现了“悟能”平台的交互功能和技术水平。
展望未来,“悟能”平台将在感知全面性、导航适应性和交互深度等方面持续优化。商汤科技将通过收集应用数据不断迭代具身世界模型,提升平台的稳定性和适用性。在此过程中,行业合作将发挥至关重要的作用。具身智能领域的企业合作将汇聚各方优势资源,有效推动技术进步和应用拓展。
对于行业而言,“悟能”平台的推出推动了具身智能从概念走向实践,为智能设备的发展提供了更多技术路径和选择。站在用户的角度,“悟能”平台的价值则体现在使用体验上。机器人和智能设备能否解决实际问题、保持稳定可靠的表现是衡量其价值的关键所在。随着“悟能”平台的持续改进和优化,它将更加贴近用户的期待和需求。