滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

商汤科技发布“悟能”具身智能平台，十年积淀引领多模态与具身智能融合

时间：2025-07-27 21:22:13 来源：量子位编辑：快讯团队 IP：北京 发表评论无障碍通道

在WAIC 2025大模型论坛上，商汤科技正式迈入具身智能领域，推出了名为“悟能”的具身智能平台。此举标志着商汤科技在AI技术的新一轮布局中，迈出了重要一步。

商汤科技发布的日日新V6.5多模态推理大模型，成为此次论坛的一大亮点。该模型通过创新的图文交错思维链，实现了跨模态推理精度的显著提升。不同于传统多模态推理模型将图像转化为文本进行推理，日日新V6.5允许图像以本体形式参与推理过程，从而在多个数据集上的多媒体推理能力超越了业界领先的Gemini 2.5 Pro。

依托轻量Vision Encoder +和纵深LLM架构，日日新V6.5在性能上相较于6.0版本提升了6.99%，而推理成本仅为前者的30%，性价比提高了五倍。这一突破不仅提升了模型的能力，也为商汤在具身智能领域的落地提供了坚实的基础。

商汤科技联合创始人、执行董事、首席科学家林达华表示，多模态是实现通用人工智能（AGI）的关键路径。只有能够同时处理文本、视觉信息以及执行物理操作的AI，才能真正理解和改造物理环境。商汤在自动驾驶等领域的多年实践，积累了丰富的感知、定位、轨迹规划和安全冗余等方面的数据与经验，这些能力为机器人等具身形态的应用提供了有力支撑。

基于日日新多模态大模型和商汤在感知、定位等方面的积累，“悟能”具身智能平台应运而生。该平台一端承接日日新多模态大模型的通用能力，另一端则利用商汤在打造和使用世界模型进行训练的经验，构建生态体系。通过“悟能”平台，商汤将能够更高效地推动具身智能技术在不同场景中的应用。

“开悟”世界模型作为“悟能”平台的重要组成部分，包含了商汤积累的10万3D资产，支持多视角视频生成，并能保持时空一致性。这一模型不仅能够理解遮挡、前后层级等空间关系，还能理解时序和运动规律，使得物体在时间推移中保持自然连贯的变化。同时，“开悟”世界模型还支持参数化编辑，使得天气、光照、道路以及车辆等元素可以一键变换，为具身智能场景中的真实世界构建提供了有力支持。

在具身智能场景中，“悟能”平台能够同时处理人、物、场，构建4D的真实世界，并且这种世界同时包含了第一和第三视角。第一视角为机器人在真实运行时获取的感知流，决定了模型推理时的输入分布；而第三视角则能完整捕捉人类或机器人全身的姿态骨骼和环境关系，为动作意图、路径规划提供清晰标签。通过将两种视角对齐训练，“悟能”平台可以显著提高模型的泛化能力，加速具身智能的落地。

在具身智能的落地上，商汤选择了“软硬协同”的路线。目前，商汤已与多家人形机器人、物流搬运底盘厂商、家用陪伴平台等合作伙伴达成合作，将T模型预装进不同形态的机器人中，让这些硬件天生具备多模态感知和推理能力。未来，随着硬件销量的增加，回流的视觉、语音和操作数据也将更加丰富，进一步推动模型的迭代升级，形成正向的数据飞轮效应。

在论坛上，商汤还组织了一场关于具身智能行业发展的关键问题的圆桌讨论。讨论中，多位行业专家和学者就数据稀缺、模型路线取舍等问题进行了深入探讨。北京大学助理教授王鹤介绍了通过虚拟环境进行大量训练，再用少量真实样本进行校正的解决方案。商汤的“开悟”世界模型恰好能够承接这一过程中的大部分合成任务，与合作伙伴推出的超千万数量级的机器人则提供了关键的真实数据回流。

商汤联合创始人、执行董事、CTO王晓刚认为，仅有机器人本身摄像头的第一视角并不够，还需要上帝俯瞰的第三视角来补全肢体骨骼与全局语义。澳大利亚科学院院士陶大程也指出，第一视角需要叠加深度、惯性、力觉等多传感器流，才能完整地捕捉“感知—意图—行动”闭环。为此，商汤在世界模型中同步生成并标定第一和第三视角数据，确保时空一致，再映射回端侧传感器，以缩短仿真与现实之间的落差。

通过世界模型的大规模仿真、合作硬件的真实数据回流、第一与第三视角的融合标注，以及“通用大脑 + 场景闭环”的协同演进，商汤将数据、算法与硬件生态紧密连接在一起，形成了一条自循环链。这一链条将推动商汤在具身智能领域的快速发展，从工业到家庭，千万数量级的机器人将承载这颗强大的具身大脑，共同开启AI技术的新篇章。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

车圈大佬李想转战抖音，7月29日首播预热理想i8纯电车型

07-27

贾跃亭FF新车发布视频现P图穿帮，网友调侃：这次连自己也“骗”了

07-27

智象未来梅涛：AI认知世界靠数据，人类逻辑与联想力无法复制

07-27

京东JoyInside赋能机器人，打造真人交互新体验，数十家品牌已接入

07-27

WAIC 2025盛况空前：门票秒空、黄牛出没，机器人成展会新星

07-27

18个月融资11亿！千寻智能凭啥吸引京东小米等巨头投资？

07-27

5G+智能黑灯工厂：中国领跑全球智能制造，职场新生态悄然变革！

07-27

WAIC2025智启论坛：智元引领具身智能，全球精英共绘新蓝图

07-27

刘强东出海再下一城？竞购德国零售巨头与香港超市引关注

07-27

中国机器人产业崛起，贵金属成关键支撑材料

中国已成为世上最大的机器人生产国，机器人在制造、AI与服务领域广泛应用。它们离不开一些关键的贵金属，尤其在电子连接、传感器、电力管理和电机驱动方面起到了重要作用。黄金常用于机器人高精度电子设备中的连接器、电…

07-27

2025世界人工智能大会：中国机器人产业领跑，全球新品首发秀精彩纷呈

央视网消息：2025世界人工智能大会暨人工智能全球治理高级别会议7月26日至28日在上海举行，大会展览面积首次突破7万平方米，吸引了800余家企业参展，集中展示3000余项前沿展品及100余款“全球首发”“…

07-27

星动纪元WAIC展示：双足机器人跳街舞，智能服务机器人现场讲解发资料

这种能力源于星动纪元自研端到端VLA具身大模型ERA-42的赋能，通过收集少量数据，机器人即可在同一模型下快速学习新技能，无需预编程即可适应多样化任务。在WAIC现场，星动Q5负责现场接待讲解，依托自研端到…

07-27

工业机器人新形态：优艾智合副总裁谈适配任务比外形更重要

工业对一致性与稳定性的要求远高于消费场景，不同行业对机器人能力也有极为细致的差异。关健：我们希望借助大模型实现“机器人自主生成代码”的关键技术突破，将其能力嵌入现有控制框架中，逐步提升机器人系统的自主决策…

07-27

WAIC盛况空前：人形机器人成焦点，AI大模型厂商减少参展

银河通用产品合伙人傅强表示，因为人形机器人在今年WAIC上展示的场景已经非常真实，“所见即所得”，所以落地情况成为了关注重点。时代财经注意到，在今年WAIC展出的AI模型厂商中，有不少选择与终端合作，寻求落…

07-27

2025世界人工智能大会：云深处科技展示四足机器人全流程巡检作业实力

此次参会，云深处科技将具身智能真实作业场景“搬到”展馆，现场首次展示行业级四足机器人全流程巡检作业能力，最新迭代的绝影系列机器人和多个行业应用解决方案同时亮相。相关负责人介绍，作为深耕行业应用的具身智能企业…

07-27

点击查看更多 +

全站最新

WAIC 2025盛况空前：门票秒空、黄牛出没，机器人成展会新星

18个月融资11亿！千寻智能凭啥吸引京东小米等巨头投资？

5G+智能黑灯工厂：中国领跑全球智能制造，职场新生态悄然变革！

WAIC2025智启论坛：智元引领具身智能，全球精英共绘新蓝图

刘强东出海再下一城？竞购德国零售巨头与香港超市引关注

《长安的荔枝》航拍实录发布，七城美景尽展唐代荔枝转运之路

热门内容

本栏最新

商汤科技发布“悟能”具身智能平台，十年积淀引领多模态与具身智能融合

车圈大佬李想转战抖音，7月29日首播预热理想i8纯电车型

贾跃亭FF新车发布视频现P图穿帮，网友调侃：这次连自己也“骗”了

智象未来梅涛：AI认知世界靠数据，人类逻辑与联想力无法复制

京东JoyInside赋能机器人，打造真人交互新体验，数十家品牌已接入

WAIC 2025盛况空前：门票秒空、黄牛出没，机器人成展会新星

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.