ITBear旗下自媒体矩阵:

商汤绝影发布量产级交互世界模型,破解辅助驾驶数据瓶颈

   时间:2025-07-30 07:03:15 来源:南方都市报编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在2025年世界人工智能大会WAIC的盛会上,商汤绝影CEO、商汤科技联合创始人王晓刚分享了对端到端自动驾驶技术的深刻见解。他强调,尽管自动驾驶技术致力于模仿人类驾驶行为,但仍面临两大核心挑战。

王晓刚指出,首要难题在于数据收集的规模与广度。特斯拉凭借其700万辆量产车,能够回流巨量数据,这一数据体量远超当前大多数企业所能达到的水平。为了确保自动驾驶的安全性,还需涵盖各类高风险场景的数据,这无疑进一步加大了数据收集的难度。

他进一步解释,人类驾驶行为中,仅极少数数据对自动驾驶模型的训练具有实际价值,这构成了数据瓶颈。同时,即便训练出模型,研究者也难以确保其在特定场景下的表现,因为特定场景难以复现,且存在概率性问题。

为应对这些挑战,商汤绝影在WAIC 2025上推出了业界首个已量产、可交互的“绝影开悟”世界模型。这一创新产品平台旨在辅助驾驶领域,通过生成式世界模型,配合该公司发布的业内最大规模生成式驾驶数据集“WorldSim-Drive”,为辅助驾驶行业提供强大支持。

王晓刚补充说,商汤的世界模型不仅将AI的创造力转化为生产力,为辅助驾驶生成海量场景数据,打造实时交互训练场,还致力于构建具身智能的数据引擎,搭建起AI从数字世界通往真实物理世界的桥梁。在WAIC 2025的商汤绝影展台上,观众已亲身体验了这一世界模型产品平台的强大功能。

“绝影开悟”世界模型的生产效率极高,基于一张A100的GPU,其每天生成的数据量相当于10台真实车辆或100台路测车的采集能力,甚至超过500台量产车的数据量。目前,商汤绝影已有20%的数据通过世界模型生产。

为解决这一问题,王晓刚认为世界模型必须具备超大尺度的4D空间重建能力。例如,“绝影开悟”能够进行最高可达1平方公里的真实世界高精度重建,为车端模型提供更多真实空间视角。他举例说,可以在模型中生成各种碰撞场景,这些高风险场景在真实生活中采集代价高昂。同时,还可以对视频进行任意编辑,如移除、增加车辆或改变车辆类型,控制刹车、转向加速等。

王晓刚透露,商汤正在将“绝影开悟”世界模型产品平台化,通过提供API接口,客户可以灵活定制所需要素。他强调,引入世界模型可以模拟大千世界的各种变化,生成多模态数据,并通过强化学习使端到端模型实现自主进化,突破人类驾驶行为的上限。这一平台不仅适用于智能辅助驾驶的训练,还能助力具身智能领域,推动机器人的演进。

在谈到未来人机共存时代时,王晓刚表示,智能的发展涉及多个层次,从感知到行为,再到定义规则。他认为,未来机器人将在与人和环境的交互中产生新的智能,重要的是为人类定义规则、价值观和文化,确保机器人在规则允许的范围内运作,从而从上而下进行约束。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version