ITBear旗下自媒体矩阵:

商汤徐立WAIC详解AI十年路:感知、生成后,如何跨越虚实界限?

   时间:2025-07-27 00:01:03 来源:智东西编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在2025世界人工智能大会(WAIC)的盛大开幕式上,商汤科技董事长兼首席执行官徐立发表了题为《人工智能的十年演进》的主旨演讲,深刻剖析了人工智能技术的飞速发展历程。

徐立指出,过去十年间,人工智能领域经历了三次重大飞跃。最初,深度学习技术推动了感知智能的崛起,以CNN、ResNet等算法为代表,结合ImageNet上1400万张标注图片,开启了视觉应用在多个垂直领域的先河。这一时期的标志性事件是Hinton团队在2012年首次在ImageNet竞赛中夺冠,相当于将一个人十年的标注知识传授给了AI。

紧接着,2017至2018年间,Transformer模型的横空出世引领了生成式智能的浪潮。这些模型通过学习海量高密度文本信息,显著提升了模型的泛化能力和通用性。从ChatGPT到多模态大模型、智能体乃至具身智能,大众对AI技术的认知达到了前所未有的高度。

徐立强调,在AI的不同发展阶段,数据始终是智能的源泉。在感知智能时代,AI依赖于人工标注的数据;而到了生成式智能时代,则主要依赖互联网上的自然语言数据。然而,这些数据终将有用尽的一天。因此,未来AI技术需要转向“真实世界互动数据”,通过主动与环境交互来加速进化。

为了跨越虚拟世界与现实世界之间的鸿沟,商汤科技打造了“开悟”世界模型,并在WAIC上推出了能够举一反千的“开悟”平台。该平台能够生成符合3D真实情况和物理规律的多视角视频,为自动驾驶等场景提供AI自举与自学的能力。例如,在自动驾驶的Corner Case——加塞场景中,“开悟”平台可以生成大量不同光照、天气、道路结构和车型条件下的加塞视频,从而帮助AI模型更好地学习和适应这一复杂场景。

徐立进一步解释,人工智能正沿着“感知世界—理解世界—生成世界”的路径前行。在感知世界阶段,AI主要依赖于标注数据;在理解世界阶段,则通过高密度语言数据推动智能的泛化和通用性;而到了生成世界阶段,AI将与现实硬件交互,改变我们的世界。徐立还透露,随着模型的不断发展,未来甚至可能出现通过方向盘、刹车和油门等输入来控制视频生成的情况,让用户在真实的街景场景中“驾驶”。

在演讲的最后部分,徐立展示了“开悟”平台的实际操作。通过自然语言描述场景和需求,平台能够生成多个不同视角且符合3D真实情况的视频。这些视频不仅符合物理规则,还能真正切入用户的使用场景。徐立表示,这一平台的推出将极大地推动AI技术在各个领域的应用和发展。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version