ITBear旗下自媒体矩阵:

物理AI“ChatGPT时刻”何时到来?业内:数据采集难建模缺方向,或需5到10年

   时间:2025-09-14 00:51:36 来源:证券时报编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在人工智能领域,物理AI正成为备受瞩目的新方向。自2020年这一概念被正式提出后,其发展轨迹始终与行业期待紧密相连。去年英伟达首席执行官黄仁勋将其定义为AI技术演进的关键节点,引发全球科技界对物理AI落地场景的深度思考。在近期举办的2025外滩大会“AGI:数字与物理世界的共同进化”论坛上,多位专家围绕物理AI的突破临界点、技术瓶颈等核心议题展开讨论。

极佳视界联合创始人朱政对技术落地持乐观态度。他提出以家庭场景任务完成度作为衡量标准:当机器人能在200种常见家务中达到95%的成功率时,即意味着物理AI迎来“ChatGPT时刻”。基于当前技术迭代速度,他预测这一目标将在2-3年内实现。朱政特别指出,家务场景的数据特殊性要求系统具备更强的环境适应能力,例如处理不同材质衣物的折叠任务时,系统需识别超过300种面料特性。

智源研究院FLM团队负责人王业全则通过技术演进周期进行类比。他分析称,从GPT-1到ChatGPT历时六年完成三次重大迭代,而当前具身智能技术相当于GPT-1.6阶段。按照线性发展规律,达到ChatGPT级能力至少需要五年,若要构建完善的技术体系则可能延长至十年。这种时间预估差异源于技术成熟度的判断标准不同,王业全强调物理世界交互的复杂性远超语言模型训练。

数据获取难题成为专家共识。朱政以自动驾驶数据采集为例,说明物理AI需要处理动态环境中的实时交互数据,这与语言模型依赖的静态文本数据存在本质差异。在机器人操作演示中,单件衣物的折叠就需要处理2000个以上的动作参数,而现实场景中衣物款式每年更新率超过40%,导致数据采集成本呈指数级增长。

针对数据困境,朱政提出世界模型解决方案。该技术通过生成式算法模拟物理交互过程,可降低70%以上的真实数据采集需求。实验数据显示,合成数据训练的模型在物体抓取任务中,准确率已接近真实数据训练效果的85%。但王业全指出,现有建模方法仍存在根本性缺陷,特别是时空连续性建模和因果推理能力不足,这导致模型在复杂场景中的决策可靠性低于30%。

在技术路径探索方面,王业全提出两阶段发展策略:首先构建包含10万亿参数的基础模型,需整合来自50个以上传感器的多模态数据;其次通过强化学习将模型能力迁移到具体场景。该方案面临计算资源与算法效率的双重挑战,当前最优模型的训练成本已达每秒2.5亿次浮点运算,且需要持续优化数据组织形式。专家普遍认为,物理AI的突破将取决于跨学科技术的融合创新,这需要材料科学、机械工程与计算科学的协同发展。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version