在云栖大会上,阿里宣布了一项重要决定:将英伟达完整的Physical AI(物理AI)软件栈纳入其AI平台的开发者选项。这一技术合作并非单纯的工具整合,而是人工智能发展历程中的关键转折。英伟达CEO黄仁勋在2025年CES大会上明确指出,物理AI将成为AI技术的下一个前沿领域,蕴含着巨大的商业价值和技术潜力。
全球工业机器人市场正经历深刻变革。据市场研究机构预测,该市场规模将从2024年的1544亿元跃升至2025年的3000亿美元。其中,融合AI技术的工业机器人应用市场年复合增长率达21.9%,展现出强劲的增长势头。这一趋势背后,是传统自动化设备向智能物理AI系统的升级需求。
当前工业机器人仍以执行预设程序为主,面对零件位置偏移或形状变化等场景时,需要人工重新编程。而物理AI机器人则具备自主适应能力,可通过实时感知和决策完成复杂任务。这种技术突破正是阿里与英伟达合作的战略支点。物理AI的核心在于让AI突破数字世界,真正理解并操作物理环境。
以日常物品识别为例,传统AI能识别杯子并告知名称,物理AI则能进一步判断材质、重量,计算抓取力度,并避免打翻液体。这种能力差异决定了应用场景的根本转变。黄仁勋强调,物理AI通过整合物理规律与AI技术,使生成内容更符合现实世界的逻辑。该概念是英伟达多年技术积累的成果,2024年3月的GTC大会上首次系统阐述,并推出相关技术平台。
AI技术发展呈现清晰的三阶段特征:感知AI实现图像、文字和声音的理解;生成式AI创造文本、图像和声音;如今正进入物理AI时代,AI开始具备推理、计划和行动能力。物理AI的技术基础由三大组件构成:世界模型构建三维空间认知,物理仿真引擎处理复杂交互,具身智能控制器实现虚拟推理与物理执行的衔接。
世界模型作为认知核心,采用神经辐射场、3D高斯溅射等技术实现空间表征,需学习重力、摩擦等物理参数。物理仿真引擎基于偏微分方程求解器,处理刚体动力学、流体力学等复杂现象,在毫秒级时间内完成精确计算。具身智能控制器通过模型预测控制或深度强化学习算法,生成具体控制指令,考虑执行器的物理限制。
系统架构采用分层设计:感知层集成多模态传感器,通过卡尔曼滤波等技术实现数据融合;认知层运行世界模型和仿真引擎,依赖GPU集群进行并行计算;执行层负责运动规划,采用逆运动学求解和轨迹优化技术。英伟达为此构建了完整技术生态,包括Omniverse仿真平台、Isaac开发套件和Cosmos世界模型,通过合成数据生成解决现实数据收集成本高的问题。
仿真训练与现实应用的差距是技术挑战之一。英伟达通过仿真到现实的迁移技术,弥补虚拟数据与现实环境的差异。物理AI对计算资源的需求远超传统AI,单个系统可能需要数百个GPU核心。英伟达开发的RTX PRO服务器和DGX Cloud平台采用分布式计算架构,支持复杂环境下的实时感知与决策。
与传统AI处理数字信息不同,物理AI通过大模型驱动,使机器具备空间感知能力。以机器人抓取场景为例,传统生成式AI可能产生违反物理规律的画面,而物理AI确保生成内容完全符合现实运作方式。这种转变使AI从理论学者变为实践工程师,具备将知识转化为行动的能力。
黄仁勋对物理AI的前景充满信心,预测其将催生超50万亿美元的行业变革,覆盖千万家工厂、数十万仓库,以及数十亿台机器人和车辆。他认为,物理AI使AI从虚拟世界走向现实,将在机器人、物流、汽车等领域成为主流应用。未来两大高产量机器人产品将是自动驾驶汽车和人形机器人,两者都需要人类般的感知能力和即时反应。
英伟达在物理AI领域的布局源于多年机器人技术投入。其提出的物理AI概念强调物理规律与AI技术的结合,但系统安全性是重要挑战。为此,英伟达推出Halos安全系统,覆盖硬件架构、AI模型、软件工具和安全标准,确保系统在各种环境下的稳定运行。
阿里选择整合英伟达物理AI技术栈,背后是抢占AI技术制高点的战略考量。当前AI大模型主要应用于线上场景,而物理AI试图连接现实世界。阿里云智能集团董事长吴泳铭指出,生成式AI的最大价值在于改变物理世界。阿里云CTO周靖人透露,通义千问已开源300多个模型,下载量超6亿次,但面临从二维理解向三维交互转型的挑战。
阿里的数据主要来自互联网,缺乏线下物理世界数据。通过集成英伟达技术栈,可为通义大模型增加空间理解和物理交互能力。这种整合不仅是技术叠加,更是从语言智能向空间智能的战略转型。开发者可利用阿里云基础设施和通义大模型的语言能力,结合英伟达的物理仿真和机器人控制技术,构建能在物理世界工作的AI系统。
物理AI的发展需要与现有AI技术生态深度融合。大语言模型提供语言理解和推理能力,计算机视觉技术提供环境感知能力,机器人技术提供物理执行能力。云边协同架构成为重要部署模式,复杂推理在云端进行,实时控制决策在边缘设备执行,既利用云端计算能力,又满足实时性要求。
尽管物理AI发展面临技术挑战,如复杂环境中的稳定性、计算成本降低和仿真与现实的差距等问题,但其逐步改变工作和生活方式的趋势已不可逆。这项技术不仅带来技术革新,更将颠覆和重塑传统行业,成为推动全球经济增长和社会进步的重要力量。