硅谷圣何塞的空气中弥漫着科技躁动的气息,全球三万多名AI从业者涌入这座城市,参加英伟达GTC大会。会场内外,绿色成为主色调,从证件到展台装饰,处处透露出赛博朋克的未来感。三月的加州阳光格外炽烈,人们脸上映照着对技术变革的期待与焦虑——两年前,行业还在讨论大模型与算力,如今AI Agent、具身智能和世界模型已成为核心议题。人工智能正从虚拟对话框走向物理世界,而智能汽车,意外成为这场变革的首个大规模应用场景。
在主会场对面的露天展区,吉利汽车集团的新车极氪8X引发关注。这家中国车企不仅在大会上发布全域AI2.0战略,更宣布加入英伟达“Hyperion”高阶智驾计划。CTO李传海在主题演讲中透露,吉利已构建起覆盖850万辆车的百亿公里行驶数据库,结合沃尔沃55年事故数据,为智能驾驶系统提供海量真实场景支撑。更引人注目的是其发布的“千里浩瀚G-ASD”系统,通过集成英伟达Cosmos仿真与NuRec重建技术,将智驾训练效率提升至新高度。
与吉利展台形成呼应的,是车内进行的两场深度对话。在极氪9X的驾驶座上,太极图形创始人胡渊鸣向记者展示了AI技术落地的另一种可能。这位MIT博士出身的技术极客,曾用AI将3D模型生成时间从两周压缩至两分钟,成本降至1美元。如今他转向更具野心的领域——AI原生游戏。“传统游戏是预设剧本的表演,而我们要创造会自我进化的数字生命。”胡渊鸣描述的游戏世界中,AI会根据玩家行为实时重构关卡设计,“就像顶级设计师与程序员在你游玩时同步创作续集”。
这位特斯拉FSD重度用户提供的数据令人震惊:后台显示他99%的驾驶时间处于监督模式。“我的角色已从驾驶员退化为安全员。”他指出,即便纯视觉方案仍需3D资产辅助训练,“路上的电线杆、行人、交通标志,数据丰富度直接决定系统鲁棒性”。这种认知与吉利的技术路径不谋而合——千里浩瀚G-ASD系统背后,是2500万段高价值场景片段与千亿参数云端模型的支撑。
在车辆后排,World Labs研究工程师王熠鹏从学术视角解读了空间智能的进化逻辑。这位曾参与meta 3D重建项目的科学家,见证了技术瓶颈的突破过程:“当椅子从虚拟空间移除后,地板留下空洞——我们不得不用2D扩散模型‘补漆’。”Sora视频生成模型的出现改变了游戏规则,其通过对二维投影的学习,意外获得了三维空间的理解能力。“这就像AI突然掌握了用3D代码与物理世界对话。”
王熠鹏将物理规律分为两个层次:直觉物理与推理物理。前者类似牛顿定律,可通过海量数据训练获得;后者如量子力学,需要逻辑推理能力。“未来可能需要混合模型——世界模型提供物理直觉,大语言模型构建推理链条。”这种设想在吉利的技术架构中得到印证:其WAM世界行为模型采用分层设计,上层用多模态大模型进行任务规划,下层通过动作专家与世界模型完成精细决策,并引入人类价值函数进行安全评估。
当讨论转向车内场景时,两位技术专家的描述呈现出惊人的一致性。胡渊鸣希望空调能自动感知体温变化:“何必让我反复调节?直接检测需求一步到位。”王熠鹏则构想更主动的交互:“乘客伸手瞬间,空调已调整至适宜温度,无需语音指令。”这些场景在吉利超级Eva智能体上已部分实现——通过声纹识别与微表情分析,系统能主动调节座椅角度、音乐类型甚至规划避震路线,并在预订餐厅时自动备注“靠入口无台阶座位”。
在智驾领域,吉利的解决方案展现出工程化智慧。面对百亿参数模型上车带来的推理延迟,团队通过4bit量化、算子融合等技术,将单帧处理时间压缩至27毫秒。当系统在盲区路口同时遭遇逆行电瓶车与鬼探头行人时,不再简单选择刹车或通过,而是对减速、让行、借道等策略进行毫秒级推演,最终执行兼顾安全、效率与舒适度的最优方案。这种“想”与“动”的协同,正是通过WAM模型统一调度超级Eva与千里浩瀚G-ASD实现的。
大会闭幕当晚,一位印度裔Uber司机问起参观收获。记者望着窗外穿梭的车流回答:“最有趣的共识正在形成——AI进入物理世界的第一站,不是实验室里的机器人,而是你家楼下的汽车。”当胡渊鸣谈论的“数字生命体”与王熠鹏设想的“以人为本空间”在驾驶座上交汇,智能汽车或许正在成为这个时代首个真正的AI原生硬件。










