滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

理想汽车发布MindVLA-o1：3D ViT突破，自动驾驶迈向物理AI新起点

时间：2026-03-19 13:51:35 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在NVIDIA GTC 2026大会上，理想汽车基座模型负责人詹锟正式发布了下一代自动驾驶基础模型MindVLA-o1。这款模型的核心突破在于实现了原生3D视觉编码器（3D ViT），标志着自动驾驶技术向物理世界理解迈出关键一步。理想汽车CEO李想随后通过长文详细阐释了技术逻辑，指出自动驾驶的瓶颈并非数据或算力不足，而是缺乏对三维空间的本质认知。

传统自动驾驶系统依赖BEV（鸟瞰图）或OCC（占用网络）技术，前者将三维世界压缩为二维平面导致高度信息丢失，后者虽保留空间维度却缺乏语义理解。理想汽车研发的3D ViT技术突破了这一局限，通过多视角高分辨率视觉输入，在编码阶段直接完成对空间几何结构与语义信息的统一解析。这种设计使模型能够同时感知物体的位置、形态及功能属性，例如准确识别交通标志牌的立体轮廓及其指示内容。

技术团队从人类认知发展规律中获取灵感：儿童在6岁前通过基础动作训练建立的三维空间感知能力，正是自动驾驶系统所缺失的"预训练"阶段。现有端到端系统相当于让AI直接观看十万小时行车记录仪后上路，而3D ViT则通过构建真实三维认知框架，使模型具备类似人类的场景理解能力。实验数据显示，该技术可将空间感知范围稳定扩展至500米以上，较传统方案提升3倍以上。

硬件层面的突破为技术落地提供支撑。理想自研的马赫芯片单颗算力达前代3倍，有效解决了3D视觉处理对车端算力的严苛要求。这种软硬协同设计使激光雷达的角色发生转变：从感知核心降级为辅助标定工具，其提供的高精度几何数据仅用于修正视觉模型的局部误差。系统整体性能不再受制于传感器物理参数，而是取决于模型对三维世界的表征能力。

MindVLA-o1的创新不止于自动驾驶领域。通过将空间理解、决策推理与执行控制统一在单一模型架构中，该系统展现出多模态思考能力——既能预测未来3-5秒的场景演变，又能根据推理结果生成最优驾驶策略。这种通用物理智能架构已初步验证可迁移至机器人控制场景，为理想汽车构建智能生态体系奠定基础。技术团队强调，自动驾驶只是物理AI的起点，未来该技术将推动更多实体设备获得环境交互能力。

更多>同类资讯

73天极速过会！宇树科技冲刺A股，具身智能领域将迎新里程碑

06-02

真健康医疗递港交所上市申请手术机器人领军者商业化之路待启

06-02

宇树科技冲刺科创板IPO拟募资超42亿，载人变形机甲GD01引关注

06-02

AI成爱奇艺“救命稻草”？降本与盈利困局下的破局尝试

06-02

AI热潮下金属锡成“香饽饽”：半年涨40%，全球资源或仅够开采15年

06-02

"逆矩阵科技：22岁北大才俊领航，勇闯世界模型无人区创新路"

06-02

英伟达Isaac GR00T人形机器人亮相：整合宇树H2与尖端技术，2026年底面世

06-02

英伟达携手台积电：AI与加速计算赋能，开启半导体制造新篇章

06-02

OpenAI正式进军机器人领域聚焦实用型机器人研发与个人机器人愿景

06-02

矩阵超智MATRIX-3澳门首秀，展现多元场景适配力，引领人形机器人新未来

06-01

理想汽车基座模型部门再调整增设具身智能部门加速AI转型布局

06-01

稀宇科技发布MiniMax M3模型：超长上下文多模态，编程等多领域表现亮眼

6月1日，稀宇科技正式发布新一代模型MiniMax M3。该模型具备前沿编程能力、最高1M超长上下文，并支持原生多模态（图片、视频输入及电脑桌面操作），成为国内首个同时具备这三项能力的模型，也是目前唯一的开源…

06-01

OpenAI模型破解80年数学难题跨界融合开启人类探索未知新篇章

据《华尔街日报》报道，法兰西学院教授、菲尔兹奖得主蒂莫西·高尔斯表示，这个单位距离问题的解答是AI数学领域的里程碑。 OpenAI的研究团队指出，模型给出的解决方案极其反直觉，过去大多数数学家都默认埃尔德什…

06-01

国产AI新突破！MiniMax M3模型发布具备前沿能力且开源效率大提升

MiniMax披露，在100万上下文规模下，M3单token计算量仅为上一代模型的约1/20，推理效率显著提升。MiniMax披露，在100万上下文规模下，M3单token计算量仅为上一代模型的约1/20，推…

06-01

OpenAI全栈入局机器人领域！Sora之父领衔，百万年薪招揽顶尖人才

奥特曼继续写道，得益于机器人硬件与机器学习研究的协同设计，由 Aditya Ramesh 领导的世界模拟研究项目已经在过去一年中逐步演化为OpenAI Robotics。但从机器人视角看，它更像是 Ope…

06-01

点击查看更多 +

全站最新

抖音电商强化未成年人保护：严控未成年人参与商业行为，共建清朗平台生态

欧莱雅硬刚盒马：高端美妆与新零售渠道之争，假货乱象成导火索

小米汽车2026年交付“稳”字当头：月销超3万，双线产品格局成型

AI下半场“内化”成关键，百度以全栈布局给出产业赋能新解法

“中东第一网红”阿波哥深圳坪山行：探“智造”奥秘，感无人驾驶魅力

科大讯飞推出Fika手机造型电纸书：6.13英寸墨水屏，2399元起售

热门内容

本栏最新

2026智能驾驶感决规控分会场：青年学者共探前沿，助力技术落地新篇

光智融合新篇章：华为全光园区方案引领AI时代园区网络变革

理想汽车5月交付量达33350辆，技术发布会将启全新L8月底登场

鸿华先进与联发科携手，高阶车型搭载3nm C-X1芯片开启智能座舱新篇

MG 4X上市：9.28万起开启技术平权，10万级纯电SUV市场迎新变革

MiniMax M3重磅登场：编码智能体顶尖，百万上下文原生多模态齐备

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.