ITBear旗下自媒体矩阵:

英伟达推出自动驾驶推理视觉语言模型,发力物理AI新赛道

   时间:2025-12-02 18:24:14 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在近期举办的NeurIPS人工智能大会上,芯片行业领军企业英伟达宣布推出一系列创新成果,涵盖新型基础设施与人工智能模型开发。这些技术突破聚焦于物理人工智能领域,旨在为具备环境感知与交互能力的机器人及自动驾驶系统奠定技术基础。作为核心发布内容,该公司首次公开了专为自动驾驶场景设计的开放式推理视觉语言模型。

新发布的Alpamayo-R1模型开创性地整合了视觉与语言处理能力,通过同时解析文本指令与图像信息,使自动驾驶系统能够实时感知周围环境并自主决策。该模型基于英伟达自主研发的Cosmos-Reason推理框架构建,具备"思考-决策"的分层处理机制。研发团队表示,这种技术架构有望为L4级自动驾驶系统注入类人驾驶常识,使其在复杂路况下做出更符合人类直觉的判断。目前该模型已在主流开源平台开放下载,供全球开发者研究使用。

为降低技术落地门槛,英伟达同步推出Cosmos Cookbook开发工具包。这套系统化指南包含数据预处理、合成数据生成、模型性能评估等全流程方案,并针对不同应用场景提供定制化训练建议。开发者可借助该工具包快速构建符合特定需求的自动驾驶解决方案,显著缩短技术转化周期。

公司高层在发布会上着重强调物理人工智能的战略地位。首席执行官黄仁勋此前多次指出,该领域将成为人工智能技术演进的新方向。首席科学家比尔·戴利进一步阐释,机器人技术的突破需要构建通用型智能中枢,而物理人工智能正是实现这一目标的关键路径。据技术团队透露,相关研发工作已延伸至工业机器人、医疗机器人等多个领域,未来将形成覆盖多场景的智能系统解决方案。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version