ITBear旗下自媒体矩阵:

英伟达Cosmos Reason:赋能机器人高效视觉推理,加速智能化进程

   时间:2025-08-12 12:40:04 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

英伟达在最近的 SIGGRAPH 国际计算机图形学与交互技术盛会上,向全球机器人开发者展示了一项重大技术突破——Cosmos Reason,一款开源的物理人工智能模型。这款模型拥有高达70亿的参数,专为提升机器人在复杂环境中的视觉推理能力而设计。

自OpenAI推出CLIP模型以来,视觉语言模型在物体识别、模式匹配等领域取得了显著成果。然而,面对需要多步骤推理的复杂任务,传统模型往往难以应对,特别是在处理模糊或前所未有的现实场景时。Cosmos Reason凭借其强大的记忆与理解能力,让机器人能够像人类一样进行逻辑推理,从而在现实世界中作出更加精准的行为决策。

在英伟达的实际演示中,装备了Cosmos Reason模型的机器人手臂成功识别出“面包与烤面包机”的组合,并自动推导出下一步是将面包放入烤面包机进行烘烤。这一“机器人规划与推理”的演示,彰显了Cosmos Reason在处理复杂指令时的出色效率和灵活性。

Cosmos Reason不仅可作为机器人的“智慧大脑”,还能广泛应用于其他人工智能领域。例如,它能自动化处理规模庞大、种类繁多的训练数据集,进行高效的数据整理和标注。该模型还能从海量视频数据中提取关键信息,进行深入分析。目前,该模型已进入商业化阶段,英伟达内部的机器人和自动驾驶团队正利用它进行数据整理和分析工作。

优步也在利用Cosmos Reason为其自动驾驶训练数据进行标注和生成说明,极大地提升了数据处理的效率。麦格纳国际则通过该模型开发出全自动即时配送解决方案,旨在使车辆更快适应不同的城市环境。VAST Data和Milestone Systems等公司也在交通监控、视觉检测等领域广泛应用这一技术。

英伟达在此次大会上还推出了Cosmos世界模型的新成员——Cosmos Transfer-2,旨在加速3D仿真场景中合成数据的生成。同时,英伟达更新了Omniverse软件开发工具包,并推出了新的神经重建库,进一步丰富了开发者的工具选择,推动了机器人技术与人工智能的深度融合。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version