滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

英伟达携手高校发布LocateAnything模型，为AI检测带来高速高精度新方案

时间：2026-05-30 12:42:53 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

英伟达近日联合香港理工大学、南京大学等机构，共同推出了一款名为LocateAnything的新型视觉语言检测模型。该模型专注于实现高速、高精度的对象检测功能，能够从照片或屏幕截图中快速定位指定目标，并通过检测框明确标注其位置。

在机器人感知、计算机自动化操作等需要即时响应的场景中，LocateAnything展现出显著优势。传统模型往往在目标定位速度上存在瓶颈，而英伟达团队通过重新设计检测框预测机制，使该模型更适配交互式任务需求。例如，在服务机器人导航或智能体操作界面时，模型需在毫秒级时间内完成目标识别与定位。

技术层面，LocateAnything创新性地提出并行框解码策略，将边界框坐标（x1,y1,x2,y2）视为固定长度的原子单元，实现单步预测。这一设计大幅提升了推理效率，同时通过三种运行模式满足不同场景需求：Fast Mode针对端侧设备优化吞吐量，Slow Mode侧重离线标注与高精度评估，Hybrid Mode则作为默认选项，在常规输出中保持高速，仅在遇到格式异常或空间歧义时切换至自回归解码。

为支撑模型训练，研究团队构建了包含1200万独立图像、1.38亿语言查询及7.85亿边界框的LocateAnything-Data数据集。该数据集覆盖六大核心领域：通用物体检测、图形用户界面元素定位、指代表达理解、光学字符识别定位、文档版面分析以及点定位。这种多维度数据结构有效扩展了模型的泛化能力，使其能处理从日常物品到复杂文档布局的多样化任务。

性能测试显示，在单张NVIDIA H100 GPU环境下，Hybrid Mode模式下模型达到每秒12.7个检测框的输出速度，较Qwen3-VL的1.1 BPS和Rex-Omni的5.0 BPS均有显著提升。在高精度任务中，该模型在LVIS数据集IoU=0.95标准下取得31.1分，超越Rex-Omni的20.7分；在ScreenSpot-Pro界面元素定位任务中平均F1值达60.3，文档版面分析任务DocLayNet和M6Doc分别获得76.8与70.1的高分。

更多>同类资讯

硅基流动递表港交所：Token经济热潮下，盈利难题待解

07-03

优必选发布U1系列仿生机器人：真人比例细腻肌肤，情感陪伴新选择引热议

就在昨天，优必选在深圳开了场全球发布会，正式推出旗下消费级品牌“优世界”的首款产品 —— 全尺寸超仿生人形机器人 U1 系列。此外官方还明确强调，产品仅面向成年用户销售，并且面向普通消费用户的版本不支持二…

07-03

Anthropic启动自研AI芯片早期开发，拟借三星2纳米工艺发力人工智能领域

IT之家 7 月 2 日消息，据 The Information 报道，Anthropic 正与三星洽谈定制人工智能芯片事宜，Anthropic已启动自研人工智能芯片的早期开发工作。三位知情人士表示，目前…

07-03

2027款丰田格瑞维亚上市，配置升级二排体验提升，焕新权益价23.68万起

07-03

2027款丰田格瑞维亚上市，配置升级二排体验提升，焕新权益价23.68万起

07-03

张雪峰女儿接手张雪峰名下一公司股份

07-03

AI 互动酿成悲剧：用户起诉 OpenAI，称 ChatGPT 加剧其心理病情

07-03

万吨巨物毫米级“牵手”：智能对接系统赋能大国重器建造

以基础研究开路，船舶、航天领域各类大型调姿装备的定位精度实现了跨越式提升，也为巨型部件的精准调姿奠定了理论基础。这套大型部件结构变形主动调控技术，让万吨级庞然大物即便发生形变，也能完成特征精准匹配，实现柔性、…

07-03

昆仑万维披露天工AI业务ARR突破8亿美元

07-03

昆仑万维2026年二季度天工AI业务ARR超8亿，DramaWave引领短剧AI原生时代

07-03

张雪峰退出苏州研途教育公司女儿张姩菡接棒成为新股东

07-03

法拉第未来洛杉矶厂房探访实录：荒废空置，业务转型背后何去何从

07-03

芯展速孙丹：AI驱动存储长周期缺货，行业刚起步未来潜力无限

07-02

豆包“明星指数榜单”引争议？公关负责人回应：系博主生成非官方

07-02

特斯拉勾勒未来蓝图：900万+车辆在路上能源与AI布局加速推进

07-02

点击查看更多 +

全站最新

华为汽车顶棚外观专利亮相：余承东等设计，提升空间利用率可存投影幕布

雅马哈“串并联混合动力系统”专利曝光：双电机搭配单缸引擎，未来能否量产引期待

燃油时代的机械诗篇：那些偏执狂们写给钢铁的心跳与浪漫

六年驾车电瓶养护误区终破除！实测揭秘：适度充电才是护车关键

2026年新能源汽车“双标”落地：安全升级，成本上涨，行业未来何去何从？

问界汽车6月交付超3万台全新M9系列大定火爆 M6上市即热销

热门内容

本栏最新

2027款丰田格瑞维亚上市，配置升级二排体验提升，焕新权益价23.68万起

天工3.2升级Skywork Tags：Agent入群协作，开启团队共享AI新篇章

2027款格瑞维亚焕新登场！豪华座舱+智能升级，打造家庭出行新体验

2027款格瑞维亚焕新登场！7座布局+智能升级，限时权益价23.68万起

2027款丰田格瑞维亚上市！配置升级二排体验提升焕新权益价23.68万起

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.