滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

英伟达携手高校推LocateAnything模型，AI检测对象实现高速高精度新突破

时间：2026-05-31 20:02:49 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

英伟达联合香港理工大学、南京大学等科研机构，共同推出了一款名为LocateAnything的新型视觉语言检测模型。该模型专注于实现高速、高精度的对象检测，能够在照片或截图中快速定位指定对象，并通过检测框精确标注其位置。这一技术突破为机器人感知、电脑自动操作等需要实时定位的场景提供了强有力的支持。

传统视觉模型在处理即时交互任务时，往往面临速度与精度的平衡难题。LocateAnything通过重新设计检测框预测机制，将视觉语言检测的响应速度提升至新水平。其核心创新在于并行框解码技术，将边界框或点作为固定长度原子单元，仅需单步即可完成坐标预测，显著降低了计算延迟。

为满足不同场景需求，模型开发了三种运行模式：Fast Mode针对端侧机器人和具身智能设备优化，通过牺牲少量精度换取更高吞吐量；Slow Mode侧重离线标注和高精度评测任务，确保数据处理的绝对准确性；Hybrid Mode作为默认选项，在常规情况下快速输出结果，遇到格式异常或空间歧义时自动切换至自回归解码，实现效率与精度的动态平衡。

研究团队同步构建了包含1200万独立图像、1.38亿语言查询和7.85亿边界框的LocateAnything-Data数据集。该数据集覆盖通用检测、GUI元素定位、指代表达理解、OCR文字定位、版面分析和点定位六大领域，为模型训练提供了丰富的场景支持。通过这种多维度数据训练，模型展现出强大的泛化能力，能够适应不同领域的定位需求。

在性能测试中，LocateAnything展现出显著优势。基于单张NVIDIA H100 GPU的Hybrid Mode下，模型达到每秒12.7个检测框的处理速度，远超Qwen3-VL的1.1 BPS和Rex-Omni的5.0 BPS。在高精度任务中，模型在LVIS数据集IoU=0.95标准下取得31.1分，ScreenSpot-Pro平均F1值达60.3，DocLayNet和M6Doc分别获得76.8与70.1的优异成绩，各项指标均领先同类模型。

这项技术突破为实时交互系统提供了新的解决方案。在工业自动化领域，机器人可通过快速定位实现更精准的操作；在智能办公场景中，系统能够自动识别文档中的关键信息；在辅助技术方面，模型可帮助视障用户快速定位界面元素。随着技术不断完善，LocateAnything有望推动人机交互方式向更自然、高效的方向发展。

更多>同类资讯

图灵奖得主Joseph Sifakis出任曹操出行首席科学顾问

06-29

豆包手机每月自动发放68元会员额度全端通用

06-29

知乎毕业季线下展落地THE BOX朝外：聚焦AI时代毕业生的艺术与自我

06-29

华为Mate 90系列定档9月发布：首发麒麟2026芯片，正面对决iPhone 18

06-29

折叠屏的“第二次进化”：专访vivo黄韬、韩伯啸，解码X Fold6的AI生力军

06-29

星河作伴天宫为家神舟二十三号乘组太空“出差”忙科研享生活

央视网消息：神舟二十三号乘组三名航天员朱杨柱、张志远、黎家盈在轨已满一个月。神二十三乘组和机器人“小航”进行互动，开展触碰交互测试，采集相关数据用于优化后续在轨机器人运动行为规划方法。三名航天员利用脑电采集…

06-29

北京太空算力创新中心揭牌！六大攻关方向+四项成果助力太空算力发展

据悉，北京太空算力创新中心采用“公司+联盟”双轮驱动运营模式，明确六大核心攻关方向，包括太空原生算力芯片设计与研制、高性能超带宽的太空算力载荷、卫星平台与地面验证基础设施、大模型部署与软硬件协同优化、天地一…

06-29

AI当CEO大挑战：14位“硅基老板”上阵，仅4位保本谁是赢家？

06-29

惠普携手OpenAI推进战略合作全方位部署Frontier平台助力企业加速转型

OpenAI官网新闻稿截图上证报中国证券网讯据OpenAI官网6月28日消息，惠普公司宣布与OpenAI达成战略合作，全方位部署OpenAIFrontier平台，加速企业转型并提升客户体验。据此前…

06-29

惠普携手OpenAI深化合作全球业务全面部署Frontier平台促发展

来源：环球网【环球网科技综合报道】6月29日消息，惠普公司宣布与OpenAI达成战略合作，将在其全球业务中全面部署OpenAIFrontier平台，旨在提升客户体验和加速运营转型。据介绍，这项战略合…

06-29

惠普携手OpenAI深化合作全面部署Frontier平台助力企业智能化升级转型

OpenAI官网新闻稿截图上证报中国证券网讯据OpenAI官网6月28日消息，惠普公司宣布与OpenAI达成战略合作，全方位部署OpenAIFrontier平台，加速企业转型并提升客户体验。据此前…

06-29

OpenAI“背离”C端转向B端：商业转向背后是野心还是无奈之举？

AI产品负责人朱颐均认为，把Annotations和Sites结合起来看，其实就能发现，OpenAI想覆盖的并不只是能力调用这一个环节，而是从理解任务、完成任务到交付成果的整个过程，相当于把完整的工作链条都…

06-29

北京可灵智能科技工商变更：程一笑任董事长，盖坤履新多职引关注

北京可灵智能科技有限公司发生工商变更，新增程一笑任董事长，盖坤任法定代表人、董事、经理投资时间网、标点财经天眼查App显示，近日，北京可灵智能科技有限公司发生工商变更，新增程一笑任董事长，盖坤任法定代…

06-29

惠普携手OpenAI深化合作全球业务全面部署Frontier平台促发展

来源：环球网【环球网科技综合报道】6月29日消息，惠普公司宣布与OpenAI达成战略合作，将在其全球业务中全面部署OpenAIFrontier平台，旨在提升客户体验和加速运营转型。据介绍，这项战略合…

06-29

法拉第未来FF机器人销售亮眼 3-6月出货242台全年目标再提至2000台

IT之家 6 月 29 日消息，贾跃亭今日发布视频，汇报了法拉第未来机器人的销售情况。据介绍，6 月，FF EAI机器人的销售、出货及交付量达到 105 台，3-6 月累计 242 台，超额完成原定的 2…

06-29

点击查看更多 +

全站最新

新能源汽车领域蓬勃发展，现存相关企业超179.9万家且注册量逐年增

2027款星海V9获国际名流青睐，以实力推动20万级MPV豪华体验新跨越

豆包内测社交功能引热议官方回应：与飞书协同办公无社交布局计划

全球首座AI艺术馆Dataland启幕：以生物传感技术开启雨林沉浸对话新体验

豆包“进化”：从聊天助手到代码高手，能否在硬核赛场证明自己？

夏日加油必知：加满隐患、过期判断、标号真相及劣质油应对全攻略

热门内容

本栏最新

晟兴电话机器人助力资料补全：小步试跑精准优化，让人机协作更高效

晟兴电话机器人通知确认：把握语气要点，做好场景规划与细节优化

股东会亮出“价值底牌”，长城汽车引领行业跳出“销量陷阱”

华为杨扬：借AI焕新产品服务携手各方推动Token经营价值提升

东风奕派M8正式开启预售！大六座布局+华为科技加持，19.98万起售

东风奕派M8开启预售：大六座SUV新选择，纯电增程双版本来袭

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.