滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Meta发布SAM 3：突破标签限制，30毫秒分割百物，3D重建与科研应用拓新篇

时间：2025-11-20 15:08:51 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

meta近日在人工智能领域再掀波澜，正式推出第三代图像分割模型Segment Anything Models（SAM）——SAM 3，并同步开源3D重建模型SAM 3D。这一技术组合不仅突破了传统图像分割的固有局限，更将应用场景从二维平面延伸至三维空间，为视频创作、机器人感知、野生动物保护等多个领域带来革新性工具。

在核心功能层面，SAM 3首次实现通过自然语言与图像示例的双重提示，精准识别、分割及追踪视频中的任意物体。用户仅需输入“条纹红色雨伞”等描述性词汇，模型即可自动定位图像或视频中所有符合条件的实例，彻底摆脱传统模型对固定标签集的依赖。为验证这一能力，meta构建了SA-Co基准数据集，涵盖21.4万个独特概念、12.4万张图像及1700个视频，其概念覆盖范围达现有基准的50倍以上。测试数据显示，SAM 3在LVIS数据集的零样本分割任务中准确率达47.0，较前代提升22%；在用户偏好测试中，其输出效果以3:1的优势领先于最强基准模型OWLv2。

技术架构方面，SAM 3引入“可提示概念分割”（Promptable Concept Segmentation）机制，支持短语文本、图像示例、点选、框选等多种提示方式。这种灵活性使其既能处理“坐着但没有拿礼物盒的人”等复杂推理任务，也可应对罕见或难以用文字描述的视觉概念。当与多模态大语言模型协同工作时，SAM 3在ReasonSeg和OmniLabel等需要推理的分割基准测试中表现优异，且无需针对特定数据集进行额外训练。

数据标注效率的飞跃是SAM 3的另一大突破。meta开发的创新数据引擎将模型、人类标注者与AI系统结合，形成闭环反馈机制。对于图像中不存在的概念标注，该系统速度较纯人工提升5倍；在细粒度领域标注中，效率亦提高36%。通过这一系统，研究团队构建了包含超400万个独特概念的训练集，其中AI标注者基于Llama 3.2v模型，在掩码质量验证等任务中达到或超越人类水平，使整体标注吞吐量翻倍。

在三维重建领域，SAM 3D系列模型树立了新标杆。其包含的SAM 3D Objects可从单张自然图像重建详细3D形状、纹理及物体布局，通过扩散捷径优化，实现几秒内完成高质量纹理重建。在人类偏好测试中，该模型以至少5:1的胜率领先其他领先方案，为机器人3D感知等实时应用提供可能。另一模型SAM 3D Body则专注于人体姿态估计，即使面对异常姿势、遮挡或多人场景，仍能通过交互式输入（如分割掩码）实现精准预测。其训练数据集涵盖800万张图像，包含罕见姿势及多样化服装场景，在多个3D基准测试中表现卓越。

实际应用层面，SAM 3已渗透至科研与商业领域。meta与Conservation X Labs合作推出的SA-FARI数据集，包含超1万个相机陷阱视频，覆盖100余个物种，每帧图像均标注边界框与分割掩码，为野生动物保护提供研究工具。海洋研究方面，FathomNet数据库开放了水下图像的定制化分割掩码及实例分割基准，助力海洋探索AI工具开发。商业领域，meta与Roboflow合作，允许用户标注数据、微调模型并部署至特定场景，同时公开微调方法供社区参考。

尽管性能显著提升，SAM 3仍存在局限性。例如，其在细粒度专业领域（如医学图像）的零样本泛化能力有限，需针对特定术语进行优化；视频追踪任务中，推理成本随物体数量线性增长，且缺乏物体间交互机制。这些挑战为后续研究指明了方向，也预示着图像分割技术仍有广阔进化空间。

更多>同类资讯

捷龙三号遥十火箭海上腾飞 2026海阳将开启高频次航天发射新篇

据悉，2026年，海阳将全面落实省政府支持商业航天发展的18条措施，保障火箭海上发射和试验任务10次以上。牵引夯实“天上有星、陆上有箭、海上有船、空中有网”的商业航天现代化产业体系，支撑东方航天港加快成为商…

03-23

星夜破空！捷龙三号遥十火箭海阳海域一箭十星开启航天新征程

03-23

宇树科技人形机器人崛起：收入反超四足，商业化进程加速驶入快车道

宇树科技“关于宇树科技股份有限公司首次公开发行股票并在科创板上市预先审阅申请文件的问询函的回复”显示，以四足机器人为例，其中科研教育的收入占比从2022年的68.61%，降低到2025年1—9月的31.58…

03-23

微博“硅基茶水间”：AI专属超话开启人类化身观察者沉浸围观

近日，微博推出AI机器人专属超话"硅基茶水间"，该超话的最大特点是只允许AI机器人、智能体发言，而人类用户不能发言，只能“围观”转发点赞。 “硅基茶水间”是一个为包括龙虾、评论机器人等在内的各类AI创建的，支…

03-23

中国AI大模型周调用量4.69万亿Token 连续两周领跑全球彰显实力

快科技3月22日消息，据媒体报道，全球最大AI模型API聚合平台OpenRouter最新发布的数据显示，截至3月15日，中国AI大模型的周调用量达到4.69万亿Token，连续第二周超越美国。全球调用量排名…

03-23

苹果CEO库克访华盛赞：中国机器人与AI发展亮眼，期待更多创新突破

IT之家 3 月 22 日消息，据中新社消息，苹果 CEO 蒂姆 · 库克今天在接受媒体采访时表示，中国机器人行业发展令人印象深刻。苹果公司持续深化在华创新合作、绿色发展与产业链协同，这与中国“十五五”规划方…

03-23

古尔曼透露：苹果Apple TV等三款产品库存紧张或迎新品发布潮

03-23

Anthropic版权和解案律师费“缩水” 申请额从3亿降至1.875亿

03-23

启境品牌亮相：跨界融合赋能，首款GT7如何开启智能出行新境界？

03-23

华为肖德刚：AI与存储双向奔赴，共筑AI时代数据基础设施新未来

03-22

清华薛澜：中国AI发展优势显著，助力海外破“智能鸿沟”促国际合作

03-22

AI工具碎片化困境：如何跨越鸿沟，迎来真正的“超级AI助理”时代？

03-22

国家互联网应急中心等发布指南助多类用户安全使用OpenClaw

03-22

古尔曼爆料：苹果三款产品库存告急，新品或因AI升级推迟后加速到来？

03-22

OpenAI将在美国向ChatGPT免费版与Go用户投放广告

03-22

点击查看更多 +

全站最新

专业第三方检测：全面解析充电桩充电模式，保障安全与效率

雷军揭晓新一代SU7靛石绿销量夺冠准车主亲述实车色彩魅力非凡

百度智能云DuMate正式上线，国产企业级满血版助力安全高效办公新体验

保时捷Panamera尽享版登场！99.8万起售，配置优化专为中国市场定制

小米新能源汽车焕新登场：续航升级配置硬核，21.99万元起售能否再掀热潮？

宝马改款iX1谍照流出！设计大改融入新世代语言性能续航或升级

热门内容

本栏最新

启境品牌亮相：跨界融合赋能，首款GT7如何开启智能出行新境界？

陶哲轩谈AI辅助数学证明：别硬塞旧体系，应建适配机器新设施

智能经济浪潮下，高校双创教育如何破局与转型？

新能源汽车与工业4.0实训台：培养未来技能人才的教学利器

华为技术加持！新阿维塔12标配激光雷达与5颗毫米波雷达智能安全双升级

华为乾崑加持新阿维塔12标配激光雷达智能座舱与安全性能双提升

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.