滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

苹果公布三项AI研究新成果，持续深耕空间计算助力Vision Pro发展

时间：2026-05-12 16:38:34 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

近日，科技领域传来新动态，苹果公司在空间计算与 Vision Pro 头显项目上的进展备受关注。此前有消息称，苹果公司内部搁置了新款 Vision Pro 的研发，将团队重心转向 Siri 和 AI 智能眼镜，然而最新公开的三项研究却表明，苹果并未放弃 Vision Pro 头显项目。

苹果此次公开的三项研究分别涉及多模态大模型空间推理评测、美式手语视频标注以及 3D 头部重建。其中，在机器学习博客发布的《From Where Things Are to what They’re For：Benchmarking Spatial-Functional Intelligence for Multimodal LLMs》论文颇具亮点。该论文提出了 SFI-Bench，用于测试多模态大模型对空间布局的理解以及物体功能的认知能力。这套视频基准包含 134 段室内视频扫描，并整理出 1555 道专家标注问题。与以往只测试空间识别的旧方法不同，SFI-Bench 不仅会问模型“这是什么、在哪里”，还会追问“它怎么用、出了故障怎么办”。例如，让模型从柜子里找出同品牌数量最多的一组瓶子，理解洗衣机当前程序如何取消，或者判断电视遥控器的用途，这些测试更贴近日常家庭场景，也更接近未来空间助手需要处理的真实任务。在测试结果中，Google Gemini 3.1 Pro 总分最高，OpenAI GPT-5.4-High 排名第二，Gemini-3.1-Flash-Lite 排名第三。不过，论文也指出，几乎所有模型都不擅长“带条件的全局计数”，并且在空间记忆、功能知识整合以及将眼前画面与外部知识关联等方面存在明显限制。

另一项研究《Bootstrapping Sign Language Annotations with Sign Language Models》聚焦于美式手语视频标注。研究团队尝试利用 AI 自动生成候选标注，以减少手工标注的时间成本。团队建立了近 500 条人工英文字词到术语标注，并扩展到超过 300 小时的 ASL STEM Wiki 和 7.5 小时的 FLEURS-ASL 数据。其手指拼写模型在 FSBoard 上达到 6.7％ CER，在 ASL Citizen 数据集上达到 74％ top-1 准确率。

第三项研究《Large-Scale High-Quality 3D Gaussian Head Reconstruction from Multi-View Captures》则把重点放在了 3D 头像重建上。苹果提出了 HeadsUp 方法，能够从大规模多摄像头采集中重建高质量的 3D Gaussian 头部模型。测试使用了包含超过 10000 名受试者的内部数据集，规模比现有多视角人头数据集高一个数量级。这一研究成果可能与 Vision Pro 的 Persona 功能，或者 visionOS 中更自然的人脸捕捉与表情渲染相关。

苹果公司全球营销高级副总裁格雷格·乔斯维亚克（Greg Joswiak）曾表示，Vision Pro 展示了数字世界与物理世界融合的未来形态，这种融合是必然的。当被问及“空间计算”何时能成为主流时，他坦言无法预测具体时间，但坚信这一发展方向不可逆转。

更多>同类资讯

谷歌披露首例AI参与开发零日利用事件，攻击门槛或因AI降低

05-12

美科技金融航空农业巨头齐聚：库克马斯克领衔访华黄仁勋未获邀约缺席

05-12

盐言故事新作《错嫁有喜》24小时热度破亿古偶短剧市场再掀热潮

05-12

估值200亿美元？消息称快手计划分拆可灵AI独立上市

05-12

苹果连发3项AI研究，推进空间计算与Vision Pro头显方向

05-12

谷歌警告攻击者正用AI找漏洞，零日利用已出现真实案例

05-12

库克、马斯克等将随团到访中国黄仁勋不在其中

05-12

上线24小时热度破亿盐言故事改编短剧《错嫁有喜》火出圈

05-12

抹茶热潮席卷餐饮零售，中国产区能否突破原料困局走向品牌化？

05-12

酸味风潮引领餐饮新潮流，健康化品质化成酸汤赛道发展新引擎

05-12

苹果发布三项AI研究新成果，持续深耕空间计算与Vision Pro头显领域

05-12

四十余家A股公司入局可控核聚变赛道，中国“人造太阳”商业化加速前行

05-12

估值200亿美元！可灵AI或将被快手分拆上市

据媒体报道，快手科技正加速推进旗下AI视频产品“可灵AI”的分拆上市进程。消息称，快手计划于明年推动可灵独立IPO，并已开始与潜在投资方接触，洽谈Pre-IPO轮融资事宜。报道称，这轮融资对可灵AI的估值预计达到200亿美元，约合人民币1300亿元。消息一出，迅速引发创投

05-12

可控核聚变“追光”进行时：超40家上市公司入局抢占未来能源高地

05-12

ThinkFlow登场：破解大模型落地“最后一公里”工程化困局

05-12

点击查看更多 +

全站最新

小米YU7 GT“车厘子红”实车路测曝光，5月底发布，性能配置亮点满满

字节跳动“小云雀”负责人张心怡离职曾推动AI视频工具多项功能落地

AI浪潮下，快手磁力金牛如何为中小商家铺就“智能经营”坦途？

微信CRM赋能企业：解锁精准获客与高效转化新路径

四年沉淀铸就硬核实力岚图梦想家连获质量大奖彰显品质担当

4月车市：燃油车国内遇冷出口火热新能源渗透率首破60%成亮点

热门内容

本栏最新

小米YU7 GT“车厘子红”实车路测曝光，5月底发布，性能配置亮点满满

字节跳动“小云雀”负责人张心怡离职曾推动AI视频工具多项功能落地

AI浪潮下，快手磁力金牛如何为中小商家铺就“智能经营”坦途？

从“验证码车”到爆款黑马：铂智3X如何借中国研发力量逆袭合资新能源赛道

2026年5月8日多款新车齐上市奔驰C级、哈弗大狗PLUS新能源等亮相车市

小米YU7 GT“车厘子红”无伪装路测，5月底发布，跑车级SUV性能强劲

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.