ITBear旗下自媒体矩阵:

苹果发布三项AI研究新成果,持续深耕空间计算与Vision Pro头显领域

   时间:2026-05-12 15:59:24 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

科技媒体近日披露,苹果公司正通过一系列前沿研究持续深化空间计算领域的布局,其中三篇最新公开的论文揭示了其在多模态人工智能、无障碍技术及三维重建方面的突破性进展。尽管此前有传闻称苹果暂停了新一代Vision Pro头显的研发,但这些研究成果表明该公司仍在为空间计算设备构建核心技术底座。

在机器学习领域,苹果研究人员开发的SFI-Bench测试框架引发行业关注。该系统通过134段室内场景视频扫描和1555道专家标注问题,构建了首个评估多模态大模型空间功能智能的基准平台。与传统测试仅关注物体识别与定位不同,SFI-Bench要求模型完成"从橱柜中找出同品牌最多瓶子"或"取消洗衣机当前程序"等复杂任务。测试结果显示,Google Gemini 3.1 Pro以综合优势领跑,但所有模型在"带条件的全局计数"和空间记忆整合方面仍存在显著短板。

无障碍技术方面,苹果团队在《Bootstrapping Sign Language Annotations with Sign Language Models》论文中展示了AI驱动的手语标注创新方案。通过构建近500条英文字词到术语的映射库,并结合超过300小时的STEM领域手语视频数据,其手指拼写模型在FSBoard基准测试中取得6.7%的字符错误率,在ASL Citizen数据集上达到74%的top-1准确率。这项技术有望大幅降低手语内容制作成本,为听障群体创造更友好的数字环境。

三维重建领域的研究则直接关联Vision Pro的核心功能。在《Large-Scale High-Quality 3D Gaussian Head Reconstruction from Multi-View Captures》论文中,苹果提出的HeadsUp方法利用层级建模技术,通过多摄像头系统重建出精度达毫米级的3D头部模型。基于超万名受试者的内部数据集训练,该技术可实现更自然的人脸捕捉与表情渲染,这被视为优化Vision Pro Persona虚拟形象系统的关键突破。研究团队特别强调,其重建质量较现有方法提升40%,且计算效率提高3倍。

苹果全球营销高级副总裁格雷格·乔斯维亚克在近期访谈中重申,空间计算将彻底改变人机交互方式。虽然他拒绝透露具体产品路线图,但强调数字世界与物理世界的融合是不可逆转的技术趋势。这些研究成果的集中披露,恰逢苹果被传调整Vision Pro研发策略之际,显示出该公司正通过底层技术创新为下一代空间计算设备铺路。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version