苹果公司近日宣布,将派代表参加于2025年10月19日至23日在檀香山举办的国际计算机视觉大会(ICCV)。这一全球计算机视觉领域的顶级盛会,每两年与欧洲计算机视觉会议(ECCV)交替举行,致力于推动该领域的前沿研究与技术发展。
据悉,苹果此次参会阵容强大,不仅将提交八篇高质量论文,还将在多个环节中深度参与。这些论文均经过严格筛选,成功入选大会的海报展示与口头报告环节,内容覆盖计算机视觉领域的多个关键方向。
八篇论文的具体研究主题包括:ETVA模型通过细粒度问答实现文本与视频的精准对齐评估;MM-Spatial项目探索多模态大语言模型对三维空间的理解机制;以及关于原生多模态模型扩展规律的深入研究。研究还揭示了稳定扩散模型在视觉上下文学习中的隐性优势,提出了STIV可扩展的文本与图像条件化视频生成方法,并构建了UINavBench交互式数字智能体综合评估框架。其他成果还包括基于多模态提示的开放世界分割技术,以及UniVG通用扩散模型在图像生成与编辑领域的创新应用。
在学术交流方面,苹果机器学习应用研究部经理C. Thomas博士将作为主旨演讲嘉宾出席第三届基于视觉的工业检测研讨会(VISION)。其演讲主题将于近期公布,具体时间定于10月19日。这场演讲预计将引发业界对工业视觉检测技术的深入讨论。
除了技术展示与主旨演讲,苹果研究人员Patricia Vitoria Carrera与Tanya Glozman还将参与"计算机视觉领域女性研讨会"的导师计划。她们将在会后晚宴上与年轻学者展开交流,分享研究经验与职业发展建议。