京东探索研究院近日宣布,其自主研发的图像编辑模型JoyAI-Image-Edit正式面向全球开源。这款以“空间智能”为核心特性的模型,首次将AI修图技术从二维平面处理推向三维空间建模领域,为计算机视觉领域带来突破性进展。通过深度融合物理空间规律,该模型实现了对真实场景的几何一致性编辑,标志着AI对空间关系的理解达到新高度。
在技术实现层面,模型构建了覆盖相机参数、物体运动轨迹等多维度的物理引擎。开发者可直接调用推理接口,在保持场景结构完整性的前提下,对空间元素进行精准操作。其独创的自然语言交互系统支持通过文本指令调整相机视角,包括偏航角、俯仰角及缩放比例等参数,解决了传统模型在空间理解方面的技术瓶颈。
该模型的创新性体现在动态空间编辑能力上。通过连续视角移动算法,可生成具有逻辑连贯性的漫游视频序列。在保持整体场景稳定的同时,支持对指定物体进行独立缩放或位移操作,并自动计算光影变化与遮挡关系,确保编辑结果的视觉真实性。这种动态空间处理能力在虚拟场景构建、3D内容生成等领域具有重要应用价值。
功能扩展性方面,模型整合了15类主流图像编辑需求,包括物体增删、材质替换、风格迁移等通用功能。其模块化设计支持开发者根据具体场景进行功能组合,既可实现基础图像优化,也能完成复杂的三维场景重建。这种技术架构使其在电商产品展示、数字创意设计、机器人环境感知等多个领域展现出强大适应性。
目前,该模型已在多个行业实现落地应用。在电商领域,通过三维空间编辑技术可快速生成多角度商品展示图,显著提升内容制作效率;创意设计行业利用其动态视角生成功能,开发出新型交互式视觉作品;具身智能领域则借助空间理解能力,为机器人提供更精准的环境感知支持。这些实践验证了模型在跨行业技术赋能方面的有效性。











