京东探索研究院近日宣布,正式开源其自主研发的JoyAI-Image-Edit图像编辑模型,为AI图像处理领域带来突破性进展。该模型突破传统技术局限,首次实现了对图像三维空间结构的深度解析,在空间感知与编辑能力方面达到国际领先水平,有效解决了长期困扰行业的空间逻辑混乱问题。
传统AI图像处理工具在应对复杂空间操作时存在明显短板:移动物体易导致形变扭曲,视角转换常出现透视错误,调整物体层次关系时遮挡关系混乱。这些问题的根源在于现有技术仅停留在二维平面处理层面,缺乏对真实三维空间的理解能力。京东研发团队通过将空间智能算法深度融入模型底层架构,使系统能够准确捕捉图像背后的空间规律,实现与物理世界高度契合的智能编辑。
该模型展现出三大核心空间编辑能力:视角变换功能可通过自然语言指令调整相机角度,生成符合物理规律的新视角图像;空间漫游功能支持连续视角移动,自动生成连贯的多视角画面序列;物体空间关系操控功能则能精准调整物体位置、大小及遮挡关系,保持场景几何结构完整性。在光影处理方面,系统可自动匹配环境光源,确保添加或移动物体后的光照效果自然协调。
除空间编辑能力外,模型还整合了15类通用图像处理功能,涵盖物体替换删除、艺术风格迁移、长文本图像生成等高频需求。测试数据显示,在电商场景的商品展示图生成任务中,该模型可将制作效率提升40%,同时降低60%的返工率。在3D模型重建领域,通过多视角图像生成技术,可将重建时间从传统方法的数小时缩短至分钟级。
具身智能领域成为该技术的重要应用方向。通过为机器人提供空间感知底层能力,模型可帮助智能设备更准确理解物理环境,实现更自然的交互操作。在仓储物流场景中,搭载该技术的机器人能够精准识别货物空间位置,优化堆叠摆放方案;在家庭服务场景,可支持机器人理解家具布局,规划高效清洁路径。
此次开源是京东近期AI战略布局的重要环节。继基础大模型开源后,平台AI产品调用量呈现指数级增长,日均处理请求突破亿次。企业同步推进的全球最大具身数据采集中心项目,已与20余家制造业企业建立合作,计划三年内构建覆盖工业、物流、服务等多场景的万亿级训练数据集,持续推动AI技术与实体经济的深度融合。











