ITBear旗下自媒体矩阵:

京东开源JoyAI-Image-Edit模型:攻克空间难题,赋能多元领域AI应用升级

   时间:2026-04-08 11:43:18 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

京东探索研究院近日宣布,其自主研发的图像编辑模型JoyAI-Image-Edit正式开源,成为全球首个深度融合空间智能技术的开源模型。该模型突破传统AI图像处理仅限于平面修改的局限,实现了三维空间重塑能力,其核心推理代码已完全开放,开发者可直接用于各类应用开发。

传统图像模型常因空间逻辑混乱导致物体变形、光影错乱等问题,而JoyAI-Image-Edit通过构建完整的空间理解体系,从相机坐标变换、物体几何控制到多视角一致性维护,系统性解决了这些行业痛点。实验数据显示,该模型在物体移动精度、空间布局合理性等关键指标上已达到国际领先水平,编辑后的图像能自然呈现遮挡关系与光影变化,即使进行视角切换或物体重组,场景结构依然保持高度真实。

该模型的创新性体现在三大核心能力:其一,支持通过自然语言精准控制相机视角,用户可指定偏航角、俯仰角等参数生成新视角图像;其二,具备空间漫游功能,能连续生成逻辑连贯的多视角图像序列,模拟三维场景中的移动观察效果;其三,可对特定物体进行位移、缩放等操作,同时自动调整周边环境的光影与遮挡关系,确保整体场景的物理合理性。这些能力使模型在处理复杂空间任务时表现出色,例如在电商场景中可快速生成多角度商品展示图,在创意设计领域能实现虚拟场景的自由编辑。

除空间编辑突破外,JoyAI-Image-Edit还兼容15类通用图像处理功能,涵盖物体替换、风格迁移、细节优化等高频需求。通过将空间智能与通用编辑能力深度融合,该模型在长文本渲染、多视角一致性生成等复杂任务中展现出显著优势,可满足全场景创作需求。例如在3D模型重建领域,模型能根据单张图片自动推断物体空间结构,生成多视角一致的三维模型;在具身智能视觉感知方面,其空间理解能力为机器人环境感知提供了关键技术支撑。

目前,该模型已开放代码与预训练权重,支持商业与学术用途。其开源特性将加速空间智能技术在电商、设计、机器人等领域的落地应用,特别是为具身智能研发提供了低成本、高效率的视觉处理解决方案。随着开发者社区的参与,JoyAI-Image-Edit有望推动AI图像技术向更复杂的空间场景延伸,重新定义智能图像处理的标准与边界。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version