ITBear旗下自媒体矩阵:

京东JoyAI-Image-Edit图像模型开源,引领AI图像编辑进入三维空间重塑新时代

   时间:2026-04-08 03:38:04 来源:天脉网编辑:快讯 IP:北京 发表评论无障碍通道
 

在AI图像编辑领域,传统模型长期面临空间逻辑混乱的瓶颈——移动物体时出现变形、切换视角时透视错乱、调整物体层级时遮挡关系失衡。这些难题源于模型对三维空间结构的理解缺失,导致编辑操作仅停留在像素层面。京东探索研究院近日推出的开源模型JoyAI-Image-Edit,通过构建完整的空间智能体系,实现了从平面修图到三维空间重塑的技术跨越。

该模型创新性地将空间认知能力深度融入图像生成流程,通过建立相机坐标系变换、物体空间位移旋转、几何结构精准控制等核心技术模块,构建起覆盖空间位置关系、多视角一致性、场景推理等维度的完整体系。实验数据显示,在物体移动精度、空间布局合理性等关键指标上,该模型已达到国际领先水平。其突破性在于打破了"生成图像"与"理解空间"的界限,使AI既能生成逼真视觉效果,又能精准维护场景的几何规律与物理合理性。

三大核心编辑范式构成技术护城河:视角变换功能支持通过自然语言指令调整相机参数,在保持场景几何一致性的前提下生成新视角图像;空间漫游能力可连续生成逻辑连贯的多视角序列,实现三维场景中的"虚拟漫游";物体空间关系操控技术能在保持整体结构稳定的前提下,对特定物体进行位移、缩放等操作,并自动修正遮挡与光影关系。这些能力与15类通用编辑功能深度融合,覆盖物体替换、风格迁移、细节精修等高频需求,形成全场景创作解决方案。

在具身智能等前沿领域,该模型展现出独特价值。其空间理解能力为机器人感知环境提供了关键技术支撑,使机械臂操作、自主导航等任务获得更精准的空间坐标参考。在电商内容生产场景中,模型可自动生成多角度商品展示图;创意设计领域支持三维场景的快速构建与修改;智能图像处理方面能高效完成复杂场景的修复与重构。技术团队透露,模型已实现推理代码全开源,开发者可直接调用核心功能开发应用。

这项突破是京东AI技术矩阵的重要拼图。就在上月,该集团刚开源了基础大模型JoyAI-LLM Flash,通过架构创新突破参数规模限制;京东云"龙虾"系列产品上线后,token调用量周环比增长达455%;全球最大具身数据采集中心的建设也在稳步推进。依托实体产业场景优势,京东正持续推动AI技术从实验室走向规模化应用,构建起覆盖基础研究、技术开发、产业落地的完整生态。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version