ITBear旗下自媒体矩阵:

京东开源JoyAI-Image-Edit图像模型,空间智能突破引领AI图像编辑新潮流

   时间:2026-04-08 01:05:45 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在AI图像编辑领域,传统模型长期面临空间逻辑混乱的难题——当用户尝试移动物体、切换视角或调整物体层次时,常出现几何变形、光影错乱、遮挡关系失衡等问题。这一困境源于多数模型仅能在二维平面进行像素级操作,无法理解图像背后的三维空间结构。近日,京东探索研究院推出的开源模型JoyAI-Image-Edit通过构建空间智能体系,实现了从平面修图到三维空间重塑的技术跨越。

该模型突破性地将空间认知能力深度融入图像生成流程,通过建立完整的空间理解数据与任务体系,在相机坐标变换、物体空间位移、几何结构控制等维度实现技术突破。实验数据显示,在物体移动精度、多视角一致性等核心指标上,其性能已达到国际领先水平。开发者可通过公开的推理代码直接调用模型能力,无需从零构建空间编辑框架。

JoyAI-Image-Edit的三大核心能力构建起差异化优势:视角变换功能支持用户通过自然语言精准控制相机偏航角、俯仰角及缩放参数,在保持场景几何一致性的前提下生成新视角图像;空间漫游能力可实现连续视角移动,生成逻辑连贯的多视角图像序列,模拟三维场景中的自然移动效果;物体空间关系操控则能在保持整体结构稳定的前提下,对特定物体进行位移、缩放等操作,同时自动修正遮挡与光影关系。这些能力使模型在处理复杂空间场景时,既能保持主体形态完整,又能确保场景布局符合物理规律。

在通用编辑能力方面,该模型兼容15类高频创作需求,包括物体替换、删除、添加,以及风格迁移、细节精修等操作。通过将空间编辑技术与长文本渲染、多视角一致性生成等难点任务结合,模型在电商内容生产、创意设计、智能图像处理等领域展现出显著优势。特别是在3D模型重建场景中,其空间理解能力可大幅提升重建精度;在具身智能领域,该技术为机器人视觉感知提供了关键底层支持,帮助设备更准确地理解三维环境。

京东近期在AI领域动作频频。除开源JoyAI-Image-Edit外,其基础大模型JoyAI-LLM Flash已打破参数竞赛困局,云业务"龙虾"系列产品上线后token调用量周环比增长455%,全球最大具身数据采集中心建设也在稳步推进。这些布局彰显了京东以供应链优势推动AI技术产业化的战略方向,通过构建从基础研究到场景落地的完整链条,持续释放AI技术的商业价值与社会价值。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version