ITBear旗下自媒体矩阵:

京东JoyAI-Image-Edit开源:空间智能突破,引领电商与具身智能新变革

   时间:2026-04-12 13:56:54 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

大厂在人工智能领域的竞争愈发激烈,技术迭代与场景落地成为关键战场。京东近日推出开源图像模型JoyAI-Image-Edit,将空间智能技术深度融入图像生成与编辑领域,为电商内容生产与具身智能训练提供全新解决方案。该模型通过理解三维空间关系,实现了对物体位置、角度和视角的精准操控,在多项国际评测中达到领先水平。

传统图像编辑工具在处理空间关系时存在明显短板,例如调整物体位置时易出现比例失调、光影错乱等问题。JoyAI-Image-Edit突破性地将空间编辑作为核心能力,支持15类通用编辑任务的同时,新增物体移动、旋转和视角变换等空间级操作。模型能够解析"向右移动0.3米"或"旋转45度"等精确指令,在电商场景中可快速生成多角度商品展示图,显著降低拍摄成本。实测显示,即使处理毛绒材质等复杂物体,模型仍能保持画面结构一致性。

技术架构方面,该模型采用MLLM+VAE+扩散模型的混合架构,形成"理解-生成-再理解"的闭环流程。空间信息直接参与生成过程,配合300万规模的空间数据集训练,使模型在2D语义感知、3D空间理解和4D时空推理三个维度实现突破。在SpatialEdit-Bench评测中,其空间编辑精度超越Veo3.1等视频世界模型,物体整体得分达0.649,摄像头整体得分0.571。

电商领域成为该技术首个落地场景。服饰类商品可通过模型一键调整折叠角度,家电产品能自动生成不同场景的摆放效果,结合文字标注和背景修饰功能,实现"一次操作完成多需求"的精修效果。某鞋类品牌应用后,商品图生产效率提升4倍,拍摄成本降低60%。在具身智能训练方面,模型生成的空间一致性图像数据可补充真实采集样本,有效解决机器人训练的数据稀缺难题。

京东的AI布局呈现明显的产业导向特征。除图像模型外,其近期开源的JoyAI-LLM Flash模型通过优化算法提升同等参数下的性能效率,降低开发者使用门槛。在基础设施层面,全球最大的具身智能数据采集中心正在建设,结合模型生成能力构建数据闭环。终端落地方面,JoyInside技术已嵌入家电、机器人等产品,实现AI能力与物理世界的直接交互。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version