滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

京东JoyAI-Image-Edit开源：空间智能突破，引领电商与具身智能新变革

时间：2026-04-12 13:56:54 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

大厂在人工智能领域的竞争愈发激烈，技术迭代与场景落地成为关键战场。京东近日推出开源图像模型JoyAI-Image-Edit，将空间智能技术深度融入图像生成与编辑领域，为电商内容生产与具身智能训练提供全新解决方案。该模型通过理解三维空间关系，实现了对物体位置、角度和视角的精准操控，在多项国际评测中达到领先水平。

传统图像编辑工具在处理空间关系时存在明显短板，例如调整物体位置时易出现比例失调、光影错乱等问题。JoyAI-Image-Edit突破性地将空间编辑作为核心能力，支持15类通用编辑任务的同时，新增物体移动、旋转和视角变换等空间级操作。模型能够解析"向右移动0.3米"或"旋转45度"等精确指令，在电商场景中可快速生成多角度商品展示图，显著降低拍摄成本。实测显示，即使处理毛绒材质等复杂物体，模型仍能保持画面结构一致性。

技术架构方面，该模型采用MLLM+VAE+扩散模型的混合架构，形成"理解-生成-再理解"的闭环流程。空间信息直接参与生成过程，配合300万规模的空间数据集训练，使模型在2D语义感知、3D空间理解和4D时空推理三个维度实现突破。在SpatialEdit-Bench评测中，其空间编辑精度超越Veo3.1等视频世界模型，物体整体得分达0.649，摄像头整体得分0.571。

电商领域成为该技术首个落地场景。服饰类商品可通过模型一键调整折叠角度，家电产品能自动生成不同场景的摆放效果，结合文字标注和背景修饰功能，实现"一次操作完成多需求"的精修效果。某鞋类品牌应用后，商品图生产效率提升4倍，拍摄成本降低60%。在具身智能训练方面，模型生成的空间一致性图像数据可补充真实采集样本，有效解决机器人训练的数据稀缺难题。

京东的AI布局呈现明显的产业导向特征。除图像模型外，其近期开源的JoyAI-LLM Flash模型通过优化算法提升同等参数下的性能效率，降低开发者使用门槛。在基础设施层面，全球最大的具身智能数据采集中心正在建设，结合模型生成能力构建数据闭环。终端落地方面，JoyInside技术已嵌入家电、机器人等产品，实现AI能力与物理世界的直接交互。

更多>同类资讯

亚马逊购物“大丰收”：网友买1块三星2TB SSD竟收到10块

05-17

亚马逊停更旧款Kindle技术支持，用户为保使用选择冒险越狱

05-17

谷歌I/O前夕Veo 4重磅泄露：AI视频“切镜头”升级，叙事生产力迎变革

05-17

谷歌I/O前夕Veo 4泄露，AI视频迎叙事革命，多机位与音频同步成亮点

05-17

杭州揭牌国家人工智能具身智能中试基地 18家龙头企业携手共探多场景应用

05-17

文生视频先驱智象未来：以认知迭代为翼，探索世界模型新边界

05-17

特斯拉FSD V14.3.3更新：智能召唤提速，核心性能与舒适度双提升

05-17

机械师Mini GTR迷你主机上架预约：R7 8745H+16G+1TB 仅售3999元

05-17

荣耀笔记本X14 2026“战斗版”来袭，酷睿5 320处理器搭配轻薄机身登场

05-17

小米曾规划超轻薄Air旗舰，因体验妥协最终未量产引关注

05-17

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

05-17

买一块三星990 PRO 2TB SSD却收到10块：价值3.3万元

05-17

亚马逊将停止为旧款Kindle提供支持，用户纷纷选择越狱设备

05-17

谷歌Veo 4惨遭泄露，视频版“香蕉”9秒封神

05-17

Meta裁员前夜，员工抢零食如末日

05-17

点击查看更多 +

全站最新

蔚来李斌谈换电：非失血点而是潜力股，未来或成重要收入源

比亚迪闪充站建设提速：一周新增55座，覆盖312城年底将达2万座

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

乐道两年跨越培育期：精准布局纯电赛道，以实力开启跃升新篇

爱跑103号赛级燃油亮相！打破进口依赖，国产高性能燃油填补空白

绿意川蜀邂逅硬核江铃大道成都上市会解锁皮卡多元生活新可能

热门内容

本栏最新

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

小米AI大模型密集落地：从“缺位”到“领跑” 构建人车家全生态新图景

2026年PI与PET胶带行业变革：技术驱动下耐温防静电的供应商新选择

小米YU7“火山灰”配色官图亮相！高纯度灰调设计，5月底将正式发布

科大讯飞AI学习机深度评测：护眼设计搭配学习功能，哪款更适合孩子？

科大讯飞智能办公本深度评测：以科技赋能办公高效体验触手可及

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.