滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

京东开源JoyAI-Image-Edit模型：攻克空间难题，赋能多元领域AI应用升级

时间：2026-04-08 11:43:18 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

京东探索研究院近日宣布，其自主研发的图像编辑模型JoyAI-Image-Edit正式开源，成为全球首个深度融合空间智能技术的开源模型。该模型突破传统AI图像处理仅限于平面修改的局限，实现了三维空间重塑能力，其核心推理代码已完全开放，开发者可直接用于各类应用开发。

传统图像模型常因空间逻辑混乱导致物体变形、光影错乱等问题，而JoyAI-Image-Edit通过构建完整的空间理解体系，从相机坐标变换、物体几何控制到多视角一致性维护，系统性解决了这些行业痛点。实验数据显示，该模型在物体移动精度、空间布局合理性等关键指标上已达到国际领先水平，编辑后的图像能自然呈现遮挡关系与光影变化，即使进行视角切换或物体重组，场景结构依然保持高度真实。

该模型的创新性体现在三大核心能力：其一，支持通过自然语言精准控制相机视角，用户可指定偏航角、俯仰角等参数生成新视角图像；其二，具备空间漫游功能，能连续生成逻辑连贯的多视角图像序列，模拟三维场景中的移动观察效果；其三，可对特定物体进行位移、缩放等操作，同时自动调整周边环境的光影与遮挡关系，确保整体场景的物理合理性。这些能力使模型在处理复杂空间任务时表现出色，例如在电商场景中可快速生成多角度商品展示图，在创意设计领域能实现虚拟场景的自由编辑。

除空间编辑突破外，JoyAI-Image-Edit还兼容15类通用图像处理功能，涵盖物体替换、风格迁移、细节优化等高频需求。通过将空间智能与通用编辑能力深度融合，该模型在长文本渲染、多视角一致性生成等复杂任务中展现出显著优势，可满足全场景创作需求。例如在3D模型重建领域，模型能根据单张图片自动推断物体空间结构，生成多视角一致的三维模型；在具身智能视觉感知方面，其空间理解能力为机器人环境感知提供了关键技术支撑。

目前，该模型已开放代码与预训练权重，支持商业与学术用途。其开源特性将加速空间智能技术在电商、设计、机器人等领域的落地应用，特别是为具身智能研发提供了低成本、高效率的视觉处理解决方案。随着开发者社区的参与，JoyAI-Image-Edit有望推动AI图像技术向更复杂的空间场景延伸，重新定义智能图像处理的标准与边界。

更多>同类资讯

字节跳动懂车帝架构大变动：新设部门、人员调任，共促业务新发展

05-21

字节AI时代再崛起：战略清醒、生态配合与组织力共筑新辉煌

紧接着在极短的时间内，字节把内部整个AI品牌体系：包括模型和产品全部统一到"豆包"这一个名字下，并将集团的资源集中到豆包上，阿里到2025年年底才完成了这种统一。这就是字节能在AI时代再出一个豆包的原因—…

05-21

谷歌I/O大会推出Gemini Omni：多模态输入输出，开启AI视频创作新纪元

在正式上线时，用户即可使用上述输入方式进行视频创作，而图像与文本的生成功能则将在后续版本中陆续推出。A：用户可以通过全新改版的Gemini应用体验Omni功能，部分功能还将在Google Flow和YouT…

05-21

抖音“续火花”新玩法：赛博养娃成潮流，用户为火花“拼”出新花样

世超研究了一圈后，发现答案不在多闪里，而在抖音里的一个小功能——续火花。你和好朋友、搭子或者 crush 在抖音里聊天 3天以上，就可以共同领养一个小火人。在多闪 App 里，就能给小火人开通 AI …

05-21

非遗声场溯源、院线技术入户，海信激光电视探索X1 Pro给出客厅影院新答案

5月20日，海信激光电视以“客厅影院·新答案”为主题，举办探索X1 Pro线上新品发布会。海信激光事业部总裁伍发明现场主讲，围绕中国家庭客厅的真实观影痛点，系统呈现新品在画质、声音、护眼、内容、安装五大维度的全面迭代。发布会现场首映了哈尼族多声部民歌纪录片《

05-21

法国法马通布局3D打印：为核电零部件制造带来新变革与新机遇

05-21

AI硬件新突破：未来智能viaim耳机开启“Agent时代”工作新范式

05-21

AI硬件新突破：未来智能viaim耳机开启工作流Agent新范式

05-21

卡帕西再跳槽加盟Anthropic，大模型赛道或迎新变局与激烈角逐

05-21

段永平从“看不懂”到重仓英伟达：AI浪潮下价值投资的新转向

05-21

iPhone15升级iOS26.5实测：续航提升信号稳，流畅控温体验佳

之前iOS26.4.2那续航真的拉胯，掉电快得离谱，我刷一小时抖音都能掉13%多的电！以上就是iPhone15更完iOS26.5的真实使用感受啦，这次更新真的实打实优化了续航，电池更经用了，还把信号和流畅度…

05-21

中国机器人闪耀中东欧市场，机器人ETF华夏(562500)引投资热潮

投资策略上，建议沿“确定性+弹性”两条主线进行配置：一）优先建议配置交付确定性高的头部人形机器人主机厂，重点关注出货节奏领先、商业化落地较快的龙头企业，快速规模化部署后将形成数据-大脑迭代正向飞轮，更有望率先…

05-21

未来智能viaim讯飞智能体耳机发布：开启AI耳机从工具到Agent新征程

如果只看功能列表，这似乎只是viaim讯飞AI会议耳机的一次软件升级；但如果站在公司战略的高度审视，这显然是未来智能一次清晰的跃迁。马啸在演讲中回顾了未来智能的战略演进：1.0时代的AI会议耳机，解决的是…

05-21

小米耳夹式耳机兼容苹果生态来袭，多功能加持带来全新聆听体验

IT之家 5 月 20 日消息，小米手机官方今日宣布小米耳夹式耳机将兼容苹果生态，并公开了新耳机的部分功能：可语音唤醒耳机里的超级小爱支持智能翻译、录音转写、小爱陪伴支持双设备智能连接、苹果物品查找 …

05-21

小米17 Max续航实力出圈，长视频重度测试达33.3小时，影像外观亮点多

今天，小米手机官方继续进行新机发布前的预热剧透，展示了小米17 Max和iPhone 17 Pro Max的长视频重度续航测试对比。参考目前的消息来看，全新的小米17 Max采用超级像素屏幕，小米17 Pr…

05-21

点击查看更多 +

全站最新

雷军透露小米YU7 GT定位高端：性能豪华拉满价格或偏高

小米YU7 GT纽北一骑绝尘！7分34秒931创SUV圈速新纪录

小米YU7 GT配色内饰双揭秘：五款车漆搭配两种豪华内饰风格

小米汽车工程师任周灿：从仿真到纽北，坚守十余载终圆梦创纪录

李肖爽揭秘小米YU7 GT：多款配色内饰吸睛，21英寸轮毂成全系标配

腾扬达科技携全系汽车线束产品亮相重庆展，助力智能汽车产业升级

热门内容

本栏最新

雷军透露小米YU7 GT定位高端：性能豪华拉满价格或偏高

小米YU7 GT纽北一骑绝尘！7分34秒931创SUV圈速新纪录

小米YU7 GT配色内饰双揭秘：五款车漆搭配两种豪华内饰风格

小米汽车工程师任周灿：从仿真到纽北，坚守十余载终圆梦创纪录

李肖爽揭秘小米YU7 GT：多款配色内饰吸睛，21英寸轮毂成全系标配

数智赋能英语课堂思维引领主动阅读——“四季杏坛”杭州场聚焦教学新实践

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.