ITBear旗下自媒体矩阵:

阿里推出Qwen-Image-Edit,图像编辑新利器或颠覆PS地位

   时间:2025-08-19 11:45:30 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

近日,阿里巴巴推出了Qwen-Image-Edit,这是一款基于其先前发布的Qwen-Image图像生成基础模型的图像编辑版本。这一新工具的问世,或许预示着图像处理领域将迎来一场革新。

Qwen-Image-Edit依托于一个拥有200亿参数的Qwen-Image模型进行进一步训练,将原本用于文本渲染的能力扩展至图像编辑领域。它不仅能够实现图像中文字的精准编辑,还通过结合Qwen2.5-VL(用于视觉语义控制)和VAE Encoder(用于视觉外观控制),赋予了用户同时进行语义与外观编辑的能力。

在实际应用中,Qwen-Image-Edit展现了其强大的双重编辑功能。用户不仅能够进行低阶的视觉外观编辑,如添加、删除或修改图像元素,同时保持其他区域不变;还能实现高阶的视觉语义编辑,比如IP创作、物体旋转、风格迁移等,这些操作允许整体像素变化,但语义保持一致。例如,用户可以在一张风景照中添加一块指示牌,并指定牌上的文字为“Welcome to Penguin Beach”,Qwen-Image-Edit不仅能准确生成指示牌,还会为其添加自然的倒影。

Qwen-Image-Edit还支持中英文双语文字编辑,用户可以直接在图片上增减或修改文字,同时保留原有字体、字号和风格。这一特性使得图像中的文字编辑变得更加灵活和精确。

在多个公开基准测试中的评估显示,Qwen-Image-Edit在图像编辑任务上具备最佳表现(SOTA)性能。目前,用户可以通过访问Qwen Chat(chat.qwen.ai)并选择“图像编辑”功能来体验这一强大的图像编辑基础模型。实测表明,Qwen-Image-Edit在文字生成、视角切换、场景创设、背景变幻等方面都能生成较为精准的结果,并且主体保持较高的一致性,光线和质感也会随场景自然变化。

Qwen-Image-Edit的语义编辑功能在IP内容创作方面展现出巨大潜力。通过输入简单的文字提示,用户可以轻松生成不同场景下的IP形象,这些形象在形态上保持一致,但背景和动作却丰富多样。例如,以Qwen的吉祥物水豚为例,用户可以通过输入对应的文字提示,生成水豚在不同场景下的图片,这些图片虽然像素大部分不同,但水豚的形态一致性得到了完美保留。

除了语义编辑外,Qwen-Image-Edit的外观编辑功能也同样强大。用户可以在不改变图像其他区域的前提下,添加、移除或修改特定元素。例如,用户可以从图像中去除细发丝或其他小物体,或者修改图像中特定字母的颜色。外观编辑在调整人物背景或更换服装等场景中也有广泛应用。

Qwen-Image-Edit的精准文本编辑能力也是其一大亮点。这得益于Qwen-Image在文本渲染方面的深厚功底。用户可以直接在图像上编辑中英文文本,无论是大标题还是细小复杂的文本元素,都能进行精确调整。这一特性使得图像中的文字编辑变得更加简单和高效。

尽管Qwen-Image-Edit在图像编辑方面展现出了强大的能力,但目前其使用次数仍有限制,不能无限使用。在连续多轮修改中,其编辑的精准性和一致性仍有待提高。尤其是在处理更复杂字体如草书时,Qwen-Image-Edit仍存在一定的局限性。然而,随着这一能力的持续迭代和优化,我们有理由相信,Qwen-Image-Edit将推动图像生成领域的发展,降低视觉内容创作的技术门槛,并激发更多创新应用。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version