ITBear旗下自媒体矩阵:

通义千问发布200亿参数图像生成模型Qwen-Image,中文文本渲染领先

   时间:2025-08-05 14:07:15 来源:证券时报编辑:快讯团队 IP:北京 发表评论无障碍通道
 

近日,通义千问宣布了一项重大进展,正式推出了其首个开源图像生成基础模型——Qwen-Image。该模型基于MMDiT架构,拥有惊人的200亿参数,标志着通义千问在图像生成领域迈出了坚实的一步。

Qwen-Image在文本渲染方面展现出了非凡的能力,它能够支持中英文多行段落级的高保真文本渲染,无论是复杂场景还是细粒度细节,都能处理得游刃有余。这一特性使得Qwen-Image在海报设计、PPT页面制作等领域具有广泛的应用前景。

尤为Qwen-Image在图像编辑方面同样表现出色。通过增强的多任务训练范式,Qwen-Image在编辑过程中能够保持内容的一致性,为用户提供了更加便捷、高效的图像编辑体验。这一能力的实现,无疑将进一步推动图像生成技术的发展。

在多个公开基准测试中,Qwen-Image均取得了令人瞩目的成绩。特别是在文本渲染基准上,如LongText-Bench、ChineseWord和TextCraft等,Qwen-Image更是大放异彩,尤其是在中文文本渲染方面,其表现远超现有模型。这一系列优异的成绩,充分证明了Qwen-Image在图像生成领域的领先地位。

Qwen-Image还具备强大的泛化能力,能够准确渲染包含复杂文本和图像组合的场景,如海报、广告、宣传册等。这一特点使得Qwen-Image在广告设计、媒体制作等领域同样具有巨大的应用潜力。

随着Qwen-Image的开源发布,相信将有更多的开发者加入到这一领域的研究中来,共同推动图像生成技术的不断创新与发展。通义千问的这一举措,无疑为整个行业注入了新的活力与动力。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version