阿里发布Qwen-Image开源图像模型，中文渲染能力卓越，精准应对复杂排版挑战

时间：2025-08-05 14:30:06 来源：智东西编辑：快讯 IP：北京 发表评论无障碍通道

近日，阿里巴巴宣布开源了其通义千问系列中的首个图像生成基础模型——Qwen-Image。这款模型在复杂文本渲染和多场景适应性方面表现出色，标志着国产图像生成技术迈出了重要一步。

Qwen-Image以其强大的文本处理能力脱颖而出，不仅能够准确生成不同语种和风格的文字，还能模拟书法笔触，甚至直接生成包含文本和图像的PPT页面。在展示案例中，Qwen-Image不仅精准还原了“宫崎骏”风格，还根据构图景深变化，将“云存储”、“云计算”等字样自然融入画面。

在英文内容生成方面，Qwen-Image同样表现出色。根据英文提示词，它成功创建了一个书店橱窗场景，不仅准确还原了所有指定文字，还为每本书生成了风格化的字体和封面，与书名相得益彰。

除了文本处理，Qwen-Image在通用图像生成方面也展现出了强大的能力，支持从照片级写实到印象派绘画等多种艺术风格。其20B的参数规模和多模态扩散Transformer（MMDiT）架构，使得模型在图像生成和文本渲染方面均达到了SOTA（最佳表现）水平。

阿里千问团队在多个公开基准上对Qwen-Image进行了评估，结果显示，该模型在通用图像生成和图像编辑测试上均超越了包括Flux.1、BAGEL、SeedDream 3.0和GPT Image 1（High）在内的多个开源和闭源模型。特别是在中文文本渲染方面，Qwen-Image大幅领先现有最先进模型。

Qwen-Image的技术报告已同步开源，详细揭示了模型的具体技术实现。该模型架构由三个核心组件构成：Qwen2.5-VL多模态大语言模型作为条件编码器，Wan-2.1视频生成模型的VAE作为图像分词器，以及多模态扩散Transformer作为主干扩散模型。三者协同工作，实现了从文本到图像的精准生成。

为了提升模型的生成能力，阿里团队构建了一套涵盖数十亿规模图文对的数据集，并通过七阶段渐进式数据过滤和课程学习策略，逐步增强模型的细节表现力和文本渲染能力。团队还设计了高效的分布式训练框架和混合并行策略，以应对模型巨大的参数量和数据量。

在图像编辑方面，Qwen-Image支持风格迁移、增删改、细节增强、文字编辑和人物姿态调整等多种操作。通过统一的多任务框架，模型能够支持文本到图像和图文到图像等多种生成模式，满足用户多样化的需求。

目前，Qwen-Image已在魔搭和Hugging Face等社区开源，普通用户可在QwenChat中选择图像生成功能，直接体验这款先进的模型。随着阿里持续开源图像模型，其可用性将得到进一步提升，为图像生成技术走入真实生产场景奠定坚实基础。

我国科学家近日在光通信和6G领域取得突破性进展，在国际上率先实现光纤通信和无线通信系统间的跨网络融合，自主研发的“光纤—无线一体化融合通信系统”的数据传输速率刷新纪录。王兴军表示，新系统在6G基站、无线…

我国科学家近日在光通信和6G领域取得突破性进展，在国际上率先实现光纤通信和无线通信系统间的跨网络融合，自主研发的“光纤—无线一体化融合通信系统”的数据传输速率刷新纪录。王兴军表示，新系统在6G基站、无线数…

量子互联网常常与量子计算相提并论，但它是一个独立的概念，它将提供无懈可击的安全性、强大的分布式计算能力，以及超越经典网络能力的应用。通过在遥远设备间分发纠缠态，我们能够实现经典网络无法提供的通信形式。量子互…

【CNMO科技消息】2月21日，据外媒报道，iQOO新机Z11X5G（型号I2507）已通过泰国国家广播和电信委员会（NBTC）的认证，这表明该设备在泰国市场的发布已临近。值得一提的是，这并非iQOO Z…

翟志刚在太空中挥舞的国旗，成为了中国航天员迈入太空的重要象征。不论是翟志刚，还是杨利伟，他们都在中国航天史上留下了辉煌的一笔。作为13位登上太空的中国航天员中的两位航天英雄，他们的名字永远铭刻在祖…

春节期间，SKA中频天线副总设计师杨晋蓉同样坚守在国内的办公室里，每天通过视频会议跟踪南非现场的建设进度，梳理工作计划、提供技术支持。 “在建设的过程中，我们不仅向国际团队分享技术经验、贡献中国智慧，也从他们…

可以说，今年的载人航天任务充满了新亮点，除了梦舟一号的首飞之外，神舟二十三号飞行任务中将有一名航天员执行超过一年任务，而神舟二十四号飞行任务中，还可能会有外籍航天员参与。在没有特殊情况的情况下，新的航天…

简单来说，这颗“太阳女神粒子”的轨迹很可能被宇宙磁场扭曲得七零八落，误导了我们对它起点的直觉判断。此外，追溯高能宇宙线的来源也有助于检验我们对银河系与星系间磁场的理解：这些看不见的力场如何弯曲带电粒子轨迹，…

写福字、品年夜饭、亲手烤制太空蛋糕，航天员们在距离地球四百公里的天宫之上，欢度春节并为全国人民送上来自宇宙的新春祝福。指令长张陆是第二次在太空过春节了，这个除夕夜，他再次挥毫写福字。对第一次在天宫过年的武…

一项新的科学研究表明，已知的非生物过程可能不足以解释美国国家航空航天局好奇号火星车采集的一块火星岩石样本中发现的有机物质的数量。这些仅由碳和氢组成的碳氢化合物是迄今为止在火星上发现的最大有机分子。由于这一局…

据新华社电新春佳节将至，神舟二十一号航天员乘组贴春联、写福字，把中国人的太空家园装扮得红红火火，并以“宇宙级”浪漫遥祝祖国兴盛、人民安康。这是中国空间站全面建成后迎来的第四个春节。这一次，3名航天员既能吃…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.