阿里巴巴近日正式推出新一代图像生成与编辑模型Qwen-Image-2.0,其核心能力被概括为“准多齐美真”五大特点。在发布会上,千问视觉生成项目负责人吴晨飞通过线上演示展示了该模型在文字渲染、指令响应、排版设计等方面的突破性表现。
演示环节中,Qwen-Image-2.0成功生成了包含《兰亭集序》全文的图像作品,不仅精准还原了王羲之小楷的书法特征,更在人物场景构建上保持了高度协调性。该模型支持单次输出1K tokens的文字内容,在汉字结构处理和古文排版方面展现出显著优势,解决了传统图像生成模型在复杂文本呈现时的失真问题。
在专业评测领域,Qwen-Image-2.0以1029分的成绩位列AI Arena文生图榜单第三名,超越了Seedream4.5和Flux2-Max等主流模型,仅落后于谷歌Nano Banana Pro和GPT Image1.5。这一成绩印证了其作为千问大模型图像生成底座的实力,标志着国产AI在多模态领域的技术积累已达到国际先进水平。
值得关注的是,就在阿里巴巴发布新模型的同日,字节跳动宣布将其图像生成模型Seedream升级至5.0版本。两大科技巨头在生成式AI领域的同步发力,预示着图像生成赛道将迎来更激烈的技术竞争。业内人士分析,随着模型参数规模和训练数据的持续扩大,未来图像生成技术的比拼将聚焦于细节真实度、文化理解深度和场景适配能力等维度。











