备受瞩目的GPT-image-2终于在近期一场直播后正式上线,这款AI图像生成工具一经推出便引发广泛关注。实测结果显示,其表现令人惊叹,效果远超此前的Nano Banana 2,甚至达到了许多用户对后者的预期水平。如今,用户只需在ChatGPT中简单操作,即可直接创建图片,极大降低了使用门槛。
GPT-image-2的强大功能体现在多个方面。以文字渲染为例,这一直是AI图像模型的痛点。过去,无论是DALL-E、Seedream还是Nano Banana 2,在生成包含大量文字的海报时,往往会出现各种问题,难以满足实际需求。而GPT-image-2在中文渲染方面表现出色,不仅能准确生成出师表、报纸、数学试卷等内容,还能代写情书、制作红楼梦关系图,甚至根据职位JD生成招聘海报,为国内用户带来了极大的便利。
在修改精准度方面,GPT-image-2也有了显著提升。以一家公司3D打印的桌面小摆件为例,用户只需提供照片并简单描述需求,GPT-image-2就能生成完美的电商产品抠图主图,白色背景、柔光打光、产品居中、阴影自然。进一步要求生成电商详情页海报时,它能直接输出一整张产品详情长图,涵盖了产品展示、文案说明等多个方面。而在创意生成方面,它也能根据用户提供的经典画面和参考图,生成有趣的新图像,如将《闪灵》经典画面中的角色替换为迪迦奥特曼或用户自己,还能让一群虚拟人物在圆桌对谈,精准呈现各类物品的同时,也展现了较高的创意水平。
审美能力的提升也是GPT-image-2的一大优势。过去,GPT生成的图片在审美上常遭诟病,与Midjourney等工具存在差距。而GPT-image-2生成的图片在审美上有了质的飞跃,具有独特的品味。例如,生成的K-POP女团概念海报,从造型、打光到色调都与主题完美契合,肢体、影子、脸部细节等处理得当,每个人物都有独特的气质。在信息设计方面,它生成的Mariah Carey 90年代生涯图中文信息长图,不仅信息密度高,而且美观准确,展现了出色的信息整合和视觉呈现能力。它在纯艺术方向也有不俗表现,生成的暗黑风格金克斯图像,呼吸感和节奏流畅,具有较高的艺术水准。
GPT-image-2的上线对设计行业产生了巨大冲击。它将画图的门槛进一步降低,使得任何人无需设计基础,只要会表达需求,就能生成高质量的设计作品。然而,画图只是设计的执行层面,设计的核心在于思考和解决问题。面对商业问题和用户需求,设计师需要运用思辨能力,找到最优解并将其视觉化。因此,尽管画图员的时代可能结束,但真正的设计师时代才刚刚开始,这个世界始终需要思考者、创造者和问题解决者。











