谷歌近期在生成式AI领域迈出了重要一步,通过Gemini API平台正式推出了其最新的文本生成图像模型——Imagen4。这一创新成果不仅标志着AIGC技术的一次重大飞跃,也为开发者们带来了全新的高质量视觉内容创作工具,据谷歌官方博客及社区用户的积极反馈显示。
为了满足不同需求,Imagen4提供了两种规格:标准版Imagen4和高级版Imagen4Ultra,分别定价为每张图像0.04美元和0.06美元。目前,这两款模型已在Gemini API及Google AI Studio上线,并提供付费预览服务,同时开放了一定数量的免费试用名额供开发者体验。
与前代模型Imagen3相比,Imagen4在文本到图像的渲染质量上实现了显著提升,能够生成高达2K分辨率的图像,并支持从写实到抽象等多种艺术风格的创作。尤为其“快速模式”将生成速度提高了10倍,极大地满足了高效创作的需求。而Imagen4Ultra则专为需要高精度提示对齐的场景设计,如广告设计和出版物制作等,提供了更为精细的控制能力。
谷歌还采取了一项重要措施,即为所有通过Imagen4生成的图像嵌入SynthID数字水印。这一举措不仅确保了生成内容的可追溯性,还有助于打击虚假信息的传播,维护信息的真实性和可信度。
开发者们现在可以通过Google AI Studio免费试用Imagen4,或者选择在Gemini API中集成该模型,以便快速构建出具有创新性的应用。自Imagen4发布以来,社区内的反响极为热烈,众多开发者将其誉为“文本生成图像领域的新标杆”,并对其在创作效率和质量上的提升给予了高度评价。