近期,科技界迎来了一项重大突破,谷歌DeepMind宣布推出其最新一代AI图像生成与编辑模型——Gemini 2.5 Flash Image,内部代号“Nano Banana”。这一创新成果不仅已开放预览,更预示着数周后稳定版的即将面世。在严苛的测试环节中,Gemini 2.5 Flash Image凭借其卓越的角色一致性与精准编辑能力,荣获“全球最高评分编辑模型”的美誉。
在经济性方面,Gemini 2.5 Flash Image也展现出了竞争力。其定价策略为每百万输出token收费30美元,相较于OpenAI同类模型每百万token 40美元的价格,这无疑为用户提供了更具吸引力的选择。具体到每张图像,其消耗约为1290 token,换算下来仅约0.039美元,进一步降低了使用成本。
Gemini 2.5 Flash Image在图像质量、编辑控制及应用场景上均实现了显著飞跃。它支持多图合成、多轮次修改以及风格迁移等复杂操作,极大地拓宽了用户的创作边界。为了更直观地展示模型的能力,谷歌DeepMind还贴心地开发了可定制的模板应用,使用户能够轻松体验角色一致性、基于提示的精准图像编辑、融入现实世界知识以及多图像融合等强大功能。
随着AI图像模型逐渐成为科技巨头们竞相追逐的核心领域,OpenAI、meta、Black Forest Labs等企业纷纷加码布局。谷歌此番推出Gemini 2.5 Flash Image,旨在缩小与OpenAI在用户规模上的差距。据统计,ChatGPT的周活跃用户已突破7亿大关,而Gemini的月活跃用户则达到了4.5亿,两者间的竞争愈发激烈。
谷歌DeepMind的这一力作,无疑为AI图像生成与编辑领域树立了新的标杆。随着技术的不断进步与应用的日益广泛,我们有理由相信,Gemini 2.5 Flash Image将在未来为用户带来更多惊喜与可能。