近期,AI图像生成领域再掀热潮。继ChatGPT带动“吉卜力风格”“像素风格”AI绘图流行后,海外用户又开发出利用Gemini 2.5 Flash Image(开发代号Nano Banana)将照片转化为手办模型的创意玩法。
谷歌近日已正式上线该模型,用户通过Gemini首页即可使用“用Imagen生成图像”功能(按钮标识带有香蕉表情)。这一更新省去了此前需进入Google AI Studio的步骤,用户可直接输入提示词并上传照片生成3D手办效果图。
以实际操作为例,用户输入英文提示词:“请将此照片转化为手办模型。模型后方应放置一个带有半透明塑料视窗的纸盒,盒面印有照片中的人物形象。模型需摆放在圆形塑料底座上,要求清晰呈现PVC材质质感,背景建议为室内场景。”系统即可根据指令生成对应图像。
作为谷歌当前最先进的图像生成模型,Gemini 2.5 Flash Image于8月26日正式发布。企业用户可通过Vertex AI平台调用该服务,其定价体系为每百万输出token收费30美元。具体到单张图像生成,系统按1290个输出token计费,折合每张约0.039美元(按当前汇率约合0.28元人民币)。除图像输出外,其他输入输出模态的计价均沿用Gemini 2.5 Flash标准。