谷歌旗下AI应用Gemini近期在全球多国应用商店榜单中登顶,包括美国、印度、加拿大及摩洛哥等地,一举打破ChatGPT长期占据的领先地位。这一成绩被业内视为谷歌在生成式AI领域的重要突破,其核心驱动力源于8月推出的图像生成工具Nano Banana——这款免费工具上线不足一月,便推动Gemini新增用户2300万,累计生成图片超5亿张。
Nano Banana的爆发式增长与其高度可玩性密切相关。用户可通过精细提示词实现风格迁移、场景重构等创意操作,例如将普通照片转化为美式证件照、让2D角色化身漫展Coser,甚至生成破碎感肖像或像素风游戏形象。技术层面,该工具支持物体3D全息化、素描姿势精准匹配等复杂功能,还能用于制作微缩模型、城市景观等高难度场景。DeepMind CEO哈萨比斯公开称赞其为“同类最佳”,Vercel等科技公司高管亦在社交媒体分享使用案例。
从应用生态看,谷歌通过Gemini系列逐步构建技术壁垒。Gemini 1.5将上下文处理能力提升至百万量级,2.0版本被评价为“部分超越GPT-4”,2.5 Pro则在代码与逻辑推理领域表现突出。更关键的是,谷歌将AI模型深度整合至搜索、Chrome、YouTube等核心产品,形成覆盖数十亿用户的生态网络。这种“技术+场景”的双轮驱动策略,使其从追赶者转变为行业规则制定者。
行业格局因此发生微妙变化。回溯至OpenAI成立初期,马斯克曾透露其目标之一便是制衡谷歌在AI领域的垄断地位。然而ChatGPT爆红后,谷歌长期处于被动应对状态,Bard等初期产品因体验不佳饱受诟病。此次Gemini反超,恰逢马斯克指控苹果操纵应用排名、偏袒ChatGPT打压竞品Grok,网友戏称谷歌登顶为“打破应用市场操控的实证”。
技术社区正掀起Nano Banana创作热潮。用户开发出多样化提示词模板,涵盖真实摄影(如85mm镜头人像特写)、品牌设计(极简咖啡杯LOGO)、虚拟场景(怪物对战游戏画面)等领域。官方推荐的六大类玩法中,产品摄影提示词需精确到材质描述(如“抛光混凝土上的哑光陶瓷杯”),漫画创作则强调光影对比与叙事张力。这种“提示词工程”的流行,标志着AI工具从功能实现转向艺术表达的新阶段。