滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

从Nano Banana到五大主线布局：谷歌多模态生态如何重塑AI创作未来？

时间：2025-09-10 14:37:34 来源：钛媒体APP编辑：快讯团队 IP：北京 发表评论无障碍通道

在AI文生图领域，一款名为Nano Banana的神秘模型悄然登场，凭借惊人的图像质量和角色一致性迅速引发关注。这款模型最初以匿名形式出现在全球权威的AI模型竞技场LMArena，用户通过“盲选”投票，使其在文生图和图片编辑榜单上迅速攀升，最终稳居榜首。

关于Nano Banana的猜测一度甚嚣尘上，有人认为它是OpenAI的秘密实验，也有人猜测是独立研究团队的“黑马之作”。直到8月底，谷歌正式认领这一模型，揭晓其真实身份——Gemini 2.5 Flash Image。作为Gemini 2.0 Flash的升级版，Nano Banana不仅在多次编辑中保持角色和画面的高度一致，还支持自然语言驱动的精细局部修改和多图合成，成为更贴近真实工作流的AI编辑器。

Nano Banana的核心突破在于“交替生成”的新范式。通过将复杂指令拆分为多个小步骤，模型在每一步仅做微小调整，如先换服装再改背景，最终叠加所有修改。这一设计避免了传统模型“一次性乱改”导致的“失忆”问题，使主体特征在多轮编辑中始终保持稳定。例如，用户可将照片中的外套颜色从蓝色改为红色，或调整人物姿势，而面部特征和整体比例不受影响。

在多图融合方面，Nano Banana展现了强大的场景整合能力。传统模型在合成两张图片时，常出现风格不协调、空间扭曲或细节丢失的问题，而Nano Banana可自动处理不同图像间的逻辑一致性。例如，将一张人物照片与一张海滩背景图融合时，模型能确保人物的光影、比例与背景自然匹配，甚至调整人物姿态以适应新环境。用户可通过自然语言指令完成“将人物移至巴黎”“替换背景为雪山”等操作，无需手动绘制蒙版或使用专业工具。

自然语言驱动的精准修改是Nano Banana的另一大亮点。用户只需简单描述需求，如“移除照片中的人物”“改变背景为森林”或“调整人物表情为微笑”，模型即可在保持其他部分不变的前提下完成修改。甚至，用户可通过简笔画或草图替代文字指令，进一步降低操作门槛。例如，用户绘制一个简笔画姿势，模型能将其精准应用到人物照片中，生成符合逻辑的新图像。

在多轮对话式编辑中，Nano Banana支持上下文记忆功能。用户可逐步提出修改需求，如先调整房间颜色，再添加家具，最后改变灯光效果，模型会记住所有历史操作，避免重复或冲突。用户还可尝试风格混配，如将花瓣纹理应用到鞋面，或将蝴蝶翅膀图案转化为裙子设计，生成兼具创意与实用性的图像。

安全性方面，谷歌为Nano Banana生成的图片添加了可见水印和不可见的数字水印SynthID，确保作品可追溯。这一设计不仅保护了原创内容，也为AI生成内容的版权管理提供了新思路。

目前，普通用户可通过Google Gemini应用程序、Google AI Studio、Gemini API和Vertex AI平台调用Nano Banana，Adobe、Lovart等平台也已将其集成至创意工具中。其生成速度极快，用户输入指令后仅需数秒即可完成出图或修改。例如，将一张游客照背景替换为马尔代夫海滩，或调整宠物毛色为藏獒，均可在短时间内实现。

尽管Nano Banana在角色一致性和多图融合方面表现突出，但仍存在部分局限。例如，在中文指令处理中，模型可能生成乱码或错误理解需求；在复杂多轮对话中，模型可能丢失上下文，导致生成结果偏离预期。用户反馈其图片分辨率有待提升，艺术性较Midjourney等模型稍显不足。不过，考虑到其单张图像生成成本仅0.039美元（约合人民币0.3元），这一性价比仍受到广泛认可。

Nano Banana的发布标志着谷歌在多模态AI领域的进一步布局。从文生图的Imagen系列、文生视频的Veo系列，到交互世界生成的Genie系列，谷歌已构建起覆盖图像、视频、虚拟世界的完整产品矩阵。未来，谷歌或通过Gemini底座整合更多模型能力，面向普通用户打造多模态超级入口，同时为专业开发者提供纵深服务。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

台积电8月营收成绩亮眼：环比增长3.9%，前八月累计同比增37.1%

09-10

“泄密惯犯”王腾遭辞退，小米公司治理短板与制度刚性之思

09-10

投行看好iPhone Air：设计革新或推动升级周期，苹果目标股价获上调

09-10

苹果watchOS 26更新：老款Apple Watch将获高血压警报，助力心血管健康监测

09-10

苹果iPhone Air上手体验：5.6mm纤薄机身，圆润边角设计握感轻巧又舒适

09-10

苹果iPhone 17 Pro美版因毫米波信号，顶部增设玻璃开孔与相机键“错位”

09-10

苹果秋季发布会AI“隐身”：硬件成主角，AI幕后发力难成焦点

09-10

小米卢伟冰评iPhone 17：标准版高刷亮眼，Air或掀超薄机热潮，Pro设计引热议

09-10

云锋金融豪掷3亿购ETH布局Web3，马云退休后动作频频引关注

09-10

高德地图9月10日推新功能“高德扫街榜”，美食景点酒店等一榜尽览

09-10

彭博亲测iPhone 17系列：设计革新与性能提升，多款新机或成换机优选

09-10

iPhone 17系列天猫官旗全球首发！享国家补贴、24期免息，最快30分钟送达

09-10

苹果秋季发布会“放大招”：iPhone等新品告别“挤牙膏”，耐用与功能双升级

09-10

一加李杰发文欢迎苹果入局高刷，一加新品还将迈向“超高刷时代”

09-10

iPhone 17系列登场苹果旧机“以旧换新”抵扣价更新：最高可抵6550元

09-10

点击查看更多 +

全站最新

金秋九月首周宏光MINIEV热销超万辆登顶中国车市单一车型销量冠军

长安启源A07超长蓝鲸版上市 12.99万起售续航超强还配L2+级智驾

中汽中心新能源检验中心推出“氢能技术验证HyTA” 助力氢能产业高质量发展

国产新世代BMW iX3“自虐式”测试：极端环境锤炼稳定高效，安全守护智能驾趣

2026款腾势N9 9月17日上市新增双拼车色科技配置与豪华体验双重进阶

米其林森林守护计划再启航内蒙古阿尔山续写绿色篇章共筑生态与公益新桥梁

热门内容

本栏最新

投行看好iPhone Air：设计革新或推动升级周期，苹果目标股价获上调

苹果watchOS 26更新：老款Apple Watch将获高血压警报，助力心血管健康监测

苹果iPhone Air上手体验：5.6mm纤薄机身，圆润边角设计握感轻巧又舒适

苹果iPhone 17 Pro美版因毫米波信号，顶部增设玻璃开孔与相机键“错位”

苹果秋季发布会AI“隐身”：硬件成主角，AI幕后发力难成焦点

小米卢伟冰评iPhone 17：标准版高刷亮眼，Air或掀超薄机热潮，Pro设计引热议

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.