谷歌近日推出全新图像生成模型Nano Banana 2,在分辨率、生成一致性及多语言支持方面实现显著突破。该模型基于Gemini 3.1 Flash Image架构升级,图像输出分辨率从2K提升至4K,同时优化了文本渲染精度与画面元素融合能力。据实测反馈,此前版本存在的中文字符乱码、语义错乱及画面伪影等问题已得到大幅改善。
技术整合方面,Nano Banana 2融合了Gemini Flash的极速响应特性与Nano Banana Pro的庞大知识库,支持在单一工作流中保持最多5个角色形象的一致性,并可实现单张画面内14个元素的有机融合。模型创新性地引入实时网络搜索功能,可动态调用最新信息辅助图像生成,同时支持图像内文本的精准翻译与多语言渲染。
在应用场景拓展上,该模型将覆盖Gemini应用、谷歌搜索(AI模式与Lens)、Google AI Studio等12个核心产品平台,服务范围扩展至141个新增国家和地区,并支持8种新语言环境。其中,Gemini应用将默认启用Nano Banana 2替代原Pro版本,但专业版与旗舰版订阅用户仍可通过菜单选项切换回旧版模型。
据开发团队披露,新模型通过改进的注意力机制与多模态对齐算法,显著提升了复杂场景下的元素协调性。在涉及多人物互动或混合文化元素的测试案例中,系统展现出了更强的语义理解能力,能够准确呈现不同语言背景下的视觉表达需求。这一升级或将推动生成式AI在广告设计、教育内容制作等领域的深度应用。






