近日,一款名为“纳米香蕉”的AI图像工具引发科技圈与创意领域的广泛关注。这款由谷歌推出的Gemini 2.5 Flash Image模型,凭借其强大的图像生成与编辑能力,上线仅一周便完成超2亿次图像操作,成为社交平台热议的焦点。从设计师到普通用户,纷纷在社交媒体分享使用体验,将其称为“AI生图新标杆”“手办定制神器”。
“纳米香蕉”的核心功能远超传统图像工具。它不仅能融合多张图片生成全新画面,还可将二维地图转化为三维景观,甚至理解地理、建筑与物理规则。例如,当用户输入一张气球飘向仙人掌的图片并要求预测后续场景时,模型能精准呈现气球炸裂而仙人掌完好的画面,展现出对物理世界的深度认知。这种能力源于谷歌Gemini大模型的知识储备,与一年前文生视频模型Sora相比,实现了从“拼装零件”到“打造超级跑车”的质变。
用户体验层面,“纳米香蕉”的交互模式堪称革命性。它支持超过100种语言的自然语言指令,识别准确率达92%。用户只需简单描述需求,如“给人物戴上帽子”或“让照片中的人微笑”,模型即可生成高度自然的修改结果。AI狂热者蔡小姐分享道,她上传一张穿着拉丁舞服的照片后,模型迅速生成细节逼真的手办模型图,裙摆褶皱与三维效果均令人惊叹,让她萌生了定制实物的想法。
在创意玩法上,用户脑洞大开:有人用照片生成跨时空合影,有人尝试不同发型效果,还有人通过“火柴人”玩法输入动作草图,让模型生成逻辑连贯的动态画面。小红书平台上,已有用户将AI生成的创意转化为娃衣、手机壳等实体商品,形成销售闭环。以15元成本、68元售价的艺术插画手机壳为例,月销100件即可创造可观利润,彻底改变了传统设计与生产模式。
尽管“纳米香蕉”在手办定制领域表现亮眼,但行业专家指出其局限性。二次元手办企业APEX-toy创始人马力表示,当前手办平均配件超150个,部分复杂款型甚至超过300个,AI尚无法精细还原所有细节。不过,他看好其在潮玩设计领域的潜力,认为该技术可大幅缩短设计周期,降低试错成本。
中国科技企业同样在加速布局。阶跃星辰副总裁李璟透露,其开源图像编辑模型Step1X-Edit已具备同类能力,在语义解析、身份一致性保持与区域级控制上表现突出。演示中,该模型可通过语音指令修改图片元素,如将粽子换成月饼、让人物变老30岁等。李璟强调,多模态大模型的迭代将聚焦智能终端智能体,如汽车、手机与桌面工作助手,未来或带来更颠覆性的应用。
技术竞争日趋激烈。“纳米香蕉”团队坦言,其目标不仅是提升视觉质量,更要追求“聪明”与“事实准确性”,打造能理解用户深层意图的AI。而阶跃星辰正探索“理解生成一体化”架构突破,试图在产品与架构间找到平衡点。这场AI图像领域的角逐,正悄然重塑创意产业的未来格局。