滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

谷歌“纳米香蕉”AI模型引热议，“用嘴P图”受追捧，国产AI如何接招？

时间：2025-09-06 20:14:27 来源：文汇报编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域又迎来一位“新星”——代号“纳米香蕉”的AI图像模型，凭借其强大的功能与便捷的操作，迅速在社交媒体上引发热议。科技爱好者、设计师及内容创作者纷纷在各大平台分享使用体验，有人称其为“AI生图界的黑马”，也有人赞其“重新定义了P图方式”。短短一周内，该模型累计完成超2亿次图像编辑，成为近期最受关注的AI工具之一。

这款引发关注的模型，实为谷歌推出的Gemini 2.5 Flash Image。与传统图像生成工具不同，它不仅能将多张图片融合成全新画面，还能精准解析地理、建筑及物理结构，甚至将二维地图转化为三维景观。用户只需上传照片，即可实现跨时空合影、发型变换、三维景观生成等创意玩法。其中，最受欢迎的功能当属“照片转手办”——无论是真人、动漫角色还是宠物，都能通过模型生成细节逼真的三维模型，大批用户直呼“想立刻拥有”。

AI爱好者蔡小姐分享了她的使用体验。她提到，模型最令人惊喜的是“对话式修图”能力。用户无需输入复杂指令，只需用自然语言描述需求，模型便能快速完成编辑。例如，她上传一张冬季人像照，要求让人物露出笑容，模型迅速生成了一张表情自然、阳光灿烂的新照片。照片转手办功能也让她印象深刻——上传一张拉丁舞服照片后，模型不仅还原了裙摆的复杂细节，三维效果也十分出色，仿佛“从屏幕中跳了出来”。

“纳米香蕉”的火爆，离不开其背后强大的技术支撑。据介绍，该模型在图像一致性上实现了断层式领先。用户上传一张人物照片后，模型可生成8种表情、不同角度或背景的变体，甚至转化为三维图像，人物形态始终保持稳定。在连续20次编辑操作中，字符一致性准确率超过95%。上海人工智能研究院技术总监方帅指出，这一表现源于模型对图像理解能力的显著提升——谷歌将Gemini大模型的知识储备应用于图像生成，使其能更精准地解析物理规则。例如，当输入“气球飘向仙人掌”的图像并要求预测后续画面时，模型会正确显示气球炸裂、仙人掌完好的结果，而此前同类模型常出现逻辑错误。

交互模式的革新也是“纳米香蕉”的一大亮点。模型支持超过100种语言的自然语言指令，识别准确率达92%。用户输入“给他戴上帽子”，模型会立即输出戴帽人物照；输入多张照片后，用火柴人画出动作，模型还能生成逻辑自洽的动态图，如“一人踢腿进攻，一人蹲下防守”。这种“所见即所得”的交互方式，让AI应用更贴近用户想象。

“纳米香蕉”的走红，也推动了AI技术的商业化落地。在小红书等平台，已有用户将创意转化为娃衣、饰品、手机壳等实体商品，通过模型自带店铺完成销售闭环。例如，一款成本15元、售价68元的艺术插画手机壳，月销100件即可创造可观利润。设计师们也开始采用“AI先行”模式——先输出海量图片，用流量测试市场反应，再生产实体产品。

不过，AI生成手办仍面临挑战。二次元手办企业APEX-toy创始人马力指出，当前手办平均配件数量达150个，复杂款甚至超过300个，AI尚无法精细还原所有细节，“但潮玩设计可能会率先受益”。与此同时，国内企业也在加速布局。阶跃星辰副总裁李璟透露，其开源图像编辑模型Step1X-Edit已具备同类能力，在语义解析、身份一致性保持及区域级控制上表现突出。例如，用户可通过语音修改图片元素——将粽子换成月饼、让人物变老30岁，或调整发型、衣服颜色等。

李璟还表示，Step1X-Edit与“纳米香蕉”的技术路线不谋而合，但视频、图像类交互产品的多模态大模型仍需大量迭代。未来，智能终端智能体（如汽车、手机及桌面工作助手）将成为应用核心。阶跃星辰正探索“理解生成一体化”的架构突破，以期带来更颠覆性的AI体验。目前，先做产品还是先做架构尚未有定论，但竞争已愈发激烈。“纳米香蕉”团队坦言，其目标不仅是提升视觉质量，更要追求“聪明”与“事实准确性”，打造能理解用户深层意图的AI，甚至超越人类表现。

更多>同类资讯

中国科研新发现：植物干细胞功能维持机制被破解助力农业创新发展

探索这一核心问题，不仅是植物科学研究的重要前沿，也将为提高作物产量、改良果蔬品质、增强林木环境适应性开辟全新的理论框架与技术途径。细胞壁作为植物细胞的“外骨骼”，其力学特性在干细胞调控中扮演着核心角色。相关研…

12-05

斯坦福MIT联合推出ReCAP推理框架，长任务性能跃升开启AI新篇

来自斯坦福大学与MIT的研究团队给出了肯定答案，正式发布的AI Agent推理新框架——ReCAP（递归上下文感知推理与规划），从真正意义上统一了序列推理和层级推理，在多种任务中全面战胜了ReAct，且继承…

12-05

黄仁勋的危机感：5万亿市值背后，是“怕破产”的持续驱动力

【环球网科技综合报道】12月5日消息，日前英伟达CEO黄仁勋在最新访谈中披露的工作状态引发热议：他每周工作7天连节假日也无休，凌晨4点就查邮件，始终被“怕公司破产”的焦虑驱动。外媒报道称，这份危机感源于其…

12-05

AWS Graviton 5亮相：不盲目追新，以务实设计引领云端服务新变革

我们三易生活就在现场与AWS副总裁暨杰出工程师AliSaidi进行了一次深入的沟通，并由此得知了关于他们最新款自研处理器的相关信息，以及AWS方面在处理器研发思路上的一些细节。此外Ali Saidi还专…

12-05

边界智能携手多方制定区块链标准，推动可信数据流通与行业规范发展

国际权威机构 IEEE（国际电气与电子工程师学会）正式发布「基于区块链和分布式账本技术的可信数据流通」标准。国内区块链领军企业边界智能携手支付宝、中国移动、中国电信、香港理工大学、浙江大学等行业巨头与顶尖高…

12-05

黄仁勋：我每天都在担心英伟达倒闭

12-05

高德发布“AI停车雷达” 可实时感知道路停车位状态

12-05

商业航天热度攀升！超捷股份领涨，亚轨道试验与太空算力引领新机遇

市场炒作焦点集中在商业航天赛道的细分逻辑延伸与技术突破，一是太空算力作为商业航天下的新细分方向受到资金关注，二是中科宇航亚轨道飞行试验即将开展，核心回收技术验证进展引发产业落地预期，三是卫星互联网产业生态大…

12-05

乐高2026新套装来袭：632零件打造SLS火箭，摇柄转动模拟真实发射分离

为了保证机械结构的连贯性，乐高微调真实流程，例如真实火箭中的中止系统塔会在猎户座飞船分离前抛弃，而积木中则略有不同。Kegger同时打趣道，当反向转动摇柄让火箭复位时则没有声音，因为真实的 SLS 火箭“显…

12-05

黄仁勋：我每天都在担心英伟达倒闭

12-05

寒武纪：关于产品、客户等相关信息，均为不实信息

12-05

饿了么今日起全面更名为淘宝闪购

12-05

景德镇手艺人杨瑞琦：用金缮锔瓷，让15000件破碎瓷器重获新生

12-05

寒武纪被传明年大幅提产致股价异动深夜辟谣机构仍看好国产替代前景

12-05

贵州茅台原董事长张德芹履新卸任茅台后赴贵州省工商联分管党组工作

12-05

点击查看更多 +

全站最新

任正非最新万字座谈：AI应用为要，鼓励青年探索，寄望时代新力量

“饿了么”App焕新升级为“淘宝闪购” 深度融入阿里“大消费平台”战略

京东“TGT燃力之旅”启幕，与青年技术人才共绘AI时代新蓝图

大卖场辉煌不再：成本高、竞争烈、需求变，关店潮涌动时代变迁

淘宝闪购接棒饿了么：阿里大消费赛道再发力，外卖业务迎新篇

卢伟冰透露小米AI布局：压强式投入，罗福莉助力奔赴AGI未来

热门内容

本栏最新

斯堪尼亚国产Super卡车如皋交付助力客户高效运营把握市场机遇

马路“单黄线”与“双黄线”差异大，车主了解清楚行驶更安全

WebGIS项目开发全流程解析：从数据准备到部署维护的五大阶段

中小企业建站新选择：自助建站低成本高效益，轻松开启线上业务新篇章

一加Ace 6T开箱体验：高性能芯片搭配超长续航，质感与实力并存

元保2025年Q3财报：营收利润双增新保单量与技术实力同步提升

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.