滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

Nano Banana不会应试！指标拉垮，视觉效果惊艳，实测14个任务

时间：2026-01-04 18:45:47 来源：新智元编辑：快讯 IP：北京 发表评论无障碍通道

最新报告探讨了生成式模型Nano Banana Pro在低层视觉任务中的表现，如去雾、超分等，传统上依赖PSNR/SSIM等像素级指标。研究发现，Nano Banana Pro在视觉效果上更佳，但传统指标表现欠佳，因生成式模型更追求语义合理而非像素对齐。报告还提出改进方向和新评测范式的思考，强调生成式模型虽有潜力，但与专用模型仍有差距。

过去几年，文本生成图像（T2I）与多模态生成式模型的能力突飞猛进，已经能稳定地产生高质量、具备细节与语义一致性的图像内容。

报告关注的核心矛盾在于：这些「擅长生成」的模型，是否也能在传统低层视觉任务中充当通用求解器（generalist）？

低层视觉（low-level vision）通常强调对图像退化的「精确逆过程」：例如去雾、超分、去噪、去雨、去模糊、去反射、去光晕等。

这类任务的经典评价方式往往依赖 PSNR/SSIM 等参考指标，强调像素级一致性。但生成式模型天生带有「补全/重建」的倾向：它们可能会依据先验去「合理地编造」高频细节，从人眼观感看更清晰、更「像真的」，却在像素对齐意义上偏离GT。

华中科技大学的研究人员最近发布了一篇报告，把这种冲突概括为「人类感知偏好 vs. 传统指标导向」的张力。

报告中提出一个非常直接的问题：Nano Banana Pro能否成为低层视觉全能选手？

报告采用了一个刻意「极简」的使用范式：不训练、不微调，只用「输入图 + 简单文本 prompt」直接让Nano Banana Pro输出结果，对其进行zero-shot基准评测。

零样本+文本提示14个低层任务的系统基准

研究人员把评测扩展到14个低层视觉任务、40个数据集，覆盖三大类能力：图像恢复（restoration）、图像增强（enhancement）、图像融合（fusion）。

任务清单包括：Dehazing、Super-Resolution、Deraining、Deshadowing、Motion Deblur、Defocus Deblur、Denoising、Reflection Removal、Flare Removal、Low-Light Enhancement、Underwater Enhancement、HDR Imaging、Multi-focus Fusion、Infrared-Visible Fusion；

图中用颜色区分了restoration / enhancement / fusion三类任务。

保守估测性能

报告特别强调：当前结论是对模型能力的保守估计，即研究人员没有做精细 prompt tuning，也没有用多轮推理去「挑选最好看的输出」，而是用固定、简单的提示词来模拟一种更接近「普通用户上手」的用法。

闭源模型的评测约束

在一些任务章节里，研究人员也说明了评测工程细节：由于模型以API方式调用且闭源，无法做任务定制训练；并且生成输出分辨率可能固定在约1024尺度，因此需要将输出resize回与GT一致的分辨率再计算指标，以保证定量比较尽量公平。

视觉「更好看」但指标「更差」

报告最重要的结论可以概括为一句话：

Nano Banana Pro在主观视觉质量上往往更讨好，但在PSNR/SSIM等传统参考指标上整体落后于专用模型。

研究人员将其归因于生成式模型的内在属性：生成式模型更倾向于追求「语义可信/感知合理」，而非严格的像素级对齐；同时模型输出带有随机性（stochasticity），使得稳定性与可复现性也成为部署障碍。

系统性现象：感知质量与指标不一致

以Flare Removal为例，研究人员观察到一种非常典型的现象：有些样本视觉上已经「挺干净、挺舒服」，但因为亮度/颜色等与GT存在偏差，量化分数依然不高，这反映了像素级指标对生成式增强的惩罚机制。

同时，研究人员也指出生成模型存在「高上限、低下限」的特征：在合适输入上，它可能在细节恢复上超过SOTA，但这种优势会被扩散/生成模型的随机性与语义漂移所抵消，出现明显方差与语义幻觉，prompt 工程也只能部分缓解，难以保证工业级确定性。

稳健但不极致：生成式模型有时会选择更保守的输出

在低光增强（Low-Light Enhancement）的分析中，研究人员给出另一个视角：

Nano Banana Pro可能不太会引入显著的光晕、结构破坏、严重色偏等「灾难性伪影」，这使得它在某些实际应用中具备吸引力；

但它也会出现亮度控制不一致、对prompt敏感、以及与benchmark的GT定义不完全匹配等问题，因此整体仍难以与专用方法竞争。

更进一步，报告还给出可能的改进方向：更具体的prompt设计、few-shot示例对齐、轻量适配/微调、以及把统一多模态模型与任务模块结合的混合范式。

报告贡献与意义：它不只是在「打分」，而是在推动重新定义评测与目标

这份报告的价值不止在于给Nano Banana Pro下结论，更在于它把一个长期存在但常被忽略的问题摆到台面上：

当生成式模型进入低层视觉后，「像素一致性」是否仍是唯一目标？

传统指标是否在系统性地误导我们对生成式恢复/增强的判断？

是否需要能同时刻画「感知质量 + 结构/语义稳定性 + 像素保真」的新评测范式？

更多>同类资讯

剧场账号无底线！多位短剧演员遭AI不雅合成

01-04

免费短剧内卷白热化！同一IP同天上6部！

01-04

汉堡王系统崩溃，官方：APP正在紧急修复

01-04

巴菲特退休后发声：伯克希尔在100年后仍会屹立不倒

01-04

英特尔Arc B770显卡临近上市

01-04

西安交大团队破解锌基电池寿命难题

01-04

6日深夜至7日凌晨北方多地可赏月掩轩辕十四望远镜助观奇妙天象

1月6日深夜至7日凌晨，天宇将“上线”趣味天象月掩轩辕十四，届时如果天气晴好，我国北方多地公众可观赏到一轮亏凸月与狮子座最亮恒星“亲密接触”的奇妙景象。修立鹏提示说，较强的月光会掩盖轩辕十四的光辉，我国各地感…

01-04

12月30日长征四号乙火箭升空天绘七号卫星成功入轨开启新征程

IT之家 12 月 30 日消息，据新华社报道，12 月 30 日 12 时 12分，我国在酒泉卫星发射中心使用长征四号乙运载火箭，成功将天绘七号卫星发射升空，卫星顺利进入预定轨道，发射任务取得圆满成功。 …

01-04

2026年首个“超级月亮”亮相夜空，还有流星雨木星观测指南来袭！

当满月发生在近地点附近时，月球看起来会比平时更大、更亮。象限仪座流星雨是每年年初的一场视觉盛宴，通常在1月3日至4日达到极大。2026年该流星雨在今天（4日）清晨迎来极大。不幸的是，象限仪座流星雨今年极大时…

01-04

太空危机时刻：中国航天应急发射如何织就生命守护网？

没错，但有些情况——比如轨道舱受损而返回舱独立运行受影响，或者宇航员需要及时接替完成关键任务——就需要地面迅速发射一艘新飞船上去接应。我国首次载人航天应急发射演练，背后是一套精密如钟表的系统。从“神舟”系列…

01-04

虫洞：从科幻想象到科学探索，连接时空的奥秘何时能解？

有了这个基础，1935年爱因斯坦和他的助手罗森，在解广义相对论方程时发现个怪事，方程里居然允许一种“桥”的存在它能把两个原本不相连的时空区域连起来，后来被叫做“爱因斯坦-罗森桥”，也就是最早的虫洞概念。就…

01-04

百年前哈勃论文破宇宙认知困局，今朝科研薪火相传续写探索新篇

在此基础上，哈勃后续还发现星系距离与退行速度的线性关系，引出了描述宇宙膨胀速率的哈勃常数，这一发现后来也被命名为“哈勃-勒梅特定律”。哈勃百年前的论文为宇宙探索点亮了灯塔。从百年前的认知突破，到如今中国科研…

01-04

擎科生物siRNA裸序列定制合成服务上线，3天交付助力小核酸药物研发提速

01-04

Gogo完成5G空对地连接测试，下行80Mbps，已获首个付费客户

01-04

启郡教育余志成：成人教育需转型，以终身发展生态赋能职场人成长

本次论坛以“教育看见更大的世界”为主题，汇聚教育领域的专家学者、行业精英、企业领袖、一线教师以及广大教育从业者，共同探讨教育在新时代背景下的发展机遇与挑战、全球教育发展趋势、科技创新与教育深度融合的路径，分享…

01-04

点击查看更多 +

全站最新

1月8日比亚迪秦系与海豹系多款车型登场纯电续航实力亮眼

2026款秦PLUS DM-i长续航版1月8日登场，纯电210公里开启出行新篇

20万级中大型SUV“7”字对决钛7硬派与传祺S7智能谁更胜一筹？

银河V900 1月7日预售开启豪华空间与智能科技打造高端出行新体验

宝马中国2026开年降价最高超30万，官方：主动适应市场非价格战之举

经典重生！宾尼法利纳重塑初代NSX，JDM情怀与现代科技完美融合

热门内容

本栏最新

启郡教育余志成：成人教育需转型，以终身发展生态赋能职场人成长

微博生活榜突围指南：五步精准操作，让你的内容热度持续攀升

微博科技榜：科技品牌影响力跃升新路径与长效价值构建之道

虚拟现实游戏：以沉浸之姿，为教育领域注入创新活力与变革动力

微信投票活动魅力何在？解析其提升参与、推广品牌等多重价值

高原天路上的青春逐梦：三四月蜕变，书写公路守护新篇章

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.