一图理解Nano Banana为何这么强?

省流版

本文由Kimi+Lovart+Nano Banana生成。

  • Kimi搜索能力强(能搜公众号了)、幻觉低,用来出文。

  • Banana指令遵循&构图能力强,支持英文生成(中文较弱),用来出图。

  • Lovart能够稳定的进行图文混排,用来生成长图,使用Banana模型免费(9.3前)。

正文内容

于是,有了这篇文章《一图理解Nano Banana》。

提示词揭秘

主要通过Lovart一句话生成,Prompt是:

你需要生成一个长笔记,来给中学生解释清楚这件事情:

{标题}

这个长笔记的背景风格为笔记本/手帐,适合手机阅读。
笔记中的文字,都是中文。
笔记主体文字为36px,图片宽度为1080px,清晰易读。
你会用nano-banana模型画一些图片,放在笔记中,便于读者更好的理解内容,风格统一。
你的图片为手绘风格插图,彩色粗铅笔,信息量丰富,图中文字均为英文,纯色背景。
你需要生成这个笔记,来解释下面的内容;对于重点内容要加粗;你的配色非常合理、好看。

你的笔记内容来自于下文,不做任何更改:
{
正文内容
}

请生成这个笔记,并在最后给出备注“这篇文章,完全由Lovart&Nano-Banana生成,文字由xx提供”。

Prompt一作@赛博禅心,我做了细微迭代。初版不太能控字,这一版可以严格控住文字了,不会让Lovart自己魔改。

加上标题、正文后,完整Prompt是:

你需要生成一个长笔记,来给中学生解释清楚这件事情:
{Nano Banana:谷歌的PS终结者}

这个长笔记的背景风格为笔记本/手帐,适合手机阅读。
笔记中的文字,都是中文。
笔记主体文字为36px,图片宽度为1080px,清晰易读。
你会用nano-banana模型画一些图片,放在笔记中,便于读者更好的理解内容,风格统一。
你的图片为手绘风格插图,彩色粗铅笔,信息量丰富,图中文字均为英文,纯色背景。
你需要生成这个笔记,来解释下面的内容;对于重点内容要加粗;你的配色非常合理、好看。

你的笔记内容来自于下文,不做任何更改:
{
如果AI界也有水果圈顶流,那最近蹿红的绝对是——Nano Banana!
别看名字像迷你香蕉,它可会专治各种P图不服,堪称PS界的“灭霸”。
老板说:Logo 换蓝色、人物笑得更慈祥,一小时后给我!
我悄悄:Alt+Tab 切到 Nano Banana——让香蕉来!
这就是最近刷屏的Nano Banana(谷歌内部代号),官方面世称Gemini 2.5 Flash Image。
别看名字像水果忍者,它干的事可是把 Photoshop 的饭碗端走再顺手把锅给砸了。

一、身世之谜:为什么是「香蕉」?
·谷歌传统——用水果给模型起小名:
Mango、Pineapple、Guava……轮到图像模型就 Nano Banana(纳米香蕉)。
·员工推特疯狂暗示:Logan Kilpatrick 发🍌,DeepMind 设计师把头像换成香蕉剪影,网友秒破案:这是 Google 亲儿子。
·盲测平台 LMArena 首秀,匿名乱杀,把DALL·E 3、Midjourney v7、GPT-4o打得叫爸爸,网友惊呼:「这谁家模型?」
三天后官方摊牌:正是在下。

二、三大绝活:把 PS 三板斧 AI 化
1. 角色一致性——「换头术」终结者
以前 AI 生图最尬的是:同一张脸换个姿势直接变路人。
Nano Banana 用「跨帧身份锁」技术,把人物面部、身形、胎记甚至耳钉都打上 DNA 标签。
实测:让马斯克连续演 50 集《甄嬛传》,每集表情、角度不同,但一眼能认出是他——用户盲测胜率 98%。

2. 场景重构——「一键乾坤大挪移」
指令:「把白天变夜晚,加霓虹灯,人物别糊。」
模型会:
·重绘天空 → 加月光 → 自动把人脸补光 → 霓虹倒影同步到瞳孔。
堪比电影后期,用时 2.3 秒,传统 PS 流程 2.3 小时起步。

3. 像素级编辑——「指哪打哪」
无需蒙版、不用通道、告别钢笔工具。
口语描述:「把左边第三只柯基的舌头改成粉色,再加一滴口水反光。」
它真能找到那只柯基、那条舌头,并在高光区帮你点上一滴口水。
设计师泪目:「这比我抠图抠到凌晨三点还精细。」

三、交互方式:像聊天一样 P 图
打开Google AI Studio。
上传一张参考图,直接口喷:
「让妹子头发变紫,衣服换成赛博朋克机甲,但背景保留原样。」
模型回你:「好的,已调整光影,瞳孔高光已同步。」
不满意?继续聊:「头发再亮一点,机甲加 LED。」
它记住上一轮结果,再改一遍,全程像跟乙方沟通,但乙方 0 废话。

四、香蕉为何这么拽?
1.极致的一致性。无论是换背景、改姿势、换服装,五官、肤色、表情、光影甚至嘴角弧度都不会“漂移”,可以用大白话精准地“指哪改哪”。
2.多图融合能力。可同时输入最多3张参考图,把人物、物体、风格、纹理拼成一张新图,光影自然不突兀。
3.支持多轮编辑,可以与模型持续对话,多步骤生图。
4.光影逼真。不像滤镜贴图,它能重新计算光源、阴影、反射,让场景符合物理规律。
5.模型拥有世界知识,能读懂地图、常识。

五、槽点不能少
当然,它也有不足的地方:
1.不擅长“凭空生图”,文生图能力不如Midjourney、即梦。
2.文字生成依旧会“鬼画符”,尤其是中文,不适合做海报标题。
3.连续多图叙事(连环画)时,一致性会下降,更适合单张或少量迭代。

六、未来彩蛋
据内部播客透露,谷歌正把 Nano Banana 塞进安卓相机 App:
「拍照 → 语音 P 图 → 直接发圈」,以后发朋友圈的「假装在巴黎」只需一句「背景换埃菲尔铁塔」,连滤镜都省了。

七、一句话总结
Nano Banana 就是 AI 绘图界的「瑞士军蕉」:
设计师用它早下班,电商用它多赚钱,甲方用它少改稿。
记住,下次有人让你「把大象 P 进冰箱」,你就回他:
「让香蕉来!」
}

请生成这个笔记,并在最后给出备注“这篇文章,完全由Lovart&Nano-Banana生成,文字由沃垠AI提供”。

正文内容,我用的Kimi生成,Prompt是:

精要总结Nano Banana模型,1200字,风趣幽默,有梗有料,通俗易懂。

同样Prompt,我也跑了DeepSeek V3.1、GPT-5、Gemini 2.5 pro、GLM-4.5、Grok4,还是Kimi搜索能力更准一些,幻觉低,幽默度刚刚好,不尬。

欢迎大家来试试这个case,评论区交作业。


(文:沃垠AI)

发表评论