一图理解Nano Banana为何这么强？

省流版

本文由Kimi+Lovart+Nano Banana生成。

Kimi搜索能力强（能搜公众号了）、幻觉低，用来出文。
Banana指令遵循&构图能力强，支持英文生成（中文较弱），用来出图。
Lovart能够稳定的进行图文混排，用来生成长图，使用Banana模型免费（9.3前）。

正文内容

于是，有了这篇文章《一图理解Nano Banana》。

提示词揭秘

主要通过Lovart一句话生成，Prompt是：

你需要生成一个长笔记，来给中学生解释清楚这件事情：

{标题}

这个长笔记的背景风格为笔记本/手帐，适合手机阅读。
笔记中的文字，都是中文。
笔记主体文字为36px，图片宽度为1080px，清晰易读。
你会用nano-banana模型画一些图片，放在笔记中，便于读者更好的理解内容，风格统一。
你的图片为手绘风格插图，彩色粗铅笔，信息量丰富，图中文字均为英文，纯色背景。
你需要生成这个笔记，来解释下面的内容；对于重点内容要加粗；你的配色非常合理、好看。

你的笔记内容来自于下文，不做任何更改：
{
正文内容
}

请生成这个笔记，并在最后给出备注“这篇文章，完全由Lovart&Nano-Banana生成，文字由xx提供”。

Prompt一作@赛博禅心，我做了细微迭代。初版不太能控字，这一版可以严格控住文字了，不会让Lovart自己魔改。

加上标题、正文后，完整Prompt是：

你需要生成一个长笔记，来给中学生解释清楚这件事情：
{Nano Banana：谷歌的PS终结者}

这个长笔记的背景风格为笔记本/手帐，适合手机阅读。
笔记中的文字，都是中文。
笔记主体文字为36px，图片宽度为1080px，清晰易读。
你会用nano-banana模型画一些图片，放在笔记中，便于读者更好的理解内容，风格统一。
你的图片为手绘风格插图，彩色粗铅笔，信息量丰富，图中文字均为英文，纯色背景。
你需要生成这个笔记，来解释下面的内容；对于重点内容要加粗；你的配色非常合理、好看。

你的笔记内容来自于下文，不做任何更改：
{
如果AI界也有水果圈顶流，那最近蹿红的绝对是——Nano Banana！
别看名字像迷你香蕉，它可会专治各种P图不服，堪称PS界的“灭霸”。
老板说：Logo 换蓝色、人物笑得更慈祥，一小时后给我！
我悄悄：Alt+Tab 切到 Nano Banana——让香蕉来！
这就是最近刷屏的Nano Banana（谷歌内部代号），官方面世称Gemini 2.5 Flash Image。
别看名字像水果忍者，它干的事可是把 Photoshop 的饭碗端走再顺手把锅给砸了。

一、身世之谜：为什么是「香蕉」？
·谷歌传统——用水果给模型起小名：
Mango、Pineapple、Guava……轮到图像模型就 Nano Banana（纳米香蕉）。
·员工推特疯狂暗示：Logan Kilpatrick 发🍌，DeepMind 设计师把头像换成香蕉剪影，网友秒破案：这是 Google 亲儿子。
·盲测平台 LMArena 首秀，匿名乱杀，把DALL·E 3、Midjourney v7、GPT-4o打得叫爸爸，网友惊呼：「这谁家模型？」
三天后官方摊牌：正是在下。

二、三大绝活：把 PS 三板斧 AI 化
1. 角色一致性——「换头术」终结者
以前 AI 生图最尬的是：同一张脸换个姿势直接变路人。
Nano Banana 用「跨帧身份锁」技术，把人物面部、身形、胎记甚至耳钉都打上 DNA 标签。
实测：让马斯克连续演 50 集《甄嬛传》，每集表情、角度不同，但一眼能认出是他——用户盲测胜率 98%。

2. 场景重构——「一键乾坤大挪移」
指令：「把白天变夜晚，加霓虹灯，人物别糊。」
模型会：
·重绘天空 → 加月光 → 自动把人脸补光 → 霓虹倒影同步到瞳孔。
堪比电影后期，用时 2.3 秒，传统 PS 流程 2.3 小时起步。

3. 像素级编辑——「指哪打哪」
无需蒙版、不用通道、告别钢笔工具。
口语描述：「把左边第三只柯基的舌头改成粉色，再加一滴口水反光。」
它真能找到那只柯基、那条舌头，并在高光区帮你点上一滴口水。
设计师泪目：「这比我抠图抠到凌晨三点还精细。」

三、交互方式：像聊天一样 P 图
打开Google AI Studio。
上传一张参考图，直接口喷：
「让妹子头发变紫，衣服换成赛博朋克机甲，但背景保留原样。」
模型回你：「好的，已调整光影，瞳孔高光已同步。」
不满意？继续聊：「头发再亮一点，机甲加 LED。」
它记住上一轮结果，再改一遍，全程像跟乙方沟通，但乙方 0 废话。

四、香蕉为何这么拽？
1.极致的一致性。无论是换背景、改姿势、换服装，五官、肤色、表情、光影甚至嘴角弧度都不会“漂移”，可以用大白话精准地“指哪改哪”。
2.多图融合能力。可同时输入最多3张参考图，把人物、物体、风格、纹理拼成一张新图，光影自然不突兀。
3.支持多轮编辑，可以与模型持续对话，多步骤生图。
4.光影逼真。不像滤镜贴图，它能重新计算光源、阴影、反射，让场景符合物理规律。
5.模型拥有世界知识，能读懂地图、常识。

五、槽点不能少
当然，它也有不足的地方：
1.不擅长“凭空生图”，文生图能力不如Midjourney、即梦。
2.文字生成依旧会“鬼画符”，尤其是中文，不适合做海报标题。
3.连续多图叙事（连环画）时，一致性会下降，更适合单张或少量迭代。

六、未来彩蛋
据内部播客透露，谷歌正把 Nano Banana 塞进安卓相机 App：
「拍照 → 语音 P 图 → 直接发圈」，以后发朋友圈的「假装在巴黎」只需一句「背景换埃菲尔铁塔」，连滤镜都省了。

七、一句话总结
Nano Banana 就是 AI 绘图界的「瑞士军蕉」：
设计师用它早下班，电商用它多赚钱，甲方用它少改稿。
记住，下次有人让你「把大象 P 进冰箱」，你就回他：
「让香蕉来！」
}

请生成这个笔记，并在最后给出备注“这篇文章，完全由Lovart&Nano-Banana生成，文字由沃垠AI提供”。

正文内容，我用的Kimi生成，Prompt是：

精要总结Nano Banana模型，1200字，风趣幽默，有梗有料，通俗易懂。

同样Prompt，我也跑了DeepSeek V3.1、GPT-5、Gemini 2.5 pro、GLM-4.5、Grok4，还是Kimi搜索能力更准一些，幻觉低，幽默度刚刚好，不尬。

欢迎大家来试试这个case，评论区交作业。

（文：沃垠AI）

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

发表评论 取消回复

发表评论取消回复