全网疯传的Nano Banana2提示词，我帮你整理好了（可直接抄）

你知道那种感觉吗。就是你在一个工具上连续翻车两三年，翻到你都麻了，突然某天有人把新玩意儿丢你脸上。你刚想说“又来一个短命模型”，结果它第一张就把你嘴堵住。（不是吧，真的能堵住）

我凌晨测 Nano Banana 2，就是这种心情。一开始我还挺不屑的。毕竟“图像模型又升级了”这种话，听得我耳朵都长茧。尤其我们做 AI 视频的，最怕的不是画面不好看，最怕的是不听话、不连续、不可控。你再美也没用。分镜接不上，角色不一样，手指穿帮，文字像外星语。最后还得我们人工救火。那这叫生产力吗？这叫“高级玩具”。所以我没拿它去画什么唯美大片，我直接上了AI 视频人专用的变态压力题。那种平时专门用来卡模型的题。卡它的世界知识、指令遵循、角色一致性、镜头语言、文字渲染、复杂合成。说白了就是能不能当我们分镜师 + 美术总监 + 甲方同传。结果嘛……我得承认，有点离谱。大家可以看到文章末尾，有更多好玩的案例。一、先说结论：Nano Banana 2 的颠覆点在哪？我这边一句话总结它的“新意义”：它不是“更会画”的模型，而是“更会按分镜做事”的模型，它真的直接掀桌子了。以前的模型强在“单张好看”。但一到视频生产链路，就开始掉链子，比如角色跨镜头不认人、道具细节完全不像、文字渲染翻车、多图参考合成像贴上去的一样、镜头语言压根听不懂。而 Nano Banana 2 的提升，恰好戳中我们这群干活人的痛点：更听指令、更懂叙事、更稳的连续性、更强的多图融合、文字/界面可读性直接拉满。你把它放到“文图视音剪”的链路里，它不是“图”那一步的升级，而是“图→视”这条断桥被突然修通了。下面我给你看它最吓人的几个瞬间。二、AI 漫剧最要命的是什么？是“跨镜一致性”我们做AI 视频的人，最怕一句话：“这镜头他怎么换了个人？”你要是没踩过这种雷，说明你还没真正做过连续分镜。所以我第一个场景就设置在这里。同一主角的三视图转身设定我让它做一个主角三视图：正面、侧面、背面回头。要求同一张脸、同一套衣服、同一身材比例，只变角度。提示词如下

生成一个 AI 漫剧主角的三视图转身设定：正面半身；2) 侧面半身；3) 背面半身回头。主角是 17 岁的男生，黑色短发，左眉有一道小疤，穿灰色连帽卫衣+旧帆布包。三张图要保持同一张脸、同一套衣服、同一身材比例，只是角度变化。风格：高质感日漫，边缘干净，线条统一。

以前很多模型在这一关就开始梦游。正面还行，侧面开始“换皮”，背面直接重开一个人。你看着看着就会怀疑自己：“是不是我提示词没写清楚？”结果不是你，是模型压根没“把角色当一个人”。Nano Banana 2 这一轮给我的感觉像什么？像你把一个角色卡丢给美术同事，他说：“OK，我懂了，这就是同一个人，只是转身。”三张里脸、疤痕位置、卫衣褶皱、帆布包扣子都守得很稳。这是做连续叙事的底盘。我当时脑子里蹦出一句话：“它开始有角色观念了。”同样是纳米香蕉2，他 AI 漫剧中强得不仅仅是角色一致性，还有海报生成，这个文字无敌了，有没有懂日语的朋友来看看对不对。

生成一张 AI 漫剧封面：夜色下的旧城巷口，主角是一个背着书包的少年，正回头看向远处一束突然亮起的光。画面有强烈的电影构图：前景是湿漉漉的石板路反光，中景少年半身回望，远景光源处隐约有巨大城市轮廓。氛围紧张、神秘但带一点希望。风格是高质感日漫+电影海报融合，细节丰富。

日语不认识，中文我总认识吧。。生成我追了十多年的动漫，海贼王的电影预告海报。

海贼王全员摆最经典的 pose，超级高清的电影预告海报，横版16:9，有对应的中文文字

我数了下，好像真的是十个人，全员集结，中文也完全没毛病，你说这是他打字打上去的我也信。。一段戏三镜头，情绪连贯第二关更狠：同一场雨夜天桥戏，三镜头连续，情绪从紧张到释然，最后给信封特写，还要字可读。提示词如下：

生成 3 张连续分镜（同一风格、同一人物）：镜头1【远景】：雨夜旧城天桥，女主站在路灯下打电话，手里攥着一封信。镜头2【中景推进】：镜头向前推进到女主胸口以上，她表情从紧张变成释然，雨水顺着头发滴落。镜头3【特写】：女主手里那封信被雨打湿，信封上清晰可读的四个字“再见，明天”。角色外貌、服装与环境必须严格一致，雨夜光影连续。

不是吧，我只是试一试，没想到真的一次给我做了好几个超高一致性的图片。这里它最让我意外的不是画面多美，而是“它真的按镜头在演”。远景建立环境，中景推进情绪，特写突出信息。

三个镜头的光影、雨势、服装湿润程度、路灯方向，都连得上。如果是竖屏AI 漫剧，也能一次性生成连续的三个关键帧，到时候图生视频连起来即可。

你知道这意味着什么吗？意味着你后面做图生视频时，不用再花大力气去“修补为什么上一镜脸不对、下一镜衣服变了”。它直接把你的视频前期耗时砍一半以上。且我确定一个事情，他好像懂镜头了，知道虚化和聚焦的效果。提示词如下。

生成一张电影感画面：长焦镜头在夜市人群里偷偷拍女主角，前景有虚焦的人影遮挡到画面 1/3，主角在中景快速转身，带轻微运动模糊，背景霓虹拉出拖影，焦点准确落在主角眼睛。色调偏赛博霓虹，真实摄影质感。

以后只要是编导能用语言描述出来，就没有做不出来的图片。三、做广告的人最怕什么？是“合成像贴纸”我们做商单的时候，甲方最常说的一句话是：“能不能自然点？看着像 AI 拼的。”所以我第三关是“产品×角色×场景三图无穿帮合成”。要求角色拿起产品，透视光向全对，手指不穿模。这是前几天从赵一鸣买的清凉糖，这是随便放的头像和场景图。

我本来没抱有太大希望，没想到还能合成得这么好。。

老实讲，这题以前我测过无数模型，成功率不高。尤其是“手拿产品”这种结构，简直是 AI 的地狱副本。它在“融合”上不是那种粗暴的叠加，更像是理解“这个东西应该在这里被这样拿着”。还是那个熟悉的清凉糖，我想试试放到偏卡通背景里是什么样的，提示词参考下图。

不得不说，这光影稳得一批，产品和背景融合得太好了，反正我用别的工具做不出这种效果。。。

所以整体Nano Banana 2 的表现是：该握住的握住了，该有的阴影有了，产品反光方向也跟场景一致，最关键——没有那种“产品像 P 上去的格格不入”。接下来我开始各种混搭风了，去疯狂测试纳米香蕉 2 的融图能力。先来看看这个，让老大去英雄联盟里面当灌篮高手。

生成一个游戏画面，科比化身诺手，穿着灌篮高手的皮肤，在英雄联盟峡谷里面拿到pentakill的关键画面

什么，他不仅画风完全融合，还在这里给我玩梗，看到了迪莫的嘲讽。再来，这是之前一个比较经典的场景，手办，这下我们加点难度，让他把我们西羊石的 logo 也合上去。提示词参考下图。

结果我真的惊呆了，他好像真的懂真实世界的复杂三维透视关系了！！

还不够极限，再来。下图我都数不清有多少人了，来看看结果。

先不说场景非常符合我们的要求，还能看到科比在保持着那个灌篮姿势呢，可是，咦，我人呢。

可能他真的把我的头像和王家卫风格的角色当成一个人了吧，不过确实是我在这之前用它生成的。

另外刚刚可能人确实太多了，两个手指都数不过来，一下子勉强它也有点过分，我们同样的提示词，少放一些图片，看看效果。

可以看到这次，指令遵循度非常好，角色画风符合要求，数量也满足。

这就不是画图了。这是构图和物理关系。我们日常的产品融图、海报角色植入、分镜关键物件控制，第一次有种“可以放心交给它当底稿”的感觉，万物皆可融。四、更加炸裂的是：它开始能“产出可用的分镜”你看公众号上所有“模型牛逼”的测评，大多数都停在“出图惊艳”。但对我们来说，真正能省时间的是：它能不能直接产出“可进入视频链路的素材”。于是我搞了两道极限题：1）生成可读的分镜表截图我直接让它出一个分镜表，列名、行内容都要中文可读，对齐整洁。

生成一张“AI 漫剧分镜表”的清晰截图风格图片。表格含 6 列：分镜编号 / 画面描述 / 景别 / 运镜 / 台词旁白 / 音效。填 5 行内容（你自由补全），所有中文必须完全可读、对齐整洁，像真实制片人在飞书里做的分镜表截图。

以前这个赛道属于“大型翻车现场”。模型能理解你要表格，但字全乱。要么乱码，要么错别字，要么排版泥石流。Nano Banana 2 这次给我的观感是：“诶？这张表都能直接当是我电脑截图发群里了。”你可能觉得这只是“文字清楚”。但如果你做过实际项目就知道：一张清晰的分镜表，意味着从“想法”到“执行”之间的沟壑消失了。而且他可能真的给你“画出分镜表”。2）剪辑时间线 UI 截屏第二道更变态：我让它生成一个剪映式时间线截图。预览窗、三轨道、关键帧面板，字幕要清楚可读。

生成一张视频剪辑软件（剪映）时间线界面的真实截屏：上方是预览窗口，显示“雨夜天桥人物回头”的画面；下方时间线有 3 条轨道：视频轨、字幕轨、音频轨；字幕轨上有 3 段字幕，分别写：“你等的人没来。”“但雨停了。”“我们继续走。”右侧有参数面板：位置/缩放/不透明度/关键帧。所有文字清晰可读，UI 对齐专业。

它真的在“长 UI 结构”里守住了。字幕不乱飞，轨道不糊，右侧参数栏是合理的剪辑软件布局。我以为剪映界面只是运气，又试了别的，好像还是一样，能直接拿来当电脑截图用。。

如果只是一个截图那还差点意思，它甚至还能生成多个 UI 设计的交互卡片。

生成一张 iPhone 15 Pro 的真实截屏风格 App 首页：App 名叫“AI 漫剧工坊”。顶部有搜索栏；中间是 3 个功能卡片（“一键分镜”“角色一致性”“批量渲染”）；下方是瀑布流作品预览；底部是 5 个标签栏（首页/创作/素材/消息/我的）。所有中文要清晰可读，UI 对齐规范，阴影和圆角符合 iOS 设计语言。

卧槽，我都真的担心，他已经把我们真实世界和软件相关的东西已经学完了。。我接着再去用几个实际的案例来考考他，提示词如下。

一间真实教室的黑板特写。黑板上用粉笔写着一段清晰可读的中文：“今天我们学习函数的极限概念，并用一个生活里的例子来理解它。”字迹自然、有粉笔颗粒感，行距整齐但不呆板。黑板边缘有轻微反光，整体是写实摄影风格。

这，跟实拍的有什么区别？？？如果说前面AI 漫剧海报我怀疑他是用写代码弄上去的，这个粉笔字，总不能也是代码写进去的吧。。还不够变态，再来一个更综合一点的，需要光影、数字和物理常识。

一张超写实静物照片：木质桌面上放着一个白色圆形挂钟，钟面清晰显示 11:15（刻度和指针都要正确）。旁边是一只透明高脚红酒杯，红酒刚好满到杯口，液面微微鼓起但没有溢出。自然柔光，真实相机质感，细节清晰。

他好像真的不仅仅懂物理，还懂文字数字，这个时间好像真对了，只是这样看着长短针不太对。好吧，物理会了，我再去考考你数学。

生成一张笔记本纸上的手写数学推导，内容是对函数 f(x)=x^3·sin(x) 求导。要有完整步骤：乘积法则、链式法则、最终结果。手写体清晰、符号标准（sin、cos、d/dx、括号、上标下标都正确），像真实学生的课堂笔记，俯拍视角，柔和自然光。

我现在已经有点忘记导数这块知识了，还会的小伙伴评论区可以看看它是不是在乱写。

五、为什么我说这玩意“颠覆”？因为它不是给你一个更锋利的锤子，而是给你一条新流水线。以前我们的生产链路是这样：你写分镜 → 模型出图 → 你修穿帮 → 你补连贯 → 再转视频 → 再修一轮。而 Nano Banana 2 把中间最折磨人的部分压缩了：你写分镜 → 它按分镜做事 → 直接进图生视频。那种感觉像什么？像你终于遇到一个“不需要你反复哄的美术同事”。你说“这个主角跨三镜要同一个人”，它不会装傻。你说“产品要被自然握住”，它不会给你一只三指手。你说“信封上四个字要可读”，它不会输出甲骨文。它开始有“制作意识”。开始理解用它的人为什么要这么写提示词。所以我才说它颠覆。不是因为它图多牛，而是因为它让“AI 视频生产”第一次变得顺畅。除了 AI 视频方面，还有更多的案例大家可以参考，总之就是一句话：离大谱！设计一组logo

清新可爱扁平图标插画风格，低饱和婴儿色系（奶油蓝、浅薄荷绿、软珊瑚粉、淡柠檬黄、雾紫）统一配色，局部加入通透柔和渐变与轻微高光，边缘圆润、线条干净，细节丰富但观感轻快。画面为 10 个图标，以 5×2 网格阵列整齐排列，间距均匀，居中对齐，适用于校园系统 / 教育类 App / 学习工具网页 UI。

这直接都是批量生成了，之前用一些 AI 工具生成单个都费劲。

各种风格的教学卡片

给我画一个自由泳的教学卡片，中间用中文，要有设计美感

还有 ios 风格的。

给我画一个自由泳的教学卡片，中间用中文，要有设计美感，苹果ios 风格

最近在学自由泳，这样看着就直观多了，不用老是去看视频。还有 AI跟更多具体产业结合，比如大健康。

银白色无菌实验桌，显微镜、培养皿、发光医疗屏。培养皿中两支“免疫细胞小队”与拟人化病毒对抗：技能特效含“抗体锁定”“吞噬捕获”。界面为未来式医疗 HUD：蓝绿能量条、扫描网格、技能图标、倒计时。整体微观战斗感，高科技、科普氛围，中文。

当然，如果你觉得太写实了，一句话的事情，优化图片。

还有一些比较好玩的场景，继续混搭。

四格漫画，海贼王漫画风格，讲述海绵宝宝去找蔡徐坤一起唱歌，遇到艾莎公主在和七个小矮人弹吉他

总之脑洞有多大，以后就能做出多离谱的图片，我们的爱豆也能够轻松跨越次元壁，以后真担心大家的精神状态哈哈哈。再来个最可爱的场景，看到这张图心都融化了。

账贴纸风插画信息图《猫咪尾巴语言翻译器》，米白纸纹背景+淡彩马克笔质感；中心可爱猫咪多姿态尾巴示意（竖直、炸毛、轻摆、问号尾、贴地、左右甩等），每种尾巴旁配详细中文解释+情绪小标签；排版像翻译词典/情绪指南，点缀爪印、波浪线、箭头、手写注释，治愈可爱、原创科普。

还有一个比较实用的场景，节日贺卡，来自阿真，大家也可以发挥自己的脑洞。

2025 圣诞季主视觉，适用于大屏展示。红金色复古插画风格，Riso 印刷质感，粗颗粒叠色、对位轻微偏移。细节丰富：圣诞老街、拱门灯牌、雪花纹理、金色光晕、手绘装饰物。整体温暖节庆感、构图饱满但不杂乱。中文标题（Riso 字体风格）：「2025 圣诞季 · 冬日奇遇节」副标题小字：「暖光·礼物·音乐·市集」「一起度过属于冬天的好时光」

六、局限虽然他这么牛，但是目前有没有有些问题呢，当然是有的，不过也有一些解决办法。第一点就是使用环境限制，这里卡尔的 AI 沃茨给大家找了 12 种方法，非常给力，我主要是在 Gemini 里面使用，非常快速。

第二个是图片分辨率，虽然官方说是 2k，但好像从浏览器下载也最多只有 1408✖️768 分辨率，我在提示词里面写了分辨率 2k，4k 好像都没用。

不知道是不是刚上线怕用的人多没上全部功能，大家可以再等等。

另外大家如果靠 API调用的话，可以尝试调整 resolution这个参数看有没有用。

第三点就是不是每次都能成功生成图片，比如我这个垓下之战的条漫没有生成成功，即使我后面明确让他生成图片，也还是没成功，具体原因暂时还不清楚。

七、结语如果你只是想玩图，Nano Banana 2 只是“更好玩的模型”。但如果你是做 AI 视频、AI 漫剧、短剧、广告、分镜链路的人，它可能会是你接下来工作流里第一个要占坑的位置。我们以前一直在等一个东西：让 AI 从“好看”进化到“可交付”。现在它来了。你可以继续怀疑它是不是短期 hype。但我建议你自己去跑一遍“变态分镜题”。跑完你就懂我为什么会这么说。当然他的强大不仅仅局限在 AI 视频创作过程中，还有更多的场景需要结合大家具体场景使用。用了之后我真的激动得一晚上睡不着，像是图片的ChatGPT4时代，真不敢相信 AI 进步这么快，还好我们做的是 AI 视频，还需要一段时间，不过估计那一天也很快到来了吧。不愧是巴菲特老爷子最近都投资的 AI，能让小白一使用下来就能直观看到，是颠覆性的产品。

感谢你看到最后。如果你想学AI却无从下手，我们西羊石团队沉淀了一份超过50万字的开源知识库，里面涵盖了AI视频、AI智能体、AI编程、AI音乐等各领域的学习资料，免费供大家阅读和学习，不断保持更新。链接：🔗
https://www.feishu.cn/community/article?id=7566616559762800641详细介绍大家阅读这篇介绍文章：👇一份30万字的AI心得，我们想毫无保留地分享给你

作者 | 小石学长

编辑 | 小石学长