
你知道那种感觉吗。就是你在一个工具上连续翻车两三年,翻到你都麻了,突然某天有人把新玩意儿丢你脸上。你刚想说“又来一个短命模型”,结果它第一张就把你嘴堵住。(不是吧,真的能堵住)

我凌晨测 Nano Banana 2,就是这种心情。一开始我还挺不屑的。毕竟“图像模型又升级了”这种话,听得我耳朵都长茧。尤其我们做 AI 视频的,最怕的不是画面不好看,最怕的是不听话、不连续、不可控。你再美也没用。分镜接不上,角色不一样,手指穿帮,文字像外星语。最后还得我们人工救火。那这叫生产力吗?这叫“高级玩具”。所以我没拿它去画什么唯美大片,我直接上了AI 视频人专用的变态压力题。那种平时专门用来卡模型的题。卡它的世界知识、指令遵循、角色一致性、镜头语言、文字渲染、复杂合成。说白了就是能不能当我们分镜师 + 美术总监 + 甲方同传。结果嘛……我得承认,有点离谱。大家可以看到文章末尾,有更多好玩的案例。一、先说结论:Nano Banana 2 的颠覆点在哪?我这边一句话总结它的“新意义”:它不是“更会画”的模型,而是“更会按分镜做事”的模型,它真的直接掀桌子了。以前的模型强在“单张好看”。但一到视频生产链路,就开始掉链子,比如角色跨镜头不认人、道具细节完全不像、文字渲染翻车、多图参考合成像贴上去的一样、镜头语言压根听不懂。而 Nano Banana 2 的提升,恰好戳中我们这群干活人的痛点:更听指令、更懂叙事、更稳的连续性、更强的多图融合、文字/界面可读性直接拉满。你把它放到“文图视音剪”的链路里,它不是“图”那一步的升级,而是“图→视”这条断桥被突然修通了。下面我给你看它最吓人的几个瞬间。二、AI 漫剧最要命的是什么?是“跨镜一致性”我们做AI 视频的人,最怕一句话:“这镜头他怎么换了个人?”你要是没踩过这种雷,说明你还没真正做过连续分镜。所以我第一个场景就设置在这里。同一主角的三视图转身设定我让它做一个主角三视图:正面、侧面、背面回头。要求同一张脸、同一套衣服、同一身材比例,只变角度。提示词如下

以前很多模型在这一关就开始梦游。正面还行,侧面开始“换皮”,背面直接重开一个人。你看着看着就会怀疑自己:“是不是我提示词没写清楚?”结果不是你,是模型压根没“把角色当一个人”。Nano Banana 2 这一轮给我的感觉像什么?像你把一个角色卡丢给美术同事,他说:“OK,我懂了,这就是同一个人,只是转身。”三张里脸、疤痕位置、卫衣褶皱、帆布包扣子都守得很稳。这是做连续叙事的底盘。我当时脑子里蹦出一句话:“它开始有角色观念了。”同样是纳米香蕉2,他 AI 漫剧中强得不仅仅是角色一致性,还有海报生成,这个文字无敌了,有没有懂日语的朋友来看看对不对。
生成一张 AI 漫剧封面:夜色下的旧城巷口,主角是一个背着书包的少年,正回头看向远处一束突然亮起的光。画面有强烈的电影构图:前景是湿漉漉的石板路反光,中景少年半身回望,远景光源处隐约有巨大城市轮廓。氛围紧张、神秘但带一点希望。风格是高质感日漫+电影海报融合,细节丰富。

日语不认识,中文我总认识吧。。生成我追了十多年的动漫,海贼王的电影预告海报。

我数了下,好像真的是十个人,全员集结,中文也完全没毛病,你说这是他打字打上去的我也信。。一段戏三镜头,情绪连贯第二关更狠:同一场雨夜天桥戏,三镜头连续,情绪从紧张到释然,最后给信封特写,还要字可读。提示词如下:

不是吧,我只是试一试,没想到真的一次给我做了好几个超高一致性的图片。这里它最让我意外的不是画面多美,而是“它真的按镜头在演”。远景建立环境,中景推进情绪,特写突出信息。



三个镜头的光影、雨势、服装湿润程度、路灯方向,都连得上。如果是竖屏AI 漫剧,也能一次性生成连续的三个关键帧,到时候图生视频连起来即可。

你知道这意味着什么吗?意味着你后面做图生视频时,不用再花大力气去“修补为什么上一镜脸不对、下一镜衣服变了”。它直接把你的视频前期耗时砍一半以上。且我确定一个事情,他好像懂镜头了,知道虚化和聚焦的效果。提示词如下。

以后只要是编导能用语言描述出来,就没有做不出来的图片。三、做广告的人最怕什么?是“合成像贴纸”我们做商单的时候,甲方最常说的一句话是:“能不能自然点?看着像 AI 拼的。”所以我第三关是“产品×角色×场景三图无穿帮合成”。要求角色拿起产品,透视光向全对,手指不穿模。这是前几天从赵一鸣买的清凉糖,这是随便放的头像和场景图。

我本来没抱有太大希望,没想到还能合成得这么好。。

老实讲,这题以前我测过无数模型,成功率不高。尤其是“手拿产品”这种结构,简直是 AI 的地狱副本。它在“融合”上不是那种粗暴的叠加,更像是理解“这个东西应该在这里被这样拿着”。还是那个熟悉的清凉糖,我想试试放到偏卡通背景里是什么样的,提示词参考下图。

不得不说,这光影稳得一批,产品和背景融合得太好了,反正我用别的工具做不出这种效果。。。

所以整体Nano Banana 2 的表现是:该握住的握住了,该有的阴影有了,产品反光方向也跟场景一致,最关键——没有那种“产品像 P 上去的格格不入”。接下来我开始各种混搭风了,去疯狂测试纳米香蕉 2 的融图能力。先来看看这个,让老大去英雄联盟里面当灌篮高手。

什么,他不仅画风完全融合,还在这里给我玩梗,看到了迪莫的嘲讽。再来,这是之前一个比较经典的场景,手办,这下我们加点难度,让他把我们西羊石的 logo 也合上去。提示词参考下图。

结果我真的惊呆了,他好像真的懂真实世界的复杂三维透视关系了!!

还不够极限,再来。下图我都数不清有多少人了,来看看结果。

先不说场景非常符合我们的要求,还能看到科比在保持着那个灌篮姿势呢,可是,咦,我人呢。

可能他真的把我的头像和王家卫风格的角色当成一个人了吧,不过确实是我在这之前用它生成的。

另外刚刚可能人确实太多了,两个手指都数不过来,一下子勉强它也有点过分,我们同样的提示词,少放一些图片,看看效果。

可以看到这次,指令遵循度非常好,角色画风符合要求,数量也满足。

这就不是画图了。这是构图和物理关系。我们日常的产品融图、海报角色植入、分镜关键物件控制,第一次有种“可以放心交给它当底稿”的感觉,万物皆可融。四、更加炸裂的是:它开始能“产出可用的分镜”你看公众号上所有“模型牛逼”的测评,大多数都停在“出图惊艳”。但对我们来说,真正能省时间的是:它能不能直接产出“可进入视频链路的素材”。于是我搞了两道极限题:1)生成可读的分镜表截图我直接让它出一个分镜表,列名、行内容都要中文可读,对齐整洁。

以前这个赛道属于“大型翻车现场”。模型能理解你要表格,但字全乱。要么乱码,要么错别字,要么排版泥石流。Nano Banana 2 这次给我的观感是:“诶?这张表都能直接当是我电脑截图发群里了。”你可能觉得这只是“文字清楚”。但如果你做过实际项目就知道:一张清晰的分镜表,意味着从“想法”到“执行”之间的沟壑消失了。而且他可能真的给你“画出分镜表”。2)剪辑时间线 UI 截屏第二道更变态:我让它生成一个剪映式时间线截图。预览窗、三轨道、关键帧面板,字幕要清楚可读。

它真的在“长 UI 结构”里守住了。字幕不乱飞,轨道不糊,右侧参数栏是合理的剪辑软件布局。我以为剪映界面只是运气,又试了别的,好像还是一样,能直接拿来当电脑截图用。。

如果只是一个截图那还差点意思,它甚至还能生成多个 UI 设计的交互卡片。

卧槽,我都真的担心,他已经把我们真实世界和软件相关的东西已经学完了。。我接着再去用几个实际的案例来考考他,提示词如下。

这,跟实拍的有什么区别???如果说前面AI 漫剧海报我怀疑他是用写代码弄上去的,这个粉笔字,总不能也是代码写进去的吧。。还不够变态,再来一个更综合一点的,需要光影、数字和物理常识。

他好像真的不仅仅懂物理,还懂文字数字,这个时间好像真对了,只是这样看着长短针不太对。好吧,物理会了,我再去考考你数学。
我现在已经有点忘记导数这块知识了,还会的小伙伴评论区可以看看它是不是在乱写。

五、为什么我说这玩意“颠覆”?因为它不是给你一个更锋利的锤子,而是给你一条新流水线。以前我们的生产链路是这样:你写分镜 → 模型出图 → 你修穿帮 → 你补连贯 → 再转视频 → 再修一轮。而 Nano Banana 2 把中间最折磨人的部分压缩了:你写分镜 → 它按分镜做事 → 直接进图生视频。那种感觉像什么?像你终于遇到一个“不需要你反复哄的美术同事”。你说“这个主角跨三镜要同一个人”,它不会装傻。你说“产品要被自然握住”,它不会给你一只三指手。你说“信封上四个字要可读”,它不会输出甲骨文。它开始有“制作意识”。开始理解用它的人为什么要这么写提示词。所以我才说它颠覆。不是因为它图多牛,而是因为它让“AI 视频生产”第一次变得顺畅。除了 AI 视频方面,还有更多的案例大家可以参考,总之就是一句话:离大谱!设计一组logo
这直接都是批量生成了,之前用一些 AI 工具生成单个都费劲。

各种风格的教学卡片

还有 ios 风格的。

最近在学自由泳,这样看着就直观多了,不用老是去看视频。还有 AI跟更多具体产业结合,比如大健康。

当然,如果你觉得太写实了,一句话的事情,优化图片。

还有一些比较好玩的场景,继续混搭。

总之脑洞有多大,以后就能做出多离谱的图片,我们的爱豆也能够轻松跨越次元壁,以后真担心大家的精神状态哈哈哈。再来个最可爱的场景,看到这张图心都融化了。

还有一个比较实用的场景,节日贺卡,来自阿真,大家也可以发挥自己的脑洞。

六、局限虽然他这么牛,但是目前有没有有些问题呢,当然是有的,不过也有一些解决办法。第一点就是使用环境限制,这里卡尔的 AI 沃茨给大家找了 12 种方法,非常给力,我主要是在 Gemini 里面使用,非常快速。

第二个是图片分辨率,虽然官方说是 2k,但好像从浏览器下载也最多只有 1408✖️768 分辨率,我在提示词里面写了分辨率 2k,4k 好像都没用。

不知道是不是刚上线怕用的人多没上全部功能,大家可以再等等。

另外大家如果靠 API调用的话,可以尝试调整 resolution这个参数看有没有用。

第三点就是不是每次都能成功生成图片,比如我这个垓下之战的条漫没有生成成功,即使我后面明确让他生成图片,也还是没成功,具体原因暂时还不清楚。

七、结语如果你只是想玩图,Nano Banana 2 只是“更好玩的模型”。但如果你是做 AI 视频、AI 漫剧、短剧、广告、分镜链路的人,它可能会是你接下来工作流里第一个要占坑的位置。我们以前一直在等一个东西:让 AI 从“好看”进化到“可交付”。现在它来了。你可以继续怀疑它是不是短期 hype。但我建议你自己去跑一遍“变态分镜题”。跑完你就懂我为什么会这么说。当然他的强大不仅仅局限在 AI 视频创作过程中,还有更多的场景需要结合大家具体场景使用。用了之后我真的激动得一晚上睡不着,像是图片的ChatGPT4时代,真不敢相信 AI 进步这么快,还好我们做的是 AI 视频,还需要一段时间,不过估计那一天也很快到来了吧。不愧是巴菲特老爷子最近都投资的 AI,能让小白一使用下来就能直观看到,是颠覆性的产品。
https://www.feishu.cn/community/article?id=7566616559762800641详细介绍大家阅读这篇介绍文章:👇一份30万字的AI心得,我们想毫无保留地分享给你

推荐阅读
