昨晚上谷歌正式发布了Nano Banana 2(Gemini 3.1 Flash Image)新的图片模型,再次登上热榜,Pro级画质直出,Flash级速度,价格约为Pro版一半 ,API定价4K图像约0.151美元/张,2K约0.101美元/张,1K约0.067美元/张(较Pro版降价37%-50%)。
简述下更新主要功能:世界知识 + 实时联网搜索;精准文字渲染与翻译;主体一致性(5角色 + 14物体);4K分辨率和多比例支持;指令遵循能力提升;图像编辑能力。
Lovart第一时间完成接入,文章以实测案例,深度拆解Lovart+Nano Banana 2如何重新定义AI创作工作流。
核心功能实测
Nano Banana 2模型接入了Gemini的整套搜索能力,可以实时调用网络信息进行图像生成 ,能够生成基于真实地理位置和天气数据的图像,可生成信息图表、科普图、食谱、解剖图等知识密集型内容。
生成一张设定在15世纪古威尼斯的“寻找沃尔多”风格游戏图,但需要寻找的目标不是人,而是一只穿着蓝色条纹飞行服的水獭。场景为威尼斯大运河沿岸的繁忙市场,背景有里亚尔托桥和圣马可钟楼的准确轮廓。画面中包含大量身着文艺复兴时期威尼斯服饰的市民、商人、船夫,河上有贡多拉小船穿梭。市场摊位售卖各种商品:水果、丝绸、面具、玻璃制品。那只穿着蓝色条纹飞行服的水獭(蓝白相间连体服,类似飞行员夹克,戴护目镜)隐藏在人群中的某个角落,位置要隐蔽但可辨认。整体风格为细腻的手绘插画风,色彩丰富,细节密度极高,4K分辨率,所有人物的服饰和建筑细节符合威尼斯历史特征。
测试模型对复杂逻辑的理解(威尼斯地标+特定角色+隐藏任务)和多元素融合能力。

生成一张透过窗户看到的室外风景图,模拟“靠窗座位”应用的视角。场景设定为日本东京,当前时间为傍晚17:30,天气为雨后初晴,西边天空出现晚霞。窗户为木质窗框,玻璃上有残留的雨滴,雨滴折射出远处的东京塔和彩虹。窗外可见东京塔的轮廓,塔身亮起橙色的灯光,背景是染成紫红色的晚霞和逐渐亮起的城市灯火。窗台上放着一杯冒着热气的咖啡,咖啡杯倒映出窗外的景色。画面要求真实摄影风格,4K分辨率,光影自然,雨滴折射效果符合物理光学原理,东京塔的位置和形态准确无误。
测试模型调用实时地理位置信息(东京)、天气数据(雨后初晴、晚霞)和地标建筑知识(东京塔)的能力,同时验证光影和折射效果的物理准确性

中文字符乱码问题显著改善,毛笔字、碑文等复杂字体也能准确呈现,支持图内多语言翻译,翻译后画面风格保持一致,可直接生成营销海报、贺卡、产品标签等含文字的图像
印刷字体,中国传统印刷字体,右侧采用古老的宋体字体,【文字内容(必须精准呈古老书籍上)】
《三字经》开篇:
人之初,性本善。性相近,习相远。
苟不教,性乃迁。教之道,贵以专。
昔孟母,择邻处。子不学,断机杼。
窦燕山,有义方。教五子,名俱扬。
养不教,父之过。教不严,师之惰。
子不学,非所宜。幼不学,老何为。
玉不琢,不成器。人不学,不知义。
为人子,方少时。亲师友,习礼仪。
测试模型对中文古诗的完整长文本渲染能力,要求书法风格准确,无错别字。


生成一张第一人称视角的超市AR购物体验图。场景为明亮的超市饮料货架通道,人类的双手将一瓶芬达橘子汽水举到镜头前方。汽水瓶为经典的橙色透明瓶身,标签上清晰显示“芬达”和“FANTA”字样。汽水瓶周围环绕着多层半透明的全息AR界面面板,用中文显示营养数据:上方面板显示“热量:42千卡/100ml”,左侧面板显示“含糖量:10.2g”,右侧面板显示“咖啡因:0mg”,下方面板显示“新鲜度:98%”,背面悬浮面板显示“保质期:2026.12.31”。还有一个小面板基于芬达推荐调酒配方:“橙子莫吉托:芬达+薄荷+青柠”。所有UI面板为玻璃质感,带有柔和的环境光晕,信息层级分明,文字清晰可读。背景货架上摆满各种饮料,景深自然,2K分辨率。
测试模型对复杂UI界面中多段中文文字的精准渲染能力,要求文字排版、字体大小、信息层级符合设计规范

生成一张博物馆展厅内的文物陈列照片,聚焦于一个独立的玻璃展柜。展柜内陈列着一件西周时期的青铜鼎,鼎身有精美的饕餮纹和绿锈。展柜前方放置着一个倾斜的亚克力标签牌,标签牌为深灰色背景,白色文字。
标签牌上的文字内容如下(必须清晰可读):
顶部:西周 青铜鼎(公元前1046-771年)
中部:出土于陕西宝鸡·茹家庄遗址
底部:编号:ZB-1978-026 | 捐赠人:李氏家族
标签牌文字排版要求:中文字体为思源宋体,英文字体为Times New Roman,标题字号略大加粗,信息层级分明。标签牌材质为哑光亚克力,有轻微的反光但文字不被反光遮挡。
展柜玻璃上有微弱的倒影,映出对面展厅的其他展品轮廓。光线为博物馆专业的暖色射灯,从展柜顶部打光,青铜鼎表面有柔和的金属光泽。整体画面要求超写实摄影风格,2K分辨率,焦点精准对焦在标签牌和青铜鼎上。

在单个工作流中,Nano Banana 2最多可保持5个角色的相貌一致和14个物体的特征保真。这对漫画创作、故事板设计、品牌素材批量制作至关重要,无需训练Lora即可实现系列化创作
生成一组6格的儿童故事漫画,讲述三个小伙伴建造树屋的故事。要求保持三个角色的形象完全一致。
角色设定:
1. 小熊布布:棕色毛发,圆耳朵,穿蓝色工装背带裤,戴黄色安全帽,眼睛圆润友善。
2. 小兔跳跳:白色毛发,长耳朵,穿粉色条纹T恤,背绿色小背包,耳朵上绑着红色蝴蝶结。
3. 小松鼠蓬蓬:红棕色毛发,大尾巴,穿格子衬衫,戴黑色框架眼镜,尾巴上系着橙色丝带。
连续6格画面:
第1格:三个小伙伴站在一棵大橡树下,抬头望着树冠,小熊拿着设计图纸,小兔指着树上,小松鼠抱着木板。
第2格:小熊在锯木板,小兔在递钉子,小松鼠在扶梯子。
第3格:树屋底板已经搭建完成,三个小伙伴站在底板上开心地挥手。
第4格:小松鼠用尾巴运送工具,小熊在钉墙板,小兔在窗户位置比划。
第5格:树屋基本建成,有屋顶、窗户和小阳台,三个小伙伴在屋内向外眺望。
第6格:傍晚,树屋亮起温暖的灯光,三个小伙伴在树屋里围坐小桌喝茶,窗外有萤火虫。
整体风格为温馨童趣的彩绘风格,色彩明亮,线条柔和,4K分辨率。要求每格中角色的服装、配饰、面部特征保持一致,树屋的建造进度符合逻辑。
测试模型在多格连续叙事中对3个角色的一致性格纳能力

场景类型:都市悬疑短剧第1集,咖啡厅对话场景,共12个分镜
角色设定:男主角30岁西装精英,女主角28岁记者装扮,两人对坐
镜头语言:分镜1-3全景建立场景,分镜4-8中景对话,分镜9-12特写情绪
画面风格:电影分镜稿风格,类似大卫·芬奇《消失的爱人》色调
色调统一:冷蓝灰色调,低饱和度,高对比度,统一LUT滤镜
分镜编号:每张图右下角标注”Scene 01 Shot XX”,字体统一
批量参数:一次生成12张,保持人物角色、场景、色调完全一致
【分镜序列提示词变体】
分镜1:[广角] 咖啡厅外景,雨天,男女主角先后进入
分镜2:[中景] 两人坐下,服务员递上菜单
分镜3:[特写] 男主角眼神闪烁,手部微抖
分镜4:[过肩] 女主角提问,男主角回避眼神
…(依次类推至分镜12)
【一致性锁定参数】
角色锁定:启用,参考图5张
场景锁定:启用,咖啡厅环境固定
色调锁定:启用,统一冷蓝灰LUT
风格锁定:启用,电影分镜稿风格

生成一张传统中医诊所的内部场景照片,要求画面中包含以下14个指定物体,所有物体的特征必须清晰可辨且保持一致(用于后续多角度生成测试):
1. 深棕色实木中药柜:靠墙摆放,高至天花板,带有数百个小抽屉,每个抽屉正面有白色圆形标签,标签上的文字模糊但可辨认是汉字。
2. 铜质药碾:放在中药柜旁的小桌上,船型,带滚轮,表面有自然氧化痕迹。
3. 老式杆秤:黄铜秤杆,红色秤砣,挂在墙上的钉子上。
4. 青花瓷药罐:大肚小口,白底蓝花,放在柜台角落,罐口用红布扎紧。
5. 脉枕:深蓝色棉布,方形微鼓,放在诊桌上。
6. 毛笔和砚台:诊桌上放着已经干涸的砚台和一支悬挂的毛笔,笔架为木质。
7. 针灸铜人:小型半身模型,表面标注经络和穴位点,放在书架顶层。
8. 木制招牌:墙上挂着一块横匾,刻着“悬壶济世”四个金色大字,木质深棕色。
9. 玻璃罐浸泡标本:靠窗的架子上放着几个玻璃罐,内有浸泡的蛇、蝎子等药材标本。
10. 老式算盘:木质,黑色珠子,放在柜台台面上,珠子上有使用磨损痕迹。
11. 中药包装纸:柜台上一叠方形牛皮纸,纸上印有红色店铺印章(圆形,字迹模糊但可见红印)。
12. 铜质药勺:长短不一的几把铜勺,插在竹筒里。
13. 人体经络图挂图:墙上挂着一张泛黄的人体经络图挂图,图上有人形和红色线条。
14. 候诊长椅:老旧木质长椅,深棕色,可坐三人,椅面有磨损光泽。
场景氛围:午后阳光从木质窗棂射入,在室内形成斑驳的光影,空气中隐约可见细微的尘埃。所有物体布局自然,相互遮挡关系合理,细节极致清晰,4K分辨率,写实摄影风格,景深适中。
光线要求:暖色调自然光,光线从左侧窗户射入,产生柔和的长阴影,突出物体的质感和岁月痕迹。
一个传统中医诊所的固定场景,包含14件标志性物品,后续可在不同角度、不同光线条件下生成新图,验证物体一致性

图中的20个毛绒玩具在冰川背景下集体合影,所有形象保持一致


增强的指令执行能力,能更严格地遵循复杂提示词,
生成一张1:4比例的竖屏长图,展现一座垂直城市的剖面结构,从上到下依次为:
顶部(云端):摩天大楼的顶层,有直升机停机坪、空中花园、无边泳池,云层缭绕。
中上部(高层):高级住宅区,落地窗前可俯瞰城市,室内有奢华装修,人们在享受下午茶。
中部(中层):商业办公区,开放式办公室内白领在工作,会议室有正在进行的会议。
中下部(低层):商业街区,临街店铺(咖啡馆、书店、便利店),行人在购物散步。
底部(地下):地铁站,列车正在进站,乘客上下车,站台有广告灯箱。
最底部(地下深处):基础设施层,有水管、电缆、通风管道等城市“血管”。
画面要求从顶部到底部垂直衔接自然,建筑结构和光影符合每层的光照条件(顶部阳光充足,底部人工照明),细节极其丰富,4K总分辨率,插画与写实结合的风格。
测试复杂逻辑的提示词以及多个时间段,多个场景构图的衔接和光照处理逻辑

生成一张比例的超宽幅城市全景图,展现上海陆家嘴金融区从清晨到夜晚的时光流逝。画面从左至右依次呈现:
左侧(清晨5:00):东方明珠、上海中心等建筑在晨雾中若隐若现,天空泛起鱼肚白,黄浦江面平静,有早起的船只航行,路灯还亮着,街道空旷。
中左(上午9:00):阳光完全升起,建筑清晰明亮,车流增多,江面有渡轮穿梭,行人开始出现在滨江步道。
中央(正午12:00):阳光直射,建筑阴影最短,天空湛蓝,白云朵朵,江面波光粼粼,观光游船满载游客。
中右(傍晚17:30):夕阳西下,建筑被染成金色,天空呈现橙红到紫蓝的渐变色,华灯初上,部分建筑开始亮灯。
右侧(夜晚20:00):夜色完全降临,所有建筑灯火通明,灯光秀开启,江面倒映璀璨灯光,游船也亮起彩灯,天空深蓝色。
要求所有建筑的形态、位置准确,光影过渡自然,江面倒影真实,天空颜色渐变流畅,4K总分辨率(即宽度至少8192像素),细节极致清晰,超写实摄影风格。

生成一张复古风格酒吧角落的室内照片,夜晚暖光照明,要求严格遵循以下所有细节:
【空间布局】
– 场景:木质吧台,台面为深色胡桃木,有岁月磨损痕迹。吧台后方的酒架上摆满各式酒瓶,酒瓶标签有文字(如“Jack Daniel’s”、“Absolut”),要求文字清晰可辨。
– 吧台前有一张高脚凳,凳子上坐着一位身穿皮夹克的男性顾客(40岁左右,络腮胡),他正侧身望向吧台内的调酒师。
– 吧台内站着一位调酒师(28岁左右,女性,扎马尾,白衬衫黑马甲),正在用力摇晃手中的不锈钢调酒壶,调酒壶运动轨迹模糊,体现动态感。
– 吧台角落有一支小型爵士乐队:钢琴手(老年男性,戴礼帽)在弹奏立式钢琴,萨克斯手(中年男性)站在旁边吹奏,两人互动自然。
–背景墙上挂着一台圆形复古时钟,时钟必须指向晚上10点10分(时针在10偏11之间,分针指向2)。
【核心物体细节】
– 吧台上,紧靠顾客手边放着一只勃艮第红酒杯,杯内装有深红色红酒,液面必须完全水平且微微凸起形成半月形(表面张力效果),杯壁上挂有酒泪。杯中漂浮着两块正在融化的冰块,冰块呈半透明,边缘圆润,内部有细小裂纹,冰块体积约为刚放入时的三分之二大小,周围有融化的水线。
– 酒杯旁边有一个小碟子,内装几颗橄榄和花生。
– 灯光从上方吊灯洒下,暖黄色,在酒杯上形成明亮的高光,冰块表面有折射光影,红酒液面反射出吊灯的倒影。
– 吧台表面有水滴和酒渍,反射周围灯光。
【动作与互动】
– 调酒师摇酒动作要体现动态模糊,调酒壶抛起的瞬间。
– 顾客微微张嘴,似乎正在与调酒师交谈。
– 乐队成员演奏姿态自然,钢琴手手指按压琴键清晰。
【画质要求】
4K分辨率,电影感布光,景深适中(前景酒杯和调酒师清晰,背景乐队略柔化),色彩浓郁饱和,真实摄影风格。所有文字(酒标、时钟数字)必须准确无误,时钟指针位置精确,液面水平符合物理规律。

Lovart
Lovart的文章写过很多篇,Lovart第一时间接入NanoBanana2,立刻就体验上了。主要是NanoBanana2便宜,适合短剧图片生成、电商图批量制作、剧情分镜、视觉小说等高频出图场景。大量生成时优势明显,搓图体验非常爽,以电商sku主图为例,让Lovart一口气生成50张(以前产品拍摄,后期修图排版不知道要浪费多少人工成本,现在靠AI一键生成50张,随便挑随便选)


Lovart我身边用过的朋友都跟我反馈,香蕉的模型+画布功能很好用,他们做商单,做短剧根本离不开。
画布就像一个海量素材资产库,生成出来的内容都在画布内存档,画布支持一键爆炸图,图片上所有元素支持分层编辑,单个元素可以单独编辑;画布内支持编辑文字,做公众号封面必用;样机Mockup就是把你的设计,一键贴到任何物体、场景里,自动变成真实效果图;
关于画布功能的详细演示可以看这篇文章不会PS也能精准改图!AI创作的门槛被Lovart踏平了
最后
为什么推荐Lovart,因为Lovart里Agent功能,一次支持100张以上分镜图片生成,上下文有记忆,生成分镜稳如泰山。相比gemini 只能连续几张就中断来说,Lovart更适合批量制作,视频模型Lovart也有接入,可以在画布内完整出图,出视频创作。一句话总结:NanoBanana2提供了顶级的原材料,而Lovart让你拥有了整条工业化生产线。
最后Lovart活动折扣最高五折,Nano Banana 2支持365无限0积分使用(闲时),创作门槛和成本再次下降,Lovart官网:https://www.lovart.ai/
#AI工具#AI视频#AIGC#Lovart#AI#NanoBanana2




‘),
create_time: JsDecode(‘2026-02-28 10:44’),
cdn_url: JsDecode(‘https://mmbiz.qpic.cn/mmbiz_jpg/vXmTzwROFTBxk1fRZWUl7icwcQrstK5rfhXVdiaibiaDdLv4MZGKMsjzvXbAHmezvaP4csw6J0tre9YzcjCAXYibLA705bYVAibrMvIb8Y6ibY31ac/0?wx_fmt=jpeg’),
link: JsDecode(‘https://mp.weixin.qq.com/s?__biz=MzkxMzc1Mzk0OA==&mid=2247494948&idx=1&sn=7a6fd600a17664770411c88dea43b7ce&chksm=c095bcd14e9fc4559e557b397ccabebe45421e458f4a02f54d89dd6cb7c7a0ae2b91a1755151#rd’),
source_url: JsDecode(”),
can_share: ‘0’ * 1,
alias: JsDecode(‘aywlgh_e6041a3fb9cb’),
type: ‘9’ * 1,
author: JsDecode(‘
