
所以我和Lovart 一拍即合,从人物海报、产品设计、推理能力、分格漫画、多文字信息图、文字翻译6个方面对比了20个case,让大家全方位地感受 Nano Banana Pro 和 Nano Banana 2 的区别。Here we go!
ps.下面的所有对比图顺序都为左边是原图,中间是Banana Pro生成,右边是Banana 2生成。先看几组人物海报,这张图我是让Banana Pro(中间)和Banana 2(右边)把我的照片改成黄色寸头,然后做了一个 Vogue 风格的封面。可以看到,两张图在人脸部分其实没什么太大区别,但是一张保留了眼镜,一张没有保留。其实这个我并没有给出具体的提示,整体上来看差别不大。



再看看直接通过文生图,让Banana Pro(左)和Banana 2(右)以同样的提示语做了一张巴黎世家的人物贴图海报,人物形象、画面构图以及文字展示,都是让它根据巴黎世家的品牌调性去设计的。实际上可以发现,从普通人的视角来看,其实看不出太大的区别,都还挺帅的。


但是到了全身照这里,我同样用了自己原本的那张自拍图,但会发现Banana 2(右)全身照的人脸和我原本的脸相差了很多。


然后再看一张设计感比较强的照片。图片是用各种各样的手机屏幕设备,把我的脸拼接在一起。实际可以看到,Banana 2(右)的执行能力会稍微差一点,首先设备的选择就不太对,有一些屏幕根本就不是正常设备里面的屏幕,而且整个画面的拼接也有点错误。


然后我们来看关于产品,以及一些品牌设计相关的展现,首先是做一个KITKAT的信息图展现,Banana Pro(左) 做出来的图片,整体来看确实更美观一些,大家可以检查一下这里面的文字信息,因为我让它填补的文字信息比较多,可以对比检查一下文字信息有没有错误。


然后是做一个创意logo的展现,区别也不大,Banana Pro(左)给这个 logo 加了一个底色,和原图更加贴近。但像Banana 2做的这种纯文字渲染的 logo 也挺好看的。


还做了一个比较好玩的尝试,是把给到的产品图做成一半实体、一半具有科技感的虚拟线效果。事实上,不管是 Banana Pro(左)还是 Banana 2(右),这两个产品的展现效果和细节处理都非常出色且丰富。


关于品牌这块,我还做了一个比较经典的图,是可口可乐的发展信息图,文字信息包含得也很多,整个产品罗列整体上看是没有什么区别的。左边 Banana Pro 给出了塑料瓶装的可乐,但是没有听装的;右边Banana 2是有听装,但没塑料瓶装。因为给出的提示语比较泛概念,让它自己去查找信息并根据自己的世界信息去推理生成的。所以这两张图在我这里来看区别不大,整体完成质量都很高。


然后还给了一个手机皮套的图,整个的光影质感在我看来区别也不大,整个产品的细节展示也都很好,从审美的角度来看,我可能会更喜欢右边 Banana Pro 生成的这个效果。



再看看推理能力的对比,首先是根据一句诗句“采菊东篱下,悠然见南山”,让它给我想象并画出对应的画面。Banana 2(右)画出了一个更加完整的展现,把诗句补全并写在了画面上,整体来看,表现都还是很不错的。


然后我又让它们给我画了一张高中物理课本风格的插图,展示小球的平抛运动轨迹。清晰标注初速度 v0(水平方向)和重力加速度 g(垂直向下)。有没有物理学好的人,来给我看一下这两个图画得都对不对。。。


再来个数学好的,给我看看这道数学题,他们两个解得都对不对哈哈哈哈哈



然后给它们两个角色,让它们画这两个角色的分格漫画。可以看到,其实 Banana 2表现得会更好,它会画出更加完整的一段剧情,画面也会更加丰富。


包括我给到它的部分,可以指定它想要的那种漫画风格。我给到它我们家小猫的照片,让它们做一个鬼灭之刃画面风格的冒险漫画,也是 Banana 2(右)的画面细节会更多一点,设计的剧情也更丰富一些。


其实上面很多图里已经可以看到文字的展示了。Banana 2现在的表现,对于多文字的展现实力依旧不弱,甚至我觉得使用起来会感觉更稳定。接下来这几组对比,都是比较关注在文字上的。比如之前 Banana Pro 时期就已经很火的玩法,让它扮演一个角色,并根据你给的主题去设计一张海报。可以看到 Banana Pro(左)整个的配图会更多,文字排版也会让视觉感受更加舒服。但是 Banana 2(右)放入了更多的文字,整体还是根据大家各自的审美需求来选择,这一部分我个人会更偏向于 Banana Pro。


再到大家会比较关注的,这种画攻略图和画菜谱图,其实我个人感觉差别不大。你想要的文字信息,它都能够展示出来,表现也都比较稳定。




那从给图片上的翻译角度上来说,像Banana 2(右) 对于原图的改变就会比较大,它连背景都调整了一下。



那关于漫画上色的这一部分,从我个人体验上来说,Banana 2(右)得到可用的、文字内容不错乱的画面的抽卡次数会少于 Banana Pro(左),因为我记得当时给 Banana Pro 抽这个翻译的时候,至少抽了十几二十次吧,但是现在 Banana 2 基本上三四次就能得到一张可用图。



而且配合上我们之前介绍过很多Lovart中专业的图像二次编辑功能,比如说精准编辑-Touch Edit、编辑文字、样机Mock up、图片分层编辑等等,具体使用方法可以看我之前的文章。有了Banana2后,我想看看设计Agent能不能活下来现在加上 Banana 2 更快的速度以及更便宜的价格,实际上能够实现更大批量的图片输出。终于测完了,现在大家的感受肯定更直观了。我是感觉,随着模型的迭代,实际上可以给大家更多的选择,这中间其实不存在模型能力的下降,而是看你到底需要做什么,它能够匹配你更精准的需求。如果你想追求更高质量,可以选择多花一点钱,选择 Banana Pro,如果你想快速出预览,或者追求更快的速度和更高的性价比,其实 Banana 2 就完全够用了。那现在,我又开始坐等下一款香蕉Pro2的诞生了。
@ 作者 / 卡尔 & 阿汤
