
最近Nano Banana(又名 Gemini 2.5 Flash Image)太火爆了,全球用户的创作欲爆棚,比如下边这个我在X上刷到的一条视频,效果非常赞,
使用Nano Banana 将著名的电影人物搬到了当代纽约的浪漫场景中!它的原生多模态架构只需一步即可处理文本和图像,从而释放出强大的功能,如对话式编辑、多图像合成和逻辑推理。再加上 Seedance 和 Kling 共同生成这样的视频。这段时间就有很多小伙伴找Nano Banana的好用的提示词,用法等等,这不,谷歌官方直接出手,推出了官方认证的Prompt最佳实践!
“原文:https://developers.googleblog.com/zh-hans/how-to-prompt-gemini-2-5-flash-image-generation-for-the-best-results/
甲木这就来给大家翻译整理一下~

如何写出Gemini 2.5 Flash图像生成Prompt以获得最佳效果Gemini 2.5 Flash Image是Google最新、最快、最高效的原生多模态模型。它的独特之处在于其原生多模态架构,它从训练开始就能够在同时处理文本和图像。这使其具备了超越简单图像生成的强大功能,如对话式编辑、多图像合成和图像内容的逻辑推理。我们可以实现:
-
文本 –> 图像:根据文字描述生成高质量图像。 -
图像+文本 –> 图像(编辑):提供图片并使用文字提示添加、删除或修改元素,更改样式或调整颜色。 -
多图像到图像(构图和风格转换):使用多个输入图像合成新场景,或将风格从一个图像转移到另一个图像。 -
迭代完善:在多轮对话中逐步完善图像,并做出微小调整。 -
文本渲染:生成包含清晰、布局合理的文本的图像,比如LOGO、图表和海报等等。
本指南将教您如何编写提示和提供说明,以便从Gemini 2.5 Flash中获得更好的结果。一个基本原则!!
“描述场景,而不仅仅是列出关键词。该模型的核心优势在于其深度语言理解能力。叙述性的描述段落比简单的不相关词汇列表产生更好、更连贯的图像。
其实就是写场景,纯自然语言描述。比如:√ 一个女孩站在沙滩上看向男孩,远方的夕阳逐渐落下,天空中偶尔有几只海鸥飞过。× 女孩,沙滩,男孩,夕阳落下,海鸥飞过🌹文生图场景1. 写实类场景图要想获得写实场景,就要像摄影师一样思考。提及相机角度、镜头类型、光线和细节,将引导模型获得逼真的效果。模板:
-
英文:A photorealistic [shot type] of [subject], [action or expression], set in [environment]. The scene is illuminated by [lighting description], creating a [mood] atmosphere. Captured with a [camera/lens details], emphasizing [key textures and details]. The image should be in a [aspect ratio] format. -
中文:在[环境]中拍摄[主体]、[动作或表情]的逼真[镜头类型]。场景由[灯光描述]照亮,营造出[情绪]氛围。使用[相机/镜头细节]拍摄,突出[关键纹理和细节]。图像应采用[宽高比]格式。
提示示例:这是一幅写实类特写肖像画,画中的日本老年陶艺家脸上布满皱纹,带着温暖、会心的微笑。他正在仔细检查一个刚上釉的茶碗。背景是他那充满乡村气息、阳光照射的工作坊。柔和的黄昏光线透过窗户照射进来,突出了陶土的细腻质感。使用85mm人像镜头拍摄,背景柔和模糊(虚化)。整体氛围宁静而精湛。竖版肖像。


2. 风格化插图和贴纸明确说明风格,如果需要白色背景,记得请求白色背景。模板:
-
英文:A [style] sticker of a [subject], featuring [key characteristics] and a [color palette]. The design should have [line style] and [shading style]. The background must be white. -
中文:一个[风格]的[主题]贴纸,具有[关键特征]和[色彩搭配]。设计应该有[线条风格]和[阴影风格]。背景必须是白色。
提示示例:这是一张卡哇伊风格的贴纸:一个可爱风格的快乐小熊猫,戴着一顶小竹帽。它正在咀嚼一片绿色竹叶。设计具有粗体、干净的轮廓线,简单的cel-shading,以及鲜艳的色彩搭配。背景必须是白色。

3. 图像中的准确文本Nano Banana还可以在图像中渲染文本。请明确说明您想要的确切文本,描述字体风格,并设置整体设计。模板:
-
英文:Create a [image type] for [brand/concept] with the text “[text to render]” in a [font style]. The design should be [style description], with a [color scheme]. -
中文:为[品牌/概念]创建一个[图像类型],其中包含”[要渲染的文本]”字样,采用[字体风格]。设计应该是[风格描述],配色方案为[色彩方案]。
提示示例:为一家名为”The Daily Grind”的咖啡店创建一个现代、简约的LOGO。文本应采用干净、粗体、无衬线字体。设计应该包含一个简单、风格化的咖啡豆图标,与文本无缝集成。配色方案是黑白色。

4. 产品样机和商业摄影为电子商务、广告或品牌创建干净、专业的产品照片。模板:
-
英文:A high-resolution, studio-lit product photograph of a [product description] on a [background surface/description]. The lighting is a [lighting setup, e.g., three-point softbox setup] to [lighting purpose]. The camera angle is a [angle type] to showcase [specific feature]. Ultra-realistic, with sharp focus on [key detail]. [Aspect ratio]. -
中文: 一张高分辨率、棚拍的产品照片:一个 [产品描述],放在 [背景表面] 上。光线使用 [布光方式] 来 [光照目的]。相机角度为 [拍摄角度],突出 [产品特征]。画面超真实,重点对焦在 [细节]。[长宽比]。
提示示例:一张高分辨率、棚拍的产品照片:一只黑色哑光陶瓷咖啡杯,放在抛光的混凝土台面上。三点柔光灯布光,营造柔和的高光并消除硬阴影。拍摄角度为稍高的 45 度,以突出干净的线条。画面超真实,焦点在咖啡升起的蒸汽上。正方形图像。

5. 极简和留白设计为网站、演示文稿或营销材料创建背景,在其中叠加文本。模板:一个极简构图,在画面的[右下角/左上角/等]位置放置单个[主题]。背景是一个广阔、空旷的[颜色]画布,创造出显著的负空间。光线柔和。[宽高比]。提示示例:一幅极简构图:一片精致的红枫叶位于画面右下角。背景为空白的米白色画布,为文字留出充足空间。左上方有柔和的散射光。正方形图像。

6. 连环画/漫画/故事板通过专注于清晰的场景描述,逐个面板创建叙事,是开发故事板、连环画或任何形式连续艺术的理想选择。模板:一幅单独的漫画分镜,风格为 [画风]。前景是 [角色描述和动作]。背景是 [环境细节]。画面中有 [对话/字幕框],文字为『[文本]』。光线营造 [氛围]。[长宽比]。提示示例:一幅黑色硬派风格的漫画分镜,使用高对比黑白墨线。前景是一名风衣侦探,站在闪烁的路灯下,雨水打湿了肩膀。背景是荒凉酒吧的霓虹灯倒映在水洼中。画面顶部有字幕框写着『The city was a tough place to keep secrets.』。光线强烈,氛围戏剧而沉重。横版。

🌈 使用文本编辑图像可以提供一个或多个图像以及文本提示进行编辑、构图和风格转换。1. 图像编辑:添加和删除元素提供一张图像并简单描述您想要的更改。模型将分析原始图像的风格、照明和透视,使编辑效果自然,并在一系列图像中保持角色一致性。模板:使用提供的[主题]图像,请向场景[添加/删除/修改][元素]。确保更改是[描述更改应如何融入到原作当中]。提示示例:使用我家猫的照片,请在它头上加一顶小的针织巫师帽。要让它看起来戴得很自然,并且与照片的柔和光照相匹配。

2. 局部绘制:编辑特定区域您可以对话式地告诉Gemini 2.5 Flash Image只编辑图像的一部分,而让其余部分完全不变。模板:使用提供的图像,仅将[特定元素]更改为[新元素/描述]。保持图像中的其他所有内容完全相同,保留原始风格、光照和构图。提示示例:使用提供的客厅图像,仅将蓝色沙发更改为复古的棕色皮革切斯特菲尔德沙发。保持房间的其余部分,包括沙发上的枕头和光照效果,都保持不变。

3. 风格转换提供照片并要求模型以特定风格或艺术运动重新创建其内容。模板:将提供的[主题]照片转换为[艺术家/艺术风格]的艺术风格。保留原始构图,但用[风格元素描述]渲染。提示示例:将这张现代城市夜景照片转化为梵高《星空》的艺术风格。保持原有的建筑与汽车构图,但使用旋转的厚涂笔触,以及深蓝与亮黄色的戏剧性色彩来渲染画面。

还有 X 上的

4. 高级构图:多图组合提供多个图像作为上下文来创建全新的合成场景。这非常适合电商场景和创意拼贴场景。模板:通过组合提供图像中的元素创建新图像。取[图像1中的元素]并将其与[图像2中的元素]放置在一起。最终图像应该是[最终场景的描述]。提示示例:生成一张专业的电商时尚照片。将第一张图中的蓝色碎花连衣裙穿在第二张图中的女性身上。生成一张逼真的全身照,并调整光线与阴影以匹配户外环境。

5. 高保真细节保留为确保在编辑过程中保留关键细节(例如面部或LOGO),请在编辑请求中详细描述这些细节。提示示例:取第一张图片中那位棕发蓝眼、表情中性的女性。将第二张图片中的标志添加到她黑色T恤上。确保女性的面部特征完全保持不变。标志应呈现出自然印制在布料上的效果,顺应衬衫的褶皱纹理。

最佳实践在生成图像时,还有一些额外技巧:
-
尽量具体:你提供的细节越多,控制力就越多。不要说”幻想盔甲”,而要描述它:”华丽的精灵板甲,刻有银叶图案,高领和形状像猎鹰翅膀的护肩。” -
修复角色一致性漂移:如果您注意到角色的特征在多次迭代编辑后开始漂移,您可以用详细描述重新开始新对话以保持一致性。 -
提供上下文和意图:解释图像的用途。例如,”为高端、极简护肤品牌创建logo”比仅仅”创建logo”会产生更好的结果。 -
迭代和完善:不要期望第一次尝试就能得到完美的图像。使用模型的对话特性进行小的更改。多轮对话,比如,”很好,但您能让照明更温暖一点吗?”或”保持其他所有内容相同,但将角色的表情改为更严肃。” -
使用”语义负面提示”:不要说”没有汽车”,而要积极描述所需的场景:”一条空旷、荒凉的街道,没有交通迹象。” -
宽高比:编辑时,Gemini 2.5 Flash Image通常保留输入图像的宽高比。如果没有,请在提示中明确说明: "更新输入图像...不要更改输入宽高比。"如果您上传具有不同宽高比的多个图像,模型将采用最后提供的图像的宽高比。如果您需要新图像的特定比例而提示没有产生它,最佳实践是提供具有正确尺寸的参考图像作为提示的一部分。 -
控制相机:使用摄影和电影语言来控制构图。诸如 广角镜头、微距镜头、低角度透视、85mm人像镜头和荷兰角度等术语为您提供对最终图像的精确控制。
局限性虽然Gemini 2.5 Flash Image是一个强大且多功能的工具,但对于高度细致的请求,在第一次尝试时达到完美可能需要一些迭代。
-
生成复杂的排版需要多试几次 -
多个图像中保持角色特征的绝对一致性有时需要通过后续提示进行完善 -
该模型在输入最多 3 张图片时效果最佳。 -
在为图片生成文字时,最好先生成文字,然后再要求生成包含该文字的图片,这样 Gemini 的效果会更好。 -
所有生成的图片都包含SynthID 水印。
“都有数字水印哦,google专门用于为 LLM 生成的文本添加水印和检测此类文本的工具
接下来呢?开始创作吧!您现在拥有了帮助您使用Gemini 2.5 Flash创建和编辑令人难以置信的图像的基础技能。改进的最佳方法是练习。以下是一些资源来帮助您的旅程:
-
在Google AI Studio中探索Gemini:开始尝试本指南中技术的最简单方法是使用我们的基于网络的工具。 -
阅读官方文档:对于想要将Gemini 2.5 Flash的图像生成功能集成到自己应用程序中的开发人员。 -
查看定价:了解在您的项目中使用Gemini API的Gemini 2.5 Flash Image生成相关的成本。 -
尝试图像编辑小程序:测试AI驱动的照片编辑,应用创意滤镜,或使用简单的文本提示进行专业调整。
结语关于大家经常刷到的手办类图片,


官方也发布了prompt,

大家可以去参考~好了,到这里谷歌官方发布的这份权威指南,就给大家分享完毕了。现在,理论知识已经装入大脑,剩下的,就是尽情挥洒你的想象力,将脑海中的奇思妙想变为惊艳的现实。毕竟,技术的意义,终究是为人服务,让每一个人的创造力都能被看见。
我是甲木,一个热衷于分享AI干货和落地应用的老朋友。老规矩,【点赞👍】+【在看👀】+【转发↗️】走一波!你的每一个支持,都是甲木继续探索AI新奇特功能的强大动力!欢迎在评论区踊跃发言,和甲木一起交流,一起进化!我们下期再见👋🏻
