搞懂这个AI生图/视频的底层逻辑,成功率提升10倍!

AI 知识库19小时前发布 AIGCPM
1,225 0 0
熊猫办公

无论是生成图片还是视频,相信你也遇到过类似这样的情况,想让AI生成一张图像,但AI生成的图像和提示词关系不大。


例如,你想让AI生成一张“男生在拿手机打游戏”的图片,结果生成的图片总是让游戏画面显示在观众视角,男孩却对着手机背面。

搞懂这个AI生图/视频的底层逻辑,成功率提升10倍!
很多新手在玩AI绘画时,总觉得用AI生成图片或视频时,就是在抽卡模式,输入提示词生成多张,直到AI生成满意的一张为止。

但事实并非真是这样,当了解了AI生成图片的底层逻辑时,发现之所以AI生成图像会翻车,往往是因为提示词让AI掉进了联想的陷阱。

今天,我就把这个底层逻辑拆解给你看,零基础用户也能看懂,帮你彻底告别完全凭运气抽卡式生图。


一、AI脑补能力很强,会造成提示词污染
你有没有发现,当你给AI一个关键词时,AI往往会附赠你一整套关于这个关键词联想的提示词。

例如,当你输入“宇航员”这个提示词时,AI的脑海里就会自动浮现出关联的提示词,常常会有宇航服、头盔、月球表面等等。

你让AI生成一张宇航员的图片时,大概率会包含以上这些关联提示词的元素,这就是所谓的提示词污染。

提示词污染是指AI会因为某些关键词产生“联想陷阱”,自动脑补出一整套关于提示词联想的场景图。

即使你在提示词里明确要求,不要出现XX,AI的注意力也已经被这个词联想到了。

AI本质上是一个概率预测的机器,在它的训练数据里,相关联的词汇容易产生在一起出现,如果你想规避这种情况,不要用否定词,而要用具体的替代词去给AI进行提示。

二、为什么AI有时候不理解你的动作
在AI生成图像的过程中,如果把一堆动词写在提示词里面,比如奔跑、跳跃、欢笑等,结果发现AI生成出来的动作极其僵硬,甚至会出现非常糟糕的图像。

因为AI根本不理解什么是动作,它不理解物理世界的客观规律,有一个方法可以让AI更好地理解提示词,这个方法可以叫:视觉代偿。

视觉代偿是指AI在处理抽象的动作时,会通过添加具象的视觉元素来进行补偿。

例如,你想生成含有速度感的场景图片或视频,如果你只写一个男人在飞快地奔跑,AI大概率无法生成速度感的场景。
搞懂这个AI生图/视频的底层逻辑,成功率提升10倍!
如果换一种提示词写法,把那些能体现速度的视觉元素都描述出来可以这样写:“一个男人在奔跑,图像含有飞溅的泥土和汗水,男人头发被风吹得向后飘扬,背景具有动态模糊感。”
搞懂这个AI生图/视频的底层逻辑,成功率提升10倍!
当你把这些细节告诉AI时,AI就不需要理解什么是快速奔跑,就能通过这些视觉元素,生成出速度感的图像。

以上这种提示词的写法就叫视觉代偿,通过视觉化描述AI难以理解的动作或场景。

三、空间思维转向镜头思维
大部分人写提示词会先描述一个宏大的场景,然后再想在这个场景添加提示词内容。

例如精彩会这样写:“在一个遥远的星球上,有一座巨大的城市,城市中心有一个喷泉,喷泉旁边站着一个少年。”

这种空间思维的写法有时候会让AI的注意力非常分散,最后生成出来的效果往往重点不突出。

有一种更好的提示词写法,就是把自己想象成一个摄影师,将空间思维描述词转向镜头的思维去表达。

先不去想整个空间,而直接描述此时此刻,描述镜头里能看到什么,然后用提示词表达出来。

这类方法有一套万能的提示词公式:[主体描述] + [环境细节] + [视觉代偿元素] + [光影/镜头语言]

实战案例,如果你想画一个在雨中失落的少年,提示词这样写:“一个少年,在下雨,他很伤心。”
搞懂这个AI生图/视频的底层逻辑,成功率提升10倍!
以上这样生成的图片没有完全体现少年的伤心,上面的提示词可以这样写:“一个少年的近景特写,雨水顺着发尖滴落(主体),背景是霓虹闪烁但模糊的街道(环境),少年低垂的眼睑和紧锁的眉头(视觉代偿),冷色调的侧逆光,电影感宽画幅(光影/镜头)。”
搞懂这个AI生图/视频的底层逻辑,成功率提升10倍!
两种不同的提示词写法,生成完全不一样的图像,生成视频同样可以用此方法。

四、总结
AI生图或AI生成视频,不完全是凭运气去抽卡,很多时候提示词的写法很重要。

当你在写图像/视频生成的提示词时,可以试着闭上眼睛,想象自己正拿着一台相机进行拍摄取景。

以上就是今天分享的提示词污染和空间思维转向镜头思维的全部内容,以后可以尝试用这种方法去试试写提示词。

如果你觉得以上内容有用,记得关注我,或者点赞、收藏、转发。我是

© 版权声明

相关文章