谷歌对于AI的战略布局,可谓“片地开花”来形容。我们的推文一边在写谷歌notebooklm的八大金刚,今天,又钻进了谷歌实验室——专为视听处理的四大天王:

Whisk的中文译音叫做“搅拌器;打蛋器”。

你看看,主题颜色刚好是鸡蛋黄色,这充分说明这项功能,就如同搅拌器对于鸡蛋——混合。


这个工具的核心玩法是三合一,目的是让出图更符合我们的意图。

将这主题、场景、样式这几种食材炒在一起,得到了……

也就是说,这个应用充分考虑到很多人讲不清楚自己真正想要什么图,还不如直接上参考图,让AI帮你辨析,这是把前期工作做足!让出图更加如你心意!你以为就完了吗?后期也相当给力哟:

1、添加动画效果
也就是让这个图动起来,也就是公式:图片+提示词=视频

效果如下:
(真人版的看后面,想看请移步
)
2、优化你可以在这张图片的基础上,不断地进行文字指示,让画面进行调整:



如果不满意,我们可以点击“重复使用提示”进行REROLL。


3、修改提示词

通过第二步的优化,大家发现没?咱们出图的提示词都不知道被优化成什么样了?别急,只要我们点击这个“无名”图片,就可以找到更改后的提示词了(需要翻译成中文):

这段提示词,其实就是这幅画背后的代码。一方面,我们可以将其复制到其他AI出图应用中去出图(以下是豆包)

豆包出图:

你可以把以上这段出图提示词想象成音乐的五线谱,不同的音乐家演绎肯定有所不同,但大差不差,总不会太离谱。

而我们这段出图提示词,就是我们拿给AI画家演绎的“图谱”,不同的AI只要拿着这段谱,出的图也会非常接近,至于水平,那就要看各个AI模型的绘画造诣了!回到WHISK,我们也可以直接在对话框中进行调整,让AI按照我们修改后的“图谱”让AI出图。

且看,我们改了“谱子”的一小点内容,呈现就马上更正变更了,说明这个出图AI非常敏锐:

现在大家知道了吧?很多音乐一般人听不出个好歹来,但是专业的音乐家,一个音符少半个音,都能敏锐的发觉,至于每个人都有的风格。我们一般人可以听出不同的演唱家演唱的相同歌曲,但不同演奏家演奏的相同曲子,可就不是那么好辨认了。

总结一下,这个WHISK为什么叫做搅蛋器?
它能把AI出图这个事情,彻底理了清楚,首先分解成主题、场景、样式进行了分解,并直接上参考图,这就直击了一个痛点——大多数人是描述不清楚自己想要画面的。就像我们大多数人也没法将自己熟悉的音乐,用谱子写出来,这时候,文字的表达力就不如直接找参照物了,无论是画还是音乐,皆是如此。另外,WHISK还对图片再修改进行了非常贴心的支持,不仅让画面可以优化完善,又可以保持一致性,最后,还能很大方的把“图谱”交出来。我只想说,这个设计团队真的太懂了,Google拿出的,是满满的诚意和智慧。










(AI视频,请勿传播)
