走进Google“实验室”——Whisk（搅蛋器）

AI 知识库8个月前发布驰💗

9,391 0 0

谷歌对于AI的战略布局，可谓“片地开花”来形容。我们的推文一边在写谷歌notebooklm的八大金刚，今天，又钻进了谷歌实验室——专为视听处理的四大天王：

Whisk的中文译音叫做“搅拌器；打蛋器”。

你看看，主题颜色刚好是鸡蛋黄色，这充分说明这项功能，就如同搅拌器对于鸡蛋——混合。

这个工具的核心玩法是三合一，目的是让出图更符合我们的意图。

将这主题、场景、样式这几种食材炒在一起，得到了……

也就是说，这个应用充分考虑到很多人讲不清楚自己真正想要什么图，还不如直接上参考图，让AI帮你辨析，这是把前期工作做足！让出图更加如你心意！你以为就完了吗？后期也相当给力哟：

1、添加动画效果
也就是让这个图动起来，也就是公式：图片+提示词=视频

效果如下：

（真人版的看后面，想看请移步）

2、优化你可以在这张图片的基础上，不断地进行文字指示，让画面进行调整：

如果不满意，我们可以点击“重复使用提示”进行REROLL。

3、修改提示词

通过第二步的优化，大家发现没？咱们出图的提示词都不知道被优化成什么样了？别急，只要我们点击这个“无名”图片，就可以找到更改后的提示词了（需要翻译成中文）：

这段提示词，其实就是这幅画背后的代码。一方面，我们可以将其复制到其他AI出图应用中去出图（以下是豆包）

豆包出图：

你可以把以上这段出图提示词想象成音乐的五线谱，不同的音乐家演绎肯定有所不同，但大差不差，总不会太离谱。

而我们这段出图提示词，就是我们拿给AI画家演绎的“图谱”，不同的AI只要拿着这段谱，出的图也会非常接近，至于水平，那就要看各个AI模型的绘画造诣了！回到WHISK，我们也可以直接在对话框中进行调整，让AI按照我们修改后的“图谱”让AI出图。

且看，我们改了“谱子”的一小点内容，呈现就马上更正变更了，说明这个出图AI非常敏锐：

现在大家知道了吧？很多音乐一般人听不出个好歹来，但是专业的音乐家，一个音符少半个音，都能敏锐的发觉，至于每个人都有的风格。我们一般人可以听出不同的演唱家演唱的相同歌曲，但不同演奏家演奏的相同曲子，可就不是那么好辨认了。

总结一下，这个WHISK为什么叫做搅蛋器？
它能把AI出图这个事情，彻底理了清楚，首先分解成主题、场景、样式进行了分解，并直接上参考图，这就直击了一个痛点——大多数人是描述不清楚自己想要画面的。就像我们大多数人也没法将自己熟悉的音乐，用谱子写出来，这时候，文字的表达力就不如直接找参照物了，无论是画还是音乐，皆是如此。另外，WHISK还对图片再修改进行了非常贴心的支持，不仅让画面可以优化完善，又可以保持一致性，最后，还能很大方的把“图谱”交出来。我只想说，这个设计团队真的太懂了，Google拿出的，是满满的诚意和智慧。

以下，是我用WHISK出的图：走进Google“实验室”——Whisk（搅蛋器）

（AI视频，请勿传播）