Google Omni首发「AI视频编辑」功能,AI视频的下一种形态终于来了!

AI 知识库14小时前发布 开源AI
861 0 0
熊猫办公

上面是Google Omni的宣传片,还是有必要看看的。
Omni是已知第一个把AI视频编辑做到这么牛的,而且是全模态。
图片编辑=图生图,视频编辑=视频生视频。
这应该是Banana之后,AI圈肉眼可见的最大技术进步了。
新的AI形态,真的很让人兴奋。
Google I/O我昨晚也熬夜看了,讲了一大堆,除了Omni以外基本都拉了。
Gemini 3.5 Flash我早上测试过了,前端能力还不错,比GPT-5.5审美好很多,其他那些没啥用的更新、发布就不提了。
来一起了解下Google Omni。

01.改变你周围的世界
这是很好理解,也是很基础的一个功能。
发给AI随手拍的一段视频,他就可以在这个视频里根据你的需求添加你要的东西。

提示词:用泡泡制作雕塑。

02.部分区域风格重绘
这跟图片重绘不一样,视频是动态的,要保持一致性比图片风格重绘可是难太多了。
但是Omni做到了,小孩子哪天说自己想变身奥特曼,也可以在AI视频里很好实现了。

提示词:当人触摸镜子时,使镜子像液体一样美丽地泛起涟漪,人的手臂变成反光镜面材料。
03.
多轮修改

之前AI视频是不能多轮修改的,还是因为有了视频编辑,图片的一致性做的很好,才实现了这个功能。
下面这是用Omni生成的一段视频。

下面是多轮修改的,为了方便大家看,我把3个改过的视频合到一起了。

04.全模态输入

之前的AI视频,只能输入文本图片,但是Omni可以输入图像、文本、视频、音频,真的全模态。

他是真的可以理解图片的内容,理解你要表达的意思。
你画一个箭头,它就知道你要让这个物体往哪走。

提示词:将此图制作成逼真的视频,仅以图画作为动作参考,最终视频中不要出现图画。
应用样式、动态效果或特效。
输入可以表达特效的图片或直接用自然语言描述。Omni会把输入参考融合在一起,生成连贯的视频。
除了牛,真的不知道怎么表达了。

提示词:在保持所有内容不变的情况下进行编辑,添加从滑板伸出的动画效果。
05.世界知识

从Banana的时候就在讲这个概念,这才是让AI视频更强的关键。
Omni对重力、动能和流体动力学等等,这些牛顿等远古大神创造的物理概念,非常非常精通。
它不仅拥有直觉性的物理学理解,还融合了Gemini对历史、生物和文化的深刻认知。
这让AI生成的视频更加逼真。

提示词:一颗弹珠在连锁反应式轨道上快速滚动,连续流畅的镜头。

Omni可以用视频来解释复杂的概念。

提示词:用黏土动画解释蛋白质折叠过程,所有部件都用黏土制作,不使用双手,定格动画,力求准确。
06.写在最后
本来还准备了几个用户实际生成的DEMO,但是一篇文章只能放10条视频,改天给大家出一期玩法教学。
过去的AI视频还停留在看运气抽卡的娱乐阶段,Omni这次的跨越,意味着AI已经拥有了对物理世界的直觉性理解,并实现了真正高控的视频生视频。
这是继Banana后,AI圈肉眼可见的又一个技术奇点。

扫码加入AI交流群获得更多技术支持和交流(请注明自己的职业)
Google Omni首发「AI视频编辑」功能,AI视频的下一种形态终于来了!
关注「开源AI项目落地」公众号与AI时代更靠近一点

© 版权声明

相关文章