使用AI制作音乐MV,早在半年前就有人利用数字人技术做出来了,但那时候受到技术限制,MV中人物只能做做简单的动作,表情也不丰富。
上个月即梦上线了数字人1.5,这次更新让数字人可以做出与音音频内容相关的画面动作。
简而言之:只要有一段音乐,就可以做出肢体动作更丰富,人物表情更自然的MV。
来看看我做的,效果还不错吧?
话不多说,来一波点赞和关注,我就开始今天的正文了👇
生成画面素材
制作MV,是少不了歌手唱歌画面的,所以先去即梦生成一张歌手在录影棚唱歌的画面。
还是一样,直接去即梦灵感广场,搜索:“歌手录音棚唱歌”,找一张满意的作品直接去做图。

因为我的歌曲是男歌手唱的,我就找一张男歌手在录音棚唱歌的作品去做同款。

下面就是生成的男歌手在录影棚唱歌的画面。

MV需要多个画面分镜,所以还需要根据上面这张图,去制作同一歌手其他分镜图。
一个男歌手,在录影棚录制一首歌曲,场景基调深情动人,镜头切换10次

在10张里面挑选4张,凑成5张作为画面素材,如果挑不出来4张,就多生成几次。
剪辑音乐
我这个MV的设计是,每个画面歌手唱两、三句歌词,就切到下一个。为了让声音和画面对应上,需要将音乐裁剪成五段。
裁剪音乐的工具很多,我是用的桌面版剪映,直接将音频拖入下方音轨进行裁剪,然后导出音频就行。


制作歌手唱歌
敲黑板!重点来了!
回到网页版即梦,选择数字人,上传前面准备好的图片和音频,添加动作描述,生成歌手唱歌的视频。

来看看即梦数字人生成的视频,表情动作挺自然的。
估计会有小伙伴问:数字人那块,动作描述怎么写呢?
其实很简单,直接去问豆包就行。
我要做即梦的AI数字人,请根据我提供的图片,生成8秒钟的镜头描述,包括景别、视角、运镜、画面内容以及人物表情,字数不超过200字

剪辑视频加字幕
五段唱歌视频做好后,一次性都导入剪映,配上歌词字幕。

最后就是让字幕的显示和歌词声音同步,这是比较琐碎的事情,慢慢调整字幕就是了。
没有音乐怎么办?
如果手头上没有合适的音乐,是不是MV就做不成了?
也不尽然,AI其实也是能生成音乐的。
先用DeepSeek或者KIMI创作歌词,再去Suno这样的AI音乐平台生成音乐。

由于本文主要是介绍即梦数字人,AI音乐这块就不详细赘述了,我们留着下篇文章详细聊聊,各位敬请期待。
写在最后
现在AI真是越来越强大,像我这样毫无音乐细胞的门外汉,都能靠数字人技术做出效果不错的MV。
文章前面的你,如果也对这个感兴趣,那就行动起来吧。只要你用心琢磨,持续迭代,一定能做出比我更优秀的作品。

