AI 视频是一种视听语言,在视觉方面,各大 AI 平台都是异常的卷,像即梦、可灵、海螺、Vidu 等等,一个比一个卷更新。
反而在听觉方面,很多平台并没有特别看重,导致 AI 视频给人的配音,总是那么有 AI 感。
而为什么人会有这种感觉,那便是很多配音平台其实并不够灵活。
就拿我们常用的剪映进行举例。
在剪映中,当我们选择一个音色的时候,其实就固定这个音色音调,无论多长的句子都是同个音调:

下面我直接固定一个文本给大家听听。
原本我以为他是爱我的,直到有一天,我发现了他心里其实还藏着其他人,我发誓我要让他感受到真正的痛苦
下面便是剪映生成的声音:
而下面这个则是我用其他软件生成的声音:
可以感觉得到,其实区别还是特别明显的。
核心的问题则是因为剪映即使支持风格变化,最多也才 6 种:

而这个平台,仅仅左边大风格都有八张,而每种大风格下还细分各种小风格,大家可以看看右边的进度条,就知道多么离谱了!

正是由于细化的风格特别多,因此,基本上我们需要的场景音调都具备了!
并且,还能去细调每个情绪的“强度”、“语速”、“语调”、“音量”、“语言”:

说实话,至于上面的功能,无论是什么场景、什么语速、什么声调都可以调出来!也就是因为这些原因,生成的声音特别的真实!
这个平台便是智声云配,官网在这:https://app.dubbingx.com/login?inviteCode=e9b059d8
刚刚我上面提的功能,便是它最基础的“文本转语音”的功能:

我们可以看到它其实还支持很多功能的,我这就不一个个试了,大家可以根据自己的需要玩玩:

下面介绍下它的另外一个特点功能。
那便是“多人配音”:

这其实也是跟我们的需求实时相关的。
因为现在的动态漫的需求很大,不少人都开始制作漫剧了,就像我前几天推荐的OiiOii便是快速生成漫剧的工具之一:动画行业要变天!一手实测世界首个动画创作Agent – OiiOii
而对于漫剧来说,由于制作时间短,那配音自然就需要更快了。
像下面的一个简单剧本片段:
镜头1(远景,风沙滚滚)
少侠跪在满地尸体之间,手中长剑颤抖。
夕阳打在他脸上,泪与灰混在一起。
少侠(悲吼):“你终于来了!他们全死了!都是因为你——你说的守护之约呢?!”
镜头2(中景推近,修士披风猎猎)
修士低头,眼神沉冷。
修士(冷声):“我赶来的时候……已经晚了。”
(抬头,灵力爆发)
“你体内的怨气太重……是邪修在操控你!”
镜头3(快切特写)
少侠瞪大眼睛:“我没有!我只是——”
镜头4(光爆、慢镜)
修士拔剑一斩,尘土扬起。
画面定格在少侠惊愕的表情上。
像以往,我们都需要一句句话拿去生成声音,而有了这个“多人配音”,我们便可以一键进行生成!
首先,我们可以选择“多人配音”中的“导入”:

然后我们就可以填进去,这里要注意对话解析,我们要根据实际情况选择解析方式,我这里就是“中文双引号”:

这里我们可以直接点击“角色解析”,就能快速归类不同人说的话了:

然后我们再切到“角色列表”,就能给这个角色选择对应的“音色”了:

当我们给全部角色都配置完音色,便可以直接点击“生成音频”,一次性把全部音频生成出来!

还有其它挺多特殊功能都没讲到,大家都可以去试试:

别忘了,官网在这:https://app.dubbingx.com/login?inviteCode=e9b059d8
另外,它当前也有一些促销活动,有需要的也可以看看:

