开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单

AI 知识库12小时前发布 K姐Koi
906 0 0
熊猫办公
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
大家好,这里是K姐。一个帮助你把AI真正用起来的女子。
大家有没有发现,AI 配的音,总是差点意思。比如我们平时刷短视频、听网络小说,配音字正腔圆但听起来毫无感情,一听就是没有灵魂的 AI。但现在,你听…

情绪表达很自然,连细微的换气声都清清楚楚。再听听下面这段:

带着哭腔的声音,充满绝望和痛彻心扉的哀伤。这些声音都出自面壁智能最新开源的地表最强 AI 语音基础模型 VoxCPM 2。当然,评判一个 AI 声音模型好不好,我们还是要看两个维度:

  • WER(词错误率): 越低越好。代表这个模型讲出来的话有多准确,会不会读错字、结巴。
  • SIM(相似度): 越高越好。代表这个模型讲出来的声音,到底有多像原声。
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
在多语种相似度上,VoxCPM 2 一骑绝尘,不仅打败了国内的佼佼者 MiniMax,在核心指标上还超越了阿里的 Qwen3-TTS 和国际巨头 ElevenLabs 。今天,咱们一起上手试一下,上耳听一下。
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
实测 VoxCPM 2
VoxCPM 2 是由面壁智能最新推出的开源项目,是一款 2B 参数的语音基础模型,在多语种、方言、音色设计、语音克隆与情感表达上表现都相当出色,更牛的是,现在市面上绝大多数语音模型还停留在 24kHz,VoxCPM 2 已经把音质拉到了 48kHz,听感会更细腻,更接近影视级的声音效果。而且可以免费商用!目前也已经在国内上线了免费体验网页。
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
官网:https://voxcpm.modelbest.cn
GitHub:https://github.com/OpenBMB/VoxCPM?tab=readme-ov-file#-performanceHugging Face:https://huggingface.co/openbmb/VoxCPM2
我们测试下平时最常用到 AI 配音的 6 大场景。
  • 1.播客
我们通过简单的文字描述声音的性别、年龄、语气、语速、情绪,就能得到一个独一无二的音色。输入描述:
年轻女声,活泼快乐,声音明亮清甜,带着自然的笑意和轻快的亲和力,语速中等,吐字清晰灵动,情绪饱满有感染力。
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
填入文本:
我们每个人可能都不知道会发生什么。但是我愿意放手,我也愿意纵身一跃,我愿意去冒险,我愿意去相信我自己的身体,然后相信自己的心。

VoxCPM 2 生成的声音真的活人感十足,故意保留了一些不完美的音色质感,加上恰到好处的停顿、换气,听起来就像某位博主自己的录音一样。

  • 2.偶像的生日祝福
我们只需要上传 5 秒的音频,就可以复刻任意声音。当然,提供多一点音频,效果会更逼真。比如我们上传一段海绵宝宝的原音,用来定制生日祝福或者起床闹钟~注意打开极致克隆模式,模型会将参考音频视为已说出的前文,以音频续写的方式完整还原参考音频中的所有声音细节。
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
听听是不是和海绵宝宝的声音一模一样?

  • 3.短视频配音
我一直想做短视频内容,但是我自己说话有气无力的,吐字不清,普通话还不标准。每句话都要练习好多次,最后配音质量也不太行。我发现 VoxCPM 2 的 control instruction 很适合修饰声音瑕疵。我们上传我的原音,关闭极致克隆模式,同时在 control instruction 中输入提示:
语速中等,声音铿锵有力,清脆,吐字清晰,用于知识分享。
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
最后生成的声音既保留了我的音色辨识度,又能弥补我自己发音的一些不足,录音效率还高了很多。

  • 4.网络小说听书
在 control instruction 中,我们可以调整原有声音的情绪、语速和演绎风格。同一种音色,可以有不同的表达。我试着调了一下豆包的声音,豁达开朗型:
偶尔走一步算一步不也挺好的吗,明天的事,明天再想就好啦。

天真浪漫型:

做衣如做人,一定要花团锦簇,轰轰烈烈才好。

低沉沮丧型:

这样好的阳光,以后再也看不到了。

不同情绪的表达效果还是很到位的,不过从效果来看,单次配音最好不超过500字。

  • 5.语音客服
VoxCPM 2 支持 30 种语言,输入对应的文字,就能一键生成多种语言。
Allocate time to sleep, books, sports,flowers, birds, trees, mountains and lakes,and give you the love of the world, insteadof wasting yourself on boring people andthings. When you start to spend time withyourself, you will feel the calming powergushing out of ordinary life.
  • 6.导航播报
VoxCPM 2 还会说 9 种方言,四川话、粤语、吴语、东北话、河南话、陕西话、山东话、天津话、闽南话。我们只需要一句简单的文生音提示词和纯正的方言文本。比如:
音色:粤语,中年男声,语速快文本:前方便路口右转,唔使急,慢啲会更安全。
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
音色:四川话,年轻女生,中等语速文本:你已经跑偏咯,莫得事哈,正在给你重新规划路线。
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
开源免费!国产 AI 配音神器登顶 MiniMax 多语种评测榜单
一些分享
过去,AI 制作配音是先采集真人的单音节字,再重新排列组合,所以听起来像机器,一个字一个字往外蹦,没有气息停顿。VoxCPM 2 这样的文本转语音系统,直接抛弃了传统的离散分词器,采用端到端的扩散自回归架构。可以生成连贯的语言,并且像我们说话一样自然,有呼吸感。AI 配音发音准确、成本低、效率还高,像我这种需要配音但自己嗓音条件一般的人来说,简直是救命神器。优秀的配音演员,能通过对剧本和角色的深刻理解,随时调整语气、语调和语速。同一个人,哪怕配同一段台词,每次的气息、节奏等细节都不会完全相同。这恰恰也是 VoxCPM 2 很值得关注的一点。VoxCPM 2 主打的高表现力,不止在于把文字念出来,也会自动从文本内容推断适当的韵律和表现力,让 AI 配音有了情绪,有了无限接近真人的感染力。
作者:K姐投稿邮箱:tougao@kseek.ai
© 版权声明

相关文章