
情绪表达很自然,连细微的换气声都清清楚楚。再听听下面这段:
带着哭腔的声音,充满绝望和痛彻心扉的哀伤。这些声音都出自面壁智能最新开源的地表最强 AI 语音基础模型 VoxCPM 2。当然,评判一个 AI 声音模型好不好,我们还是要看两个维度:
- WER(词错误率): 越低越好。代表这个模型讲出来的话有多准确,会不会读错字、结巴。
- SIM(相似度): 越高越好。代表这个模型讲出来的声音,到底有多像原声。




GitHub:https://github.com/OpenBMB/VoxCPM?tab=readme-ov-file#-performanceHugging Face:https://huggingface.co/openbmb/VoxCPM2
- 1.播客

VoxCPM 2 生成的声音真的活人感十足,故意保留了一些不完美的音色质感,加上恰到好处的停顿、换气,听起来就像某位博主自己的录音一样。
- 2.偶像的生日祝福

- 3.短视频配音

- 4.网络小说听书
天真浪漫型:
低沉沮丧型:
不同情绪的表达效果还是很到位的,不过从效果来看,单次配音最好不超过500字。
- 5.语音客服
- 6.导航播报



© 版权声明
文章版权归作者所有,未经允许请勿转载。
