数字人PPT智能课程系统接入VoxCPM,实现教师音色克隆和方言效果

AI 知识库2周前发布
654 0 0
熊猫办公
上次介绍过我们最近基于数字人实时互动系统,做了一套衍生产品,也就是数字人PPT智能课程系统,功能介绍参考文章《数字人智能课程平台 1.0 正式上线》。我们保持每日一更新的速度不断打造这套产品,今天让它接入清华开源的一款语音模型VoxCPM。 实现教师音色克隆和方言效果。
数字人PPT智能课程系统接入VoxCPM,实现教师音色克隆和方言效果
关于VoxCPM:
之前的实时互动数字人系统在自己的3070电脑上对接过几款优秀的开源的TTS, fishspeech/qwen3/cosyvoice/moss/voxtral/GPT-SoVITS等, 做实时互动还是很卡,所以很需要一款小点的模型。正好乘这个机会实践一下收藏已久的这款TTS。
刚开始部署它的VoxCPM2模型的时候感觉虽然效果好,但电脑还是相对卡,于是切换它的0.5B模型,发现完全能满足我们的需求,克隆的音色也非常好。支持:
  1. 1.不用参考音频就能造声音— 用文字描述”一个温柔的年轻女性”,模型直接生成全新的声音
  2. 2.支持中国方言— 四川话、粤语、吴语(上海话)、东北话、闽南话、河南话、陕西话、山东话、天津话……一共9种方言
  3. 3.30种语言通用— 中文、英文、日文、韩文、阿拉伯语、印地语……输入任何一种语言的文本直接合成
关键它还能在CPU 上跑。所以这次的PPT智能课程系统就用它来完成音色的克隆,这样教师就可以随时上传自己的声音来完成视频课件的制作,以及跟真人老师的声音一模一样的角色提问问题了。
这次还更新了下面几点:
1. 实时课堂学生提问界面优化:
数字人PPT智能课程系统接入VoxCPM,实现教师音色克隆和方言效果
2. AI生成PPT功能支持本地生成和在线生成
数字人PPT智能课程系统接入VoxCPM,实现教师音色克隆和方言效果
数字人PPT智能课程系统接入VoxCPM,实现教师音色克隆和方言效果
3. 课程详情绑定专属知识库、数字人、TTS
数字人PPT智能课程系统接入VoxCPM,实现教师音色克隆和方言效果
4. PPT生成视频课件修复bug
数字人PPT智能课程系统接入VoxCPM,实现教师音色克隆和方言效果
目前基础功能已经搭建完备,其它更好玩的功能还在进一步开发中。
申请体验:
我们将面向有购买这套系统需求的用户定期开放体验权限,后台私信,先做个简单介绍,比如身份、购买意向等等,我们通过后会让大家入群体验。体验或者试试的用户暂时不会通过哈。
整套系统目前处于尚不完善阶段,所以预售100套作为启动资金。对前100名购买者出售这套系统全部源码。后期再面向普通用户开放付费方式。
写在最后:
这套系统是完全独立于之前的实时互动数字人系统的,我们的2D&3D实时互动数字人系统的源码销售方式也截止到2026年6月30日,之前咨询过的任何客户就不要咨询源码相关事宜。之后都将以用户付费的方式公开使用。


如果您有企业数字化内训合作需求,欢迎在后台随时与我们沟通。


数字人PPT智能课程系统接入VoxCPM,实现教师音色克隆和方言效果
数字人PPT智能课程系统接入VoxCPM,实现教师音色克隆和方言效果
关于作者
做一只爬的最久的乌龟,保持学习保持好奇,即使慢一点,遇到一点困难,只要最后能到达终点,又有什么关系呢。
毕竟人生没有白走的路,每一步都算数。
© 版权声明

相关文章