已将数字人讲PPT功能发布为在线服务

AI 知识库1周前发布
755 0 0
熊猫办公
上个月初,立了个flag,计划将本地部署的数字人讲PPT 功能,发不到在线服务。
关于这块的计划,有兴趣可以参阅这个文档:
今天开始准备将数字人ppt服务发布到官网
本地部署的数字人讲PPT,这个功能原本是离线部署的,在个人显卡电脑或者云服务器上部署。
关于这个系统的介绍可以参看下面这个文档:

https://ai.feishu.cn/wiki/Mu5nwfNrqiytllkkrWhcuGbJnPh

但是因为客户在部署前,需要先直观去体验下,这不我才准备将其发不到在线服务。
再者,在线服务 也方便那些 喜欢 “随用随到” 的用户 。
所以,我就顺手将这个系统重构一番,进一步完善系统架构,现在的系统不仅支持前后端分离,对后端架构进一步拆分为api后端和算力后端。
这样,后端功能和算力分离,方便那些 不方便暴露算力服务器的用户,比如 可以将家里没有公网IP的显卡电脑搬出来当服务器来使用,前端服务可以暴露在公网提供在线服务。
在陆续开发这个功能的时候,中间经历了数字人系统迁移到华为npu,以及实时互动系统 也要迁移到npu,满打满算,刚好一个月过去了。
今天算是对这个ppt 数字人的功能做个了结。
一起来看看效果吧。
我们在这里创建一个数字人讲ppt的任务:
已将数字人讲PPT功能发布为在线服务
可以对每个任务定制不同的声音和形象:
已将数字人讲PPT功能发布为在线服务
在编辑任务中,可以看到详细信息:
已将数字人讲PPT功能发布为在线服务
在详情页面,还可以再次修改声音和形象。
关键地方就是中间上传区域:这里可以上传您的ppt或者pdf,ppt也可以转为pdf上传。
上传pdf后,系统依次展示每一页的内容,用户可以为每一页添加/修改演讲内容:
已将数字人讲PPT功能发布为在线服务
用户可以拖动数字人的位置和大小。
并且可以单独为每一页生成音频。
在右下角可以试听每一页内容。
确认无误后,点击下方导出视频:
已将数字人讲PPT功能发布为在线服务
提交后,系统在后台执行,此时前端可以离开。
几分钟后,在导出记录中看执行状态:
已将数字人讲PPT功能发布为在线服务
成功导出的视频,可以在线播放:
已将数字人讲PPT功能发布为在线服务
原来的绿幕数字人就这样透明无遮挡的贴到ppt 上了。
© 版权声明

相关文章