Video Agent来了,上传任意照片实现实时视频通话

AI 知识库4周前发布
840 0 0
熊猫办公
看到Lemon Slice Agents发布了Slice-2,一个视频模型框架,让照片生成可以实时互动数字人,支持全身数字人生成,根据语意生成相应的表情和姿态动作,可以无限时长。

它专为实时交互式头像体验设计,支持在单个 GPU 上实现每秒 20 帧的生成速度,打破了实时生成视频的障碍(生成速度快于观看速度)。平均响应时间仅 2.8 秒,其中视频生成部分只需 0.73 秒。

这个给了我们做数字人的很多借鉴和思路。

主要功能与能力

  • 任意角色与风格
    :只需一张图像 + 音频样本,即可实时生成全身体头像视频,支持任何人物或艺术风格。
Video Agent来了,上传任意照片实现实时视频通话
Video Agent来了,上传任意照片实现实时视频通话
  • 富有表现力的手势与场景感知
    :头像具有语义aware的手势和身体动作,自然生动。
    Video Agent来了,上传任意照片实现实时视频通话
    .cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}
    .cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}
  • 实时交互
    :支持嵌入式小部件(embeddable widget),用户可以与 AI 头像进行实时对话(如屏幕录制演示)。
    Video Agent来了,上传任意照片实现实时视频通话
    .cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}
    .cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}
  • 无限视频与零误差
    :适合长时交互场景。

平台还推出Lemon Slice Agents(或 Lemon Slice Live),允许用户上传一张照片,即可创建全交互式视频代理(视频头像能“说话回应”),结合语音输入,实现低延迟的视频聊天体验。适用于教育、购物、医疗、营销等领域,能显著提升用户参与度和转化率。可用性

  • Lemon Slice-2 模型已向公众开放通用使用。
  • 平台提供 API 集成和一键嵌入网站的功能。
平台上其它两个功能也是我的数字人平台即将要做的。
Video Agent来了,上传任意照片实现实时视频通话
Video Agent来了,上传任意照片实现实时视频通话
.cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}
© 版权声明

相关文章