Video Agent来了，上传任意照片实现实时视频通话

AI 知识库7个月前发布

熊猫办公

看到Lemon Slice Agents发布了Slice-2，一个视频模型框架，让照片生成可以实时互动的数字人，支持全身数字人生成，根据语意生成相应的表情和姿态动作，可以无限时长。

它专为实时交互式头像体验设计，支持在单个 GPU 上实现每秒 20 帧的生成速度，打破了实时生成视频的障碍（生成速度快于观看速度）。平均响应时间仅 2.8 秒，其中视频生成部分只需 0.73 秒。

这个给了我们做数字人的很多借鉴和思路。

主要功能与能力：

任意角色与风格

：只需一张图像 + 音频样本，即可实时生成全身体头像视频，支持任何人物或艺术风格。

Video Agent来了，上传任意照片实现实时视频通话

Video Agent来了，上传任意照片实现实时视频通话

富有表现力的手势与场景感知

：头像具有语义aware的手势和身体动作，自然生动。

.cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}

.cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}
实时交互

：支持嵌入式小部件（embeddable widget），用户可以与 AI 头像进行实时对话（如屏幕录制演示）。

.cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}

.cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}
无限视频与零误差

：适合长时交互场景。

平台还推出Lemon Slice Agents（或 Lemon Slice Live），允许用户上传一张照片，即可创建全交互式视频代理（视频头像能“说话回应”），结合语音输入，实现低延迟的视频聊天体验。适用于教育、购物、医疗、营销等领域，能显著提升用户参与度和转化率。可用性

Lemon Slice-2 模型已向公众开放通用使用。
平台提供 API 集成和一键嵌入网站的功能。

平台上其它两个功能也是我的数字人平台即将要做的。

Video Agent来了，上传任意照片实现实时视频通话

Video Agent来了，上传任意照片实现实时视频通话

.cls-1{fill:#001e36;}.cls-2{fill:#31a8ff;}

AI 知识库行业教程 # AI for Frontend

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

量子智启 | AI精品通识课第六讲：AI探索量子计算

量子智启 | AI精品通识课第六讲：AI探索量子计算

AI 知识库国家平台 # 国家中小学智慧教育平台

1年前

6,632172

Codex保姆级教程来了，或将成为顶流！（一文看懂）

Codex保姆级教程来了，或将成为顶流！（一文看懂）

AI 知识库行业教程 # K姐研究社

2个月前

2,904879

都2026了，我们离低成本搭个本地多模态知识库还有多远？

都2026了，我们离低成本搭个本地多模态知识库还有多远？

AI 知识库行业教程 # 卡尔的AI沃茨

7个月前

7,229196

见过孩子们上网课，才知道这届家长护眼多努力

见过孩子们上网课，才知道这届家长护眼多努力

AI 知识库教育教程 # 途龙叨

2年前

5,868715

🤖