耗时 20 天，AI 漫剧 APP 和 Web 全部开源，已斩获 764 星！

AI 知识库5个月前发布

5,450 0 0

这是苍何的第 474 篇原创！大家好，我是消失了一段时间的苍何。1 月 5 号，我写了篇文章，并开源了 AI 漫剧 APP，获得了很多朋友的喜欢。

然后在 GitHub 上一共获得了 764 星和 181 fork，让我有些吃惊。

说实话，这个项目远超我们的预期，甚至连歪果哥都来给我们提 issue，希望支持双语。

甚至还有老板来咨询问我卖不卖这个 APP，我说，大哥，咱都开源了，自己去整吧，不用付费，哈哈哈。这或许就是开源的魅力吧。但我发现，APP 还是不大方便，评论区也不少求 web 版本的。

于是，我们又花了 20 天，开源了个 Web 版本的 AI 漫剧平台，他是长这个样子的。

主打的人群还是对 AI 漫剧感兴趣的小白群体，能够一句话生成漫剧故事。如果你不知道生成什么故事，也可以使用系统内置的模板，比如「马到成功送祝福」、「马上有美食」等新年主题的故事。

为了照顾一些朋友想要自由发挥的需求，我们还添加了自定义工作流选项，也就是从创建角色到分镜编排，再到生成镜头，最后导出，都可以自定义。

在编排的时候，你可以自定义不同的镜头，比如全景、中景、特写，可以添加镜头和场景。

可以生成不同的镜头视频。

在底层，做了很多的处理，能保证角色的一致性。

做了几个系列，分别对应 2D、3D、写实等场景。

我们做了非常多深度的调优，在保持人物一致性的同时也添加了不少细节去优化生成的效果。

下面，我来分享下在开发这个项目过程中，我们踩过的坑，和一些可能算不上什么经验的经验，另外也教下大家怎么使用。

创作和开源不易，如果文章对你有帮助，欢迎点赞转发。

经验分享我感觉最头疼的问题之一是角色一致性问题，也就是角色在不同画面中长得不一样，该如何很好的解决。我们尝试使用了不少办法，甚至引入了本地 ComfyUI，开启锁定种子，第一张图的种子会被记录，后续所有图使用相同的种子，以保持整体风格的一致性。

总结出角色一致性最佳实践如下：

- 参考图选择：清晰、无遮挡、多角度
- 描述格式：「性别+年龄+发型+发色+眼睛+服装+特征」
- 示例：「25岁女性，黑色长直发，棕色大眼睛，穿白色衬衫和黑色西装裙，戴细框眼镜」

对于镜头，考虑很多像我一样对运镜不大熟悉的小白，我们内置了 9 种标准镜头模板，AI 根据故事自动选择不同分镜的镜头。

对于生成质量上，有以下几点可以给大家分享：

- 画面描述要具体，避免模糊词汇
- 使用「锁定种子」保持风格统一
- 负面提示词排除不想要的元素
- 多生成几次，选择最满意的

在镜头节奏上，建议采用如下方式：

基本原则：
- 全景→中景→特写（渐进式）
- 对话场景用过肩镜头正反打
- 情绪高潮用特写
- 场景转换用全景或框中框

示例分镜节奏： 1. T1 全景俯瞰 - 城市远景（建立环境） 2. T2 环境中景 - 主角走在街上（角色入场） 3. T4 标准中景 - 主角看手机（日常动作） 4. T6 特写 - 手机屏幕显示消息（信息传递） 5. T6 特写 - 主角惊讶表情（情绪反应） 6. T8 跟随视角 - 主角奔跑（动态转场）

如何使用我们整理了一份详细的使用指南，还没放到 GitHub，大家如果需要可以评论区留言，或者等我们推到 GitHub 哈。先来看下整体流程：

[导入剧本] → [创建角色] → [创建场景] → [编排分镜] → [生成图片] → [生成视频] → [导出]
  ↓      ↓      ↓      ↓      ↓      ↓
 (可选)   上传参考图  上传参考图  选择模板   AI生成    (可选)
      填写描述   填写描述   写画面描述  保持一致性

生图这里你可以选择本地 ComfyUI 的方式，也可以选择 API 的方式。这里以 API 为例，如果你希望稳定，性价比高的 API 平台，可以试试 Atlas Cloud。地址：https://www.atlascloud.ai?ref=AXZ9S7在漫剧场景中稳定出图出视频很重要，而且对于内容角色的生成，最好避开接口的审查和限制规则。Atlas Cloud 这个 API 聚合平台能很好的满足漫剧这个场景的需求，毕竟它主打的是企业级 API 聚合，拥有 300+ 知名大模型，总结下来是：稳定、易用、低价。

那该如何使用呢？注册登录后，打开控制台，新建 API 密钥。

多说一嘴，Atlas Cloud 目前注册绑卡即可白嫖 1 美元使用额度，可以免费生成不少图了。填写名称后，点击创建：

然后复制这个 API，填入到环境变量中：

需要复制一份 env，然后把改调用方式为使用云端 API 的方式：

然后就可以启动项目，项目启动后，你可以一句话生成故事，也可以按照流程自定义，你可以先创建一个角色并添加场景：

角色描述和场景描述都可以用 AI 生成，也可以自定义更改。然后就是对镜头进行编排，可以添加自定义镜头，描述同样也可以 AI 一键生成，不满意可以改。在这里你可以选择需要出镜的角色：

可以看到已经添加的镜头列表，有专业分镜格式的标准提示语，对于分镜的生成效果会更好。

然后就可以生成镜头和对应的分镜视频：

可以选择一键生成全部视频，这里选择 API 的方式来生成。

最后，你可以导出所有的图片包、视频包、分镜脚本，做素材备份，最后就是做视频的合成。

我们做了比较详细的产品特点说明说和使用说明书，目前还在优化中，如果你想提前看看，可以评论区告诉我。说真的，这套系统，我认为，还是又再次满足了我做漫剧的激情，虽然我们不是专业的漫导，也非该行业的从业者。但通过 AI 编程，我们也能做出一个，算是能满足我们需求的工具，然后去满足我们做漫剧的心。因为是开源平台，你可以自定义各种花式玩法，觉得哪儿不满意，甚至可以让 Claude Code 帮你改。有时候，我觉得 AI 编程最大的价值，或许在于：满足自己的灵魂，而非取悦别人。如果你喜欢我们的作品，也欢迎给我们 star，如果你想加入我们平台共建，也欢迎联系我。目前平台有三个核心贡献者，分别是猫哥，蜗牛和苍何。我们会在深夜畅聊产品的，沟通如何优化。

每当在 GitHub 上有新的进步，我们会为此而欢呼，当然，我们今年的目标是破千 star，也不知道能不能完成，哈哈哈。

当然我知道，我们做的远远不足，很多想要优化的点都还没优化，一方面是因为我们时间精力问题，另一方面，我们对漫剧这个行业的 know how 还有限。当然了，我也在不断的学习，学习优秀的产品，学习他们如何做出精品的漫剧。最近也在用 oiioii 来学做精品漫剧，到时候再来和大家分享了。好啦，最后，如果你有一定的 vibe coding 能力，同时也是 AI 漫剧的热爱者，欢迎加入我们 GitHub 开源项目的共建。感谢你喜欢我的文章，我们下一期见啦。