
然后在 GitHub 上一共获得了 764 星和 181 fork,让我有些吃惊。

说实话,这个项目远超我们的预期,甚至连歪果哥都来给我们提 issue,希望支持双语。

甚至还有老板来咨询问我卖不卖这个 APP,我说,大哥,咱都开源了,自己去整吧,不用付费,哈哈哈。这或许就是开源的魅力吧。但我发现,APP 还是不大方便,评论区也不少求 web 版本的。

于是,我们又花了 20 天,开源了个 Web 版本的 AI 漫剧平台,他是长这个样子的。

主打的人群还是对 AI 漫剧感兴趣的小白群体,能够一句话生成漫剧故事。如果你不知道生成什么故事,也可以使用系统内置的模板,比如「马到成功送祝福」、「马上有美食」等新年主题的故事。

为了照顾一些朋友想要自由发挥的需求,我们还添加了自定义工作流选项,也就是从创建角色到分镜编排,再到生成镜头,最后导出,都可以自定义。

在编排的时候,你可以自定义不同的镜头,比如全景、中景、特写,可以添加镜头和场景。

可以生成不同的镜头视频。

在底层,做了很多的处理,能保证角色的一致性。

做了几个系列,分别对应 2D、3D、写实等场景。

我们做了非常多深度的调优,在保持人物一致性的同时也添加了不少细节去优化生成的效果。

下面,我来分享下在开发这个项目过程中,我们踩过的坑,和一些可能算不上什么经验的经验,另外也教下大家怎么使用。
创作和开源不易,如果文章对你有帮助,欢迎点赞转发。
经验分享我感觉最头疼的问题之一是角色一致性问题,也就是角色在不同画面中长得不一样,该如何很好的解决。我们尝试使用了不少办法,甚至引入了本地 ComfyUI,开启锁定种子,第一张图的种子会被记录,后续所有图使用相同的种子,以保持整体风格的一致性。

总结出角色一致性最佳实践如下:
- 参考图选择:清晰、无遮挡、多角度
- 描述格式:「性别+年龄+发型+发色+眼睛+服装+特征」
- 示例:「25岁女性,黑色长直发,棕色大眼睛,穿白色衬衫和黑色西装裙,戴细框眼镜」
对于镜头,考虑很多像我一样对运镜不大熟悉的小白,我们内置了 9 种标准镜头模板,AI 根据故事自动选择不同分镜的镜头。

对于生成质量上,有以下几点可以给大家分享:
- 画面描述要具体,避免模糊词汇
- 使用「锁定种子」保持风格统一
- 负面提示词排除不想要的元素
- 多生成几次,选择最满意的
在镜头节奏上,建议采用如下方式:
基本原则:
- 全景→中景→特写(渐进式)
- 对话场景用过肩镜头正反打
- 情绪高潮用特写
- 场景转换用全景或框中框
示例分镜节奏:
1. T1 全景俯瞰 - 城市远景(建立环境)
2. T2 环境中景 - 主角走在街上(角色入场)
3. T4 标准中景 - 主角看手机(日常动作)
4. T6 特写 - 手机屏幕显示消息(信息传递)
5. T6 特写 - 主角惊讶表情(情绪反应)
6. T8 跟随视角 - 主角奔跑(动态转场)
如何使用我们整理了一份详细的使用指南,还没放到 GitHub,大家如果需要可以评论区留言,或者等我们推到 GitHub 哈。先来看下整体流程:
[导入剧本] → [创建角色] → [创建场景] → [编排分镜] → [生成图片] → [生成视频] → [导出]
↓ ↓ ↓ ↓ ↓ ↓
(可选) 上传参考图 上传参考图 选择模板 AI生成 (可选)
填写描述 填写描述 写画面描述 保持一致性

生图这里你可以选择本地 ComfyUI 的方式,也可以选择 API 的方式。这里以 API 为例,如果你希望稳定,性价比高的 API 平台,可以试试 Atlas Cloud。地址:https://www.atlascloud.ai?ref=AXZ9S7在漫剧场景中稳定出图出视频很重要,而且对于内容角色的生成,最好避开接口的审查和限制规则。Atlas Cloud 这个 API 聚合平台能很好的满足漫剧这个场景的需求,毕竟它主打的是企业级 API 聚合,拥有 300+ 知名大模型,总结下来是:稳定、易用、低价。

那该如何使用呢?注册登录后,打开控制台,新建 API 密钥。

多说一嘴,Atlas Cloud 目前注册绑卡即可白嫖 1 美元使用额度,可以免费生成不少图了。填写名称后,点击创建:

然后复制这个 API,填入到环境变量中:

需要复制一份 env,然后把改调用方式为使用云端 API 的方式:

然后就可以启动项目,项目启动后,你可以一句话生成故事,也可以按照流程自定义,你可以先创建一个角色并添加场景:

角色描述和场景描述都可以用 AI 生成,也可以自定义更改。然后就是对镜头进行编排,可以添加自定义镜头,描述同样也可以 AI 一键生成,不满意可以改。在这里你可以选择需要出镜的角色:

可以看到已经添加的镜头列表,有专业分镜格式的标准提示语,对于分镜的生成效果会更好。

然后就可以生成镜头和对应的分镜视频:

可以选择一键生成全部视频,这里选择 API 的方式来生成。

最后,你可以导出所有的图片包、视频包、分镜脚本,做素材备份,最后就是做视频的合成。

我们做了比较详细的产品特点说明说和使用说明书,目前还在优化中,如果你想提前看看,可以评论区告诉我。说真的,这套系统,我认为,还是又再次满足了我做漫剧的激情,虽然我们不是专业的漫导,也非该行业的从业者。但通过 AI 编程,我们也能做出一个,算是能满足我们需求的工具,然后去满足我们做漫剧的心。因为是开源平台,你可以自定义各种花式玩法,觉得哪儿不满意,甚至可以让 Claude Code 帮你改。有时候,我觉得 AI 编程最大的价值,或许在于:满足自己的灵魂,而非取悦别人。如果你喜欢我们的作品,也欢迎给我们 star,如果你想加入我们平台共建,也欢迎联系我。目前平台有三个核心贡献者,分别是猫哥,蜗牛和苍何。我们会在深夜畅聊产品的,沟通如何优化。

每当在 GitHub 上有新的进步,我们会为此而欢呼,当然,我们今年的目标是破千 star,也不知道能不能完成,哈哈哈。

当然我知道,我们做的远远不足,很多想要优化的点都还没优化,一方面是因为我们时间精力问题,另一方面,我们对漫剧这个行业的 know how 还有限。当然了,我也在不断的学习,学习优秀的产品,学习他们如何做出精品的漫剧。最近也在用 oiioii 来学做精品漫剧,到时候再来和大家分享了。好啦,最后,如果你有一定的 vibe coding 能力,同时也是 AI 漫剧的热爱者,欢迎加入我们 GitHub 开源项目的共建。感谢你喜欢我的文章,我们下一期见啦。
