《AI图像生成核心技术与实战》

1,103 0 254

系统、快速地构建AI图像生成的知识脉络!

《AI图像生成核心技术与实战》
博思AIPPT

编辑推荐

适读人群 :本书既适合AI图像生成领域的从业者尤其是软件开发人员、产品经理阅读,也适合对AI图像生成感兴趣的AI技术科研人员和计算机相关专业的学生阅读。

如果你已经掌握了一些图像生成的零散知识,但是想要形成完整的知识体系
如果你好奇Midjourney、Stable Diffusion、DALL·E等模型,在实现上有何不同
如果你想自己动手训练一个图像生成模型

那么可以读一读这本书,系统、速地构建AI图像生成的知识脉络!

《AI图像生成核心技术与实战》

内容简介

《AI图像生成核心技术与实战》本书以AI图像生成为主线,串联讲解了Stable Diffusion、DALL·E、Imagen、Midjourney等模型的技术方案,并带着读者训练一个自己专属的AI图像生成模型。

《AI图像生成核心技术与实战》本书共6章。第1章先介绍身边的AIGC产品,再讲解AI图像生成相关的深度学习基础知识,包括神经网络和多模态模型的基础知识。第2章讲解AI图像生成技术,从VAE到GAN到基于流的模型再到扩散模型的演化,并详细介绍扩散模型的算法原理和组成模块。第3章讲解Stable Diffusion模型的核心技术。第4章讲解DALL·E 2、Imagen、DeepFloyd和Stable Diffusion图像变体模型的核心技术。第5章讲解Midjourney、SDXL和DALL·E 3的核心技术。第6章是项目实战,使用LoRA技术对Stable Diffusion模型进行微调,得到特定风格的AI图像生成模型。

作者简介

南柯,某头部互联网公司 AIGC 团队技术负责人,高级算法专家,极客时间“AI 绘画核心技术与实战”专栏作者,拥有十多年计算机视觉领域从业经验,带领团队推动多模态生成,尤其是 AI 图像生成与编辑、多模态大语言模型、数字人等热点方向的技术建设。在 ICCV 和AAAI 年会等 AI 领域顶级会议上发表过多篇论文,拥有 100 多项专利。

相关Array