《AI图像生成核心技术与实战》

4,308 0 254

系统、快速地构建AI图像生成的知识脉络！

编辑推荐

适读人群：本书既适合AI图像生成领域的从业者尤其是软件开发人员、产品经理阅读，也适合对AI图像生成感兴趣的AI技术科研人员和计算机相关专业的学生阅读。

如果你已经掌握了一些图像生成的零散知识，但是想要形成完整的知识体系
如果你好奇Midjourney、Stable Diffusion、DALL·E等模型，在实现上有何不同
如果你想自己动手训练一个图像生成模型

那么可以读一读这本书，系统、快速地构建AI图像生成的知识脉络！

内容简介

《AI图像生成核心技术与实战》本书以AI图像生成为主线，串联讲解了Stable Diffusion、DALL·E、Imagen、Midjourney等模型的技术方案，并带着读者训练一个自己专属的AI图像生成模型。

《AI图像生成核心技术与实战》本书共6章。第1章先介绍身边的AIGC产品，再讲解AI图像生成相关的深度学习基础知识，包括神经网络和多模态模型的基础知识。第2章讲解AI图像生成技术，从VAE到GAN到基于流的模型再到扩散模型的演化，并详细介绍扩散模型的算法原理和组成模块。第3章讲解Stable Diffusion模型的核心技术。第4章讲解DALL·E 2、Imagen、DeepFloyd和Stable Diffusion图像变体模型的核心技术。第5章讲解Midjourney、SDXL和DALL·E 3的核心技术。第6章是项目实战，使用LoRA技术对Stable Diffusion模型进行微调，得到特定风格的AI图像生成模型。

作者简介

南柯，某头部互联网公司 AIGC 团队技术负责人，高级算法专家，极客时间“AI 绘画核心技术与实战”专栏作者，拥有十多年计算机视觉领域从业经验，带领团队推动多模态生成，尤其是 AI 图像生成与编辑、多模态大语言模型、数字人等热点方向的技术建设。在 ICCV 和AAAI 年会等 AI 领域顶级会议上发表过多篇论文，拥有 100 多项专利。

《AI图像生成核心技术与实战》

编辑推荐

内容简介

作者简介

相关Array

《未来引擎：从科技革命到全新世界》

《学习的人生没有衰老：银发时代的智能学习术》

《芯机遇：强AI时代半导体产业人才发展的思考与展望》

《即梦AI+可灵AI+DeepSeek：绘画和短视频制作》