《大模型算法：强化学习、微调与对齐》（全彩）

18,795 0 409

系统讲解大模型技术、训练算法、微调与对齐、效果优化及其实践。

编辑推荐

适读人群：AI方向的大学生、工程师、研究者。希望学习大模型技术的跨行业读者
精心绘制100+全彩架构图，深入浅出，直击核心

资深算法工程师撰写，深度契合大厂所用所需

全程独著打磨，确保至臻品质、始终如一

开创性地系统讲解强化学习等大模型算法

电子版原理图及相关资料

内容简介

《大模型算法：强化学习、微调与对齐》本书系统地讲解了大模型技术、训练算法（包括强化学习、RLHF、GRPO、DPO、SFT与CoT蒸馏等）、微调与对齐、效果优化及其实践。全书以大语言模型（LLM）为主线，绝大部分内容也适用于多模态大模型（VLM 和MLLM）。

《大模型算法：强化学习、微调与对齐》本书面向AI算法与工程领域的从业者、相关专业的学生，以及希望深入了解大模型技术、拥抱AI与大模型浪潮的跨行业读者。

作者简介

余昌叶

资深算法工程师，哈尔滨工业大学优秀毕业生。曾就职于腾讯等多家头部互联网企业，拥有十年行业经验。主要研究方向为大模型、强化学习、推荐系统及图像处理。具备扎实的数学功底与深厚的算法理论基础，主导并完成多项核心AI技术项目的工程化落地。已获六项国家发明专利，曾荣获科研类全国航空航天模型锦标赛亚军等专业奖项，以及腾讯卓越研发奖（团队）、腾讯知识奖等多项企业级荣誉。

《大模型算法：强化学习、微调与对齐》（全彩）

编辑推荐

内容简介

作者简介

相关Array

《智能对话入门与实践》

《AI新个体：用DeepSeek重塑一人公司》

《共生：4.0时代的人机关系》（精装典藏版）

《如何让AI写作更有“人味”》