推荐大模型书籍|《扩散模型从原理到实战》,大模型爱好者有福了!!

2024-08-29 15:04

本文主要是介绍推荐大模型书籍|《扩散模型从原理到实战》,大模型爱好者有福了!!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

**(https://i-blog.csdnimg.cn/direct/01b32b1893df4d0fb707a9246e4ce998.png)**

本书特点

本书内容基于 Hugging Face 的 Diffusion课程。无需读者具备专业绘画技能,**扩散模型能够快速让创意变为现实!**加速创作过程,拓展创作表达的可能性。

易学实用

以扩散模型理论知识为切入点,深入介绍了扩散模型生成图像的相关知识与实战案例,赠送配套Diffusion视频课程。

案例众多

配套大量案例(Stable Diffusion、ControlNet),帮你快速熟悉扩散模型。

注重效率

清晰的代码结构与代码注释,帮你快速实现扩散模型生成精美图像。

GitHub课程链接:https://github.com/huggingface/diffusion-models-class

PDF书籍: 完整版本链接获取

👉[CSDN大礼包🎁:《扩散模型从原理到实战》免费分享(安全链接,放心点击)]👈

作者介绍

李忻玮

RTE社区高级布道师,硕士毕业于美国常春藤盟校之一的哥伦比亚大学数据科学专业,现任声网人工智能算法工程师;主要研究方向是生成式人工智能、计算机视觉、自然语言处理、提示工程等。

苏步升

扩散模型算法工程师,AIGC创业者,Hugging Face中国社区本地化工作组成员。

徐浩然

毕业于中国海洋大学电子信息工程专业,现任声网音频算法工程师,从事扬声器声学设计、音频增强算法、音频质量评估算法等研究工作。

余海铭

本科毕业于暨南大学,硕士毕业于加州大学尔湾分校;先后在中国科学院深圳先进技术研究院、爱奇艺、美团等单位工作;主要研究方向是图像识别、图像生成、多模态及自动驾驶等领域。

大咖联袂推荐

本书系统地介绍了扩散模型的原理和相关细节,同时书中丰富的实战案例也将引领读者快速上手扩散模型。对于任何想要学习和了解扩散模型的人来说,本书都是颇具价值的参考资料。

目录 · · · · · ·

第1章 扩散模型简介

1.1 扩散模型的原理 1
1.1.1 生成模型 1
1.1.2 扩散过程 2
1.2 扩散模型的发展 5
1.2.1 开始扩散:基础扩散模型的提出与改进 6
1.2.2 加速生成:采样器 6
1.2.3 刷新纪录:基于显式分类器引导的扩散模型 7
1.2.4 引爆网络:基于CLIP的多模态图像生成 8
1.2.5 再次“出圈”:大模型的“再学习”方法——DreamBooth、LoRA和ControlNet 8
1.2.6 开启AI作画时代:众多商业公司提出成熟的图像生成解决方案 10
1.3 扩散模型的应用 12
1.3.1 计算机视觉  12
1.3.2 时序数据预测 14
1.3.3 自然语言 15
1.3.4 基于文本的多模态 16
1.3.5 AI基础科学 19

第2章 Hugging Face简介

2.1 Hugging Face核心功能介绍 21
2.2 Hugging Face开源库 28
2.3 Gradio工具介绍 30

第3章 从零开始搭建扩散模型

3.1 环境准备 33
3.1.1 环境的创建与导入 33
3.1.2 数据集测试 34
3.2 扩散模型之退化过程 34
3.3 扩散模型之训练 36
3.3.1  UNet网络 36
3.3.2 开始训练模型 38
3.4 扩散模型之采样过程 41
3.4.1 采样过程 41
3.4.2 与DDPM的区别 44
3.4.3 UNet2DModel模型 44
3.5 扩散模型之退化过程示例 57
3.5.1 退化过程 57
3.5.2 最终的训练目标 59
3.6 拓展知识 60
3.6.1 时间步的调节 60
3.6.2 采样(取样)的关键问题 61
3.7 本章小结 61

第4章 Diffusers实战

4.1 环境准备 62
4.1.1 安装Diffusers库 62
4.1.2 DreamBooth 64
4.1.3 Diffusers核心API 66
4.2 实战:生成美丽的蝴蝶图像 67
4.2.1 下载蝴蝶图像集 67
4.2.2 扩散模型之调度器 69
4.2.3 定义扩散模型 70
4.2.4 创建扩散模型训练循环 72
4.2.5 图像的生成 75
4.3 拓展知识 77
4.3.1 将模型上传到Hugging Face Hub  77
4.3.2 使用Accelerate库扩大训练模型的规模 79
4.4 本章小结 81

第5章 微调和引导

5.1 环境准备 86
5.2 载入一个预训练过的管线 87
5.3 DDIM——更快的采样过程 88
5.4 扩散模型之微调 91
5.4.1 实战:微调 91
5.4.2 使用一个最小化示例程序来微调模型 96
5.4.3 保存和载入微调过的管线 97
5.5 扩散模型之引导 98
5.5.1 实战:引导 100
5.5.2 CLIP引导 104
5.6 分享你的自定义采样训练 108
5.7 实战:创建一个类别条件扩散模型 111
5.7.1 配置和数据准备 111
5.7.2 创建一个以类别为条件的UNet模型 112
5.7.3 训练和采样 114
5.8 本章小结 117

第6章 Stable Diffusion

6.1 基本概念 118
6.1.1 隐式扩散 118
6.1.2 以文本为生成条件 119
6.1.3 无分类器引导 121
6.1.4 其他类型的条件生成模型:Img2Img、Inpainting与Depth2Img模型  122
6.1.5 使用DreamBooth进行微调 123
6.2 环境准备 124
6.3 从文本生成图像 125
6.4 Stable Diffusion Pipeline 128
6.4.1 可变分自编码器 128
6.4.2 分词器和文本编码器 129
6.4.3 UNet 131
6.4.4 调度器 132
6.4.5 DIY采样循环 134
6.5 其他管线介绍 136
6.5.1 Img2Img 136
6.5.2 Inpainting 138
6.5.3 Depth2Image 139
6.6 本章小结 140

第7章 DDIM反转

7.1 实战:反转 141
7.1.1 配置 141
7.1.2 载入一个预训练过的管线 142
7.1.3 DDIM采样 143
7.1.4 反转 147
7.2 组合封装 153
7.3 ControlNet的结构与训练过程 158
7.4 ControlNet示例 162
7.4.1 ControlNet与Canny Edge 162
7.4.2 ControlNet与M-LSD Lines 162
7.4.3 ControlNet与HED Boundary 163
7.4.4 ControlNet与涂鸦画 164
7.4.5 ControlNet与人体关键点 164
7.4.6 ControlNet与语义分割 164
7.5 ControlNet实战 165
7.6 本章小结 174

第8章 音频扩散模型

8.1 实战:音频扩散模型 175
8.1.1 设置与导入 175
8.1.2 在预训练的音频扩散模型管线中进行采样 176
8.1.3 从音频到频谱的转换 177
8.1.4 微调管线 180
8.1.5 训练循环 183
8.2 将模型上传到Hugging Face Hub 186
8.3 本章小结 187
附录A 精美图像集展示 188
附录B Hugging Face相关资源 202

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这本大模型《扩散模型从原理到实战》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

PDF书籍: 完整版本链接获取

👉[CSDN大礼包🎁:《扩散模型从原理到实战》免费分享(安全链接,放心点击)]👈

这篇关于推荐大模型书籍|《扩散模型从原理到实战》,大模型爱好者有福了!!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1118197

相关文章

Spring Boot + MyBatis Plus 高效开发实战从入门到进阶优化(推荐)

《SpringBoot+MyBatisPlus高效开发实战从入门到进阶优化(推荐)》本文将详细介绍SpringBoot+MyBatisPlus的完整开发流程,并深入剖析分页查询、批量操作、动... 目录Spring Boot + MyBATis Plus 高效开发实战:从入门到进阶优化1. MyBatis

MyBatis 动态 SQL 优化之标签的实战与技巧(常见用法)

《MyBatis动态SQL优化之标签的实战与技巧(常见用法)》本文通过详细的示例和实际应用场景,介绍了如何有效利用这些标签来优化MyBatis配置,提升开发效率,确保SQL的高效执行和安全性,感... 目录动态SQL详解一、动态SQL的核心概念1.1 什么是动态SQL?1.2 动态SQL的优点1.3 动态S

Pandas使用SQLite3实战

《Pandas使用SQLite3实战》本文主要介绍了Pandas使用SQLite3实战,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学... 目录1 环境准备2 从 SQLite3VlfrWQzgt 读取数据到 DataFrame基础用法:读

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Python实战之屏幕录制功能的实现

《Python实战之屏幕录制功能的实现》屏幕录制,即屏幕捕获,是指将计算机屏幕上的活动记录下来,生成视频文件,本文主要为大家介绍了如何使用Python实现这一功能,希望对大家有所帮助... 目录屏幕录制原理图像捕获音频捕获编码压缩输出保存完整的屏幕录制工具高级功能实时预览增加水印多平台支持屏幕录制原理屏幕

查看Oracle数据库中UNDO表空间的使用情况(最新推荐)

《查看Oracle数据库中UNDO表空间的使用情况(最新推荐)》Oracle数据库中查看UNDO表空间使用情况的4种方法:DBA_TABLESPACES和DBA_DATA_FILES提供基本信息,V$... 目录1. 通过 DBjavascriptA_TABLESPACES 和 DBA_DATA_FILES

最新Spring Security实战教程之Spring Security安全框架指南

《最新SpringSecurity实战教程之SpringSecurity安全框架指南》SpringSecurity是Spring生态系统中的核心组件,提供认证、授权和防护机制,以保护应用免受各种安... 目录前言什么是Spring Security?同类框架对比Spring Security典型应用场景传统

最新Spring Security实战教程之表单登录定制到处理逻辑的深度改造(最新推荐)

《最新SpringSecurity实战教程之表单登录定制到处理逻辑的深度改造(最新推荐)》本章节介绍了如何通过SpringSecurity实现从配置自定义登录页面、表单登录处理逻辑的配置,并简单模拟... 目录前言改造准备开始登录页改造自定义用户名密码登陆成功失败跳转问题自定义登出前后端分离适配方案结语前言