【扩散模型系列学习】Diffusion Model

2024-08-26 17:36

文章标签 模型 model diffusion 扩散系列学习

本文主要是介绍【扩散模型系列学习】Diffusion Model，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Denoising Diffusion Probabilistic Models

生成模型简介

生成式模型：

生成是“言出法随”
生成是“涌现” or “幻觉”

定义：

一个能随机生成与训练数据一致的模型

问题：

如何对训练数据建模？
如何采样？

思路：

从一个简单分布采样是容易的
从简单分布到观测数据分布是可以拟合的

生成模型的解题思路：

将观测数据分布映射到简单分布【encoder】
从简单分布中映射到观测数据分布【decoder】

在这里插入图片描述

Why 高斯？高斯混合模型

一个复杂分布可以用多个高斯分布来表示。假设有K个高斯分布，这K个高斯分布称作混合模型的隐变量。则复杂分布的概览分布是：
$P_\theta(x)=\sum_{i=1}^KP(z_i)*P_\theta(x|z_i)$
这里 $P(z_i)$ 表示第i个高斯分布在观测数据中所占概率。 $P_\theta(x|z_i)$ 表示第i个高斯分布的概率分布函数。

实际K取多少？K是超参数吗？
我们得知里 $P(z_i)$ 表示第i个高斯分布在观测数据中所占概率，那么其积分=1，所以用一个连续的标准高斯分布来表示， $P(z)\sim N(0,1)$ 。
上面离散的即转为连续。
$P_\theta(x)=\int P(z)*P_\theta(x|z)$

如何求 $\theta$ ？
Maximum Likelihood Estimate： $\theta ^*=argmax_\theta P_\theta (x)$
（详细公式推导略。）

DDPM

Diffusion Model 作为生成模型的一类同样包含encoder和decoder两个阶段。

前向扩散过程：
向观测数据中逐步加入噪声，直到观测数据变成高斯分布。
反向生成过程：
从一个高斯分布中采样，逐步消除噪声，直到变成清晰数据。

（受启发于非平衡热力学。）

前向扩散过程：

如何加噪声？
$x_t=\sqrt{1-\beta_t}*x_{t-1}+\sqrt{\beta_t}*\epsilon_{t-1}$
加了多少次噪声？
在DDPM中一共加了1000次噪声。

在这里插入图片描述

重参数采样：

若y是一个高斯分布 $y\sim N(\mu,\sigma ^2)$

则 $\frac{y-\mu}{\sigma}\sim N(0,1)$

设 $\epsilon$ 是一个标准高斯分布

则 $y=\sigma*\epsilon+\mu\sim N(\mu,\sigma ^2)$

所以 $x_t$ 满足高斯分布 ( $x_t=\sqrt{1-\beta_t}*x_{t-1}+\sqrt{\beta_t}*\epsilon_{t-1}$ )，且：

$x_t\sim N(\sqrt{1-\beta_t}*x_{t-1},\beta_t)$

论文中的定义：

一个真实分布的data，分布满足 $x_0\sim q(x)$ ，一共加了T次噪声，得到 $x_1, x_2, ..., x_r$
每次加噪声操作是对前一次加完噪声的结果操作（Markov chain），

$q(x_t|x_{t-1})=N(x_t;\sqrt{1-\beta_t}*x_{t-1},\beta_tI)$

$\beta_t$ 是超参数，I 是标准高斯分布，在DDPM中， $\beta_t$ 是随着 t 线性增长的（随着 t 的增大， $x_t$ 趋近于标准高斯分布）。

$x_t$ 可以根据 $x_0,t$ 直接推导出来

两个独立高斯分布的和依然是高斯分布，且均值为二者均值的和，方差为二者方差的和。

在这里插入图片描述
所以，给定图片和时间t，前向扩散是一个确定的过程。
$q(x_t|x_0)=N(x_t;\sqrt{\overline{\alpha}_t}*x_0,(1-\overline{\alpha}_t)*\epsilon)$

反向扩散过程：

反向生成过程：从一个高斯分布采样，通过反转过程生成观测图像
在这里插入图片描述
事实上在已知 $x_0$ 情况下，反向生成过程也是一个确定性的过程。

根据贝叶斯公式
在这里插入图片描述

在这里插入图片描述

优化目标：

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

总结

DDPM 是一类生成模型，输入是标准高斯噪声，输出是图片
DDPM 是稳定易训练的
DDPM 生成过程不是一步到位的，需要迭代（耗时）
DDPM 的输入和输出尺寸是一致的（耗资源耗时）

针对耗时的问题
许多加速采样的方法应运而生，目的是降低迭代的次数，从而提速

针对耗资源的问题
Latent Diffusion Models 通过结合 VQ-VAE，将diffusion model做到VAE的encoder输出上，如此减少了diffusion model的输入尺寸，也节省了资源和耗时。

Reference:
B站up主: SY_007 Diffusion Model讲解视频

$A u t h or : C hi er$

这篇关于【扩散模型系列学习】Diffusion Model的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1109228。 23002807@qq.com

相关文章

详解如何使用Python从零开始构建文本统计模型

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

阅读更多...

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》：本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结

阅读更多...

Pydantic中model_validator的实现

Pydantic中model_validator的实现

《Pydantic中model_validator的实现》本文主要介绍了Pydantic中model_validator的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录引言基础知识创建 Pydantic 模型使用 model_validator 装饰器高级用法mo

阅读更多...

Spring Security基于数据库的ABAC属性权限模型实战开发教程

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》：本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

阅读更多...

Java的IO模型、Netty原理解析

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容：标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO（blocking I/O）NI

阅读更多...

基于Flask框架添加多个AI模型的API并进行交互

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》：本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

阅读更多...

GORM中Model和Table的区别及使用

GORM中Model和Table的区别及使用

《GORM中Model和Table的区别及使用》Model和Table是两种与数据库表交互的核心方法,但它们的用途和行为存在著差异,本文主要介绍了GORM中Model和Table的区别及使用,具有一... 目录1. Model 的作用与特点1.1 核心用途1.2 行为特点1.3 示例China编程代码2. Tab

阅读更多...

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

阅读更多...

SpringBoot快速接入OpenAI大模型的方法(JDK8)

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

阅读更多...

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型，3步搞定一个应

阅读更多...