高斯混合模型（GMM）先验的推断

本文主要是介绍高斯混合模型（GMM）先验的推断，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

假设图像降质模型为： $Y = A X + N$ ，我们希望恢复 $X$ 通过解决一个最大后验问题。

$\begin{aligned}\max\limits_{X}P(X|Y)&=\max\limits_{X}P(Y|X)P(X)\\&=\min\limits_{X}-\log P(Y|X)-\log P(X)\end{aligned}$ . (1)

但是对于全局的先验很难获得，因此我们使用针对每个局部patch的先验信息

$\log P(X)=\sum_{i}\log P(\mathbf R_iX)$ .(2)

其中 $R_i$ 表示块提取算符。将降至模型和（2）带入（1）式并采用半二次分裂法，用辅助变量 $z_i$ 代替 $R_iX$ 得：

$\min_{X}\frac{\lambda}{2}||AX-Y||_2^2+\sum_i(\frac{\beta}{2}||R_iX-z_i||_2^2-\log P(z_i))$ .(3)

这里 $\lambda=\frac{p}{\sigma^2}$ ，p是patch的尺寸大小。

首先固定X通过解决一个最大后验问题求解 $z_i$
$\min_{z_i}\frac{\beta}{2}||R_iX-z_i||_2^2-\log P(z_i)$ .(4)
$P(z)=\sum_{k=1}^{K}\omega_k\frac{1}{(2\pi)^{p/2}|\Sigma_k|^{-1}}\exp(-\frac{1}{2}z_i^t\Sigma_k^{-1}z_i)$ .(5)

那么 $\log P(z_i)=-\frac{1}{2}\omega_kz_i^t\Sigma_k^{-1}z_i$ （6），由于 $\omega_k\frac{1}{(2\pi)^{p/2}|\Sigma_k|^{-1}}$ 这一项不含z，所以对求导没有影响，因此我们可以将这一项省略掉。
最终的优化方程为：
$\argmin_z\frac{\beta}{2}||R_iX-z_i||_2^2+\frac{1}{2}z_i^t\Sigma_k^{-1}z_i$ .(7)
提示：对 $\frac{1}{2}z_i^t\Sigma_k^{-1}z_i$ 求导的结果是 $(\Sigma_k^{-1}+(\Sigma_k^{-1})^t)z_i$
（矩阵求导）
直接对z求导可得最终结果为：

$z_i=(\sum_k+\frac{1}{\beta}I)^{-1}\sum_kR_iX$ .（8）
但是现在有一个重要的问题是我们训练的高斯混合模型中有200个子高斯模型，如何才能确定（8）式中用的 $\sum_k$ 是哪一个子模型的协方差矩阵呢？
方案：直接将每一个提取出的patch分别代入200个高斯模型，比较得到的概率值大小，选择概率值最大的那个模型即可，每一个patch只能选择一个高斯模型，一幅图像中可以提取出很多个patch，所以相当于高斯混合模型的应用。
求解得到z之后，再固定z根据矩阵求导就可以很容易求得X，即可得到恢复后的图像。