高斯混合模型(GMM)先验的推断

2024-01-24 21:48

本文主要是介绍高斯混合模型(GMM)先验的推断,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

GMM先验的优化方程

假设图像降质模型为: Y = A X + N Y=AX+N Y=AX+N,我们希望恢复 X X X通过解决一个最大后验问题。

max ⁡ X P ( X ∣ Y ) = max ⁡ X P ( Y ∣ X ) P ( X ) = min ⁡ X − log ⁡ P ( Y ∣ X ) − log ⁡ P ( X ) \begin{aligned}\max\limits_{X}P(X|Y)&=\max\limits_{X}P(Y|X)P(X)\\&=\min\limits_{X}-\log P(Y|X)-\log P(X)\end{aligned} XmaxP(XY)=XmaxP(YX)P(X)=XminlogP(YX)logP(X). (1)

但是对于全局的先验很难获得,因此我们使用针对每个局部patch的先验信息

log ⁡ P ( X ) = ∑ i log ⁡ P ( R i X ) \log P(X)=\sum_{i}\log P(\mathbf R_iX) logP(X)=ilogP(RiX).(2)

其中 R i R_i Ri表示块提取算符。将降至模型和(2)带入(1)式并采用半二次分裂法,用辅助变量 z i z_i zi代替 R i X R_iX RiX得:

min ⁡ X λ 2 ∣ ∣ A X − Y ∣ ∣ 2 2 + ∑ i ( β 2 ∣ ∣ R i X − z i ∣ ∣ 2 2 − log ⁡ P ( z i ) ) \min_{X}\frac{\lambda}{2}||AX-Y||_2^2+\sum_i(\frac{\beta}{2}||R_iX-z_i||_2^2-\log P(z_i)) minX2λAXY22+i(2βRiXzi22logP(zi)).(3)

这里 λ = p σ 2 \lambda=\frac{p}{\sigma^2} λ=σ2p,p是patch的尺寸大小。

  1. 首先固定X通过解决一个最大后验问题求解 z i z_i zi
    min ⁡ z i β 2 ∣ ∣ R i X − z i ∣ ∣ 2 2 − log ⁡ P ( z i ) \min_{z_i}\frac{\beta}{2}||R_iX-z_i||_2^2-\log P(z_i) minzi2βRiXzi22logP(zi).(4)

  2. P ( z ) = ∑ k = 1 K ω k 1 ( 2 π ) p / 2 ∣ Σ k ∣ − 1 exp ⁡ ( − 1 2 z i t Σ k − 1 z i ) P(z)=\sum_{k=1}^{K}\omega_k\frac{1}{(2\pi)^{p/2}|\Sigma_k|^{-1}}\exp(-\frac{1}{2}z_i^t\Sigma_k^{-1}z_i) P(z)=k=1Kωk(2π)p/2Σk11exp(21zitΣk1zi).(5)

    那么 log ⁡ P ( z i ) = − 1 2 ω k z i t Σ k − 1 z i \log P(z_i)=-\frac{1}{2}\omega_kz_i^t\Sigma_k^{-1}z_i logP(zi)=21ωkzitΣk1zi(6),由于 ω k 1 ( 2 π ) p / 2 ∣ Σ k ∣ − 1 \omega_k\frac{1}{(2\pi)^{p/2}|\Sigma_k|^{-1}} ωk(2π)p/2Σk11这一项不含z,所以对求导没有影响,因此我们可以将这一项省略掉 。

  3. 最终的优化方程为:
    arg min ⁡ z β 2 ∣ ∣ R i X − z i ∣ ∣ 2 2 + 1 2 z i t Σ k − 1 z i \argmin_z\frac{\beta}{2}||R_iX-z_i||_2^2+\frac{1}{2}z_i^t\Sigma_k^{-1}z_i zargmin2βRiXzi22+21zitΣk1zi.(7)
    提示:对 1 2 z i t Σ k − 1 z i \frac{1}{2}z_i^t\Sigma_k^{-1}z_i 21zitΣk1zi 求导的结果是 ( Σ k − 1 + ( Σ k − 1 ) t ) z i (\Sigma_k^{-1}+(\Sigma_k^{-1})^t)z_i (Σk1+(Σk1)t)zi
    (矩阵求导)
    直接对z求导可得最终结果为:

    z i = ( ∑ k + 1 β I ) − 1 ∑ k R i X z_i=(\sum_k+\frac{1}{\beta}I)^{-1}\sum_kR_iX zi=(k+β1I)1kRiX.(8)

  4. 但是现在有一个重要的问题是我们训练的高斯混合模型中有200个子高斯模型,如何才能确定(8)式中用的 ∑ k \sum_k k是哪一个子模型的协方差矩阵呢?
    方案:直接将每一个提取出的patch分别代入200个高斯模型,比较得到的概率值大小,选择概率值最大的那个模型即可,每一个patch只能选择一个高斯模型,一幅图像中可以提取出很多个patch,所以相当于高斯混合模型的应用。

  5. 求解得到z之后,再固定z根据矩阵求导就可以很容易求得X,即可得到恢复后的图像。

参考文献

[1] Zoran D , Weiss Y . From learning models of natural image patches to whole image restoration[J]. 2011:479-486.

[2] Papyan V , Elad M . Multi-Scale Patch-Based Image Restoration[J]. IEEE Transactions on Image Processing, 2015:249-261.

这篇关于高斯混合模型(GMM)先验的推断的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/641116

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者