高斯分布归一化、期望、二阶矩、方差推导证明

2024-03-23 04:30

本文主要是介绍高斯分布归一化、期望、二阶矩、方差推导证明,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

 

写在前面的唠叨:

归一化推导证明:

期望(一阶矩)推导证明:

二阶矩推导证明:

方差推导证明:


写在前面的唠叨:

最近这段时间一直在研究深度学习之类的东西,虽然如今对几种常见的神经网络都有了很好的了解,用起来也比较顺手,但是越学也越觉得瓶颈越来越明显了,最大的问题觉得还是数学基础不行,学习那些常见的模型已经把线性代数的知识捡的差不多了,而到了想自己设计模型的时候,才忽然发现微积分也是十分重要的,而这两年我都还给老师了呀T_T。所以把PRML这本书又翻了出来,推导一下里面的公式。

然而刚看到高斯分布里面的方差推导就抽了我一嘴巴,去网上查了查发现这部分推导大家写的都挺乱的,于是自己总结了一下,留作记录,省的以后在看的时候到处乱查,重新推……

 


归一化推导证明:

证明归一化,即证明:

$$ \begin{aligned} \int_{-\infty }^{+\infty}N(x|\mu, \sigma^2)dx &=1 \end{aligned} $$

 

首先我们将其展开:

$$ \begin{aligned} \int_{-\infty }^{+\infty}N(x|\mu, \sigma^2)dx &=& \int_{-\infty }^{+\infty}\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ &=& \tfrac{1}{\sqrt{2\pi}\sigma }\int_{-\infty }^{+\infty}exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \end{aligned} $$

 

这里将 x-\mu替换掉有:

\int_{-\infty }^{+\infty}N(x|\mu, \sigma^2)dx = \tfrac{1}{\sqrt{2\pi}\sigma }\int_{-\infty }^{+\infty}exp\{-\tfrac{1}{2\sigma^2}x^2\}dx

 

这里假设:

$$ \begin{aligned} I &= \int_{-\infty }^{+\infty}exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \end{aligned} $$

这个积分直接计算比较困难,但是可以绕个弯,采用极坐标的方式计算,首先我们将其求其平方:

$$ \begin{aligned} I^2 & = \int_{-\infty }^{+\infty}\int_{-\infty }^{+\infty}exp\{-\tfrac{1}{2\sigma^2}(x^2 + y^2)\}dxdy \end{aligned} $$

在将其转化为极坐标,令x = cos\theta r ,\ y = sin\theta r可得:

$$ \begin{aligned} I^2 & = \int_{0 }^{2\pi}\int_{0 }^{+\infty}exp\{-\tfrac{r^2}{2\sigma^2}\}rdrd\theta \\ &= \pi \int_{0}^{+\infty}exp\{-\tfrac{r^2}{2\sigma^2}\}dr^2 \\ &= 2 \pi \sigma^2 \end{aligned} $$

 

即:

$$ \begin{aligned} \int_{-\infty }^{+\infty}N(x|\mu, \sigma^2)dx &=\tfrac{1}{\sqrt{2\pi}\sigma } I \\ & = 1 \end{aligned} $$

恩!大功告成!


期望(一阶矩)推导证明:

证明期望就比较简单了~

$$ \begin{aligned}E(X) & = \int_{-\infty }^{+\infty}xN(x|\mu, \sigma^2)dx \\ &= \int_{-\infty }^{+\infty}x\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \end{aligned} $$

将 x-\mu替换掉有:

$$ \begin{aligned}E(X) &= \int_{-\infty }^{+\infty}(x+\mu)\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \int_{-\infty }^{+\infty}x\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + \int_{-\infty }^{+\infty}\mu\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ \end{aligned} $$

这里\int_{-\infty }^{+\infty}x\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx为奇函数,所以该项积分为0,所以:

$$ \begin{aligned}E(X) &= \int_{-\infty }^{+\infty}\mu\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \mu \int_{-\infty }^{+\infty}\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \mu \int_{-\infty }^{+\infty}N(x|0, \sigma^2)dx \\ &= \mu\end{aligned} $$


二阶矩推导证明:

就是这个东西,推了一上午都没推出来,最后还是的问了周围考研的同学,真是耻辱,被挂起来抽。这里给出了两种推导方式:

1. 展开利用Gamma函数进行求解:

$$ \begin{aligned}E(X^2) & = \int_{-\infty }^{+\infty}x^2N(x|\mu, \sigma^2)dx \\ &= \int_{-\infty }^{+\infty}x^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ \end{aligned}$$

将 x-\mu替换掉有:

$$ \begin{aligned}E(X^2) & = \int_{-\infty }^{+\infty}(x+\mu)^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \int_{-\infty }^{+\infty}x^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + \int_{-\infty }^{+\infty}2x\mu\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + \int_{-\infty }^{+\infty}\mu^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \int_{-\infty }^{+\infty}x^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + 0 + \mu^2 \\ &=\tfrac{4\sigma}{\sqrt{2\pi} }\int_{0 }^{+\infty}\tfrac{x^2}{2\sigma^2 }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + \mu^2 \end{aligned}$$

这里令第一项中\tfrac{x^2}{2\sigma^2 } = t,即有:

$$ \begin{aligned}E(X^2) & = \tfrac{2\sigma^2}{\sqrt{\pi} }\int_{0 }^{+\infty}\sqrt{t}e^{-t}dx + \mu^2 \\ &= \tfrac{2\sigma^2}{\sqrt{\pi} }\Gamma ( \tfrac{3}{2}) + \mu^2 \\ &= \tfrac{2\sigma^2}{\sqrt{\pi} } \tfrac{\sqrt{\pi}}{2 } + \mu^2 \\ &= \sigma^2 + \mu^2 \end{aligned}$$

这里用到了\Gamma()函数,也就是我们通常说的伽马函数,它的定义是这样的:

\Gamma(z) = \int_{0 }^{+\infty}\frac{t^{z-1}}{e^t}dt

这里有几个特殊值,感兴趣的话可以记一下。

\begin{array}{rcccl} \Gamma\left(-\tfrac{3}{2}\right) &=& \tfrac{4}{3} \sqrt{\pi} &\approx& 2.363\,271\,801\,207 \\ \Gamma\left(-\tfrac{1}{2}\right) &=& -2\sqrt{\pi} &\approx& -3.544\,907\,701\,811 \\ \Gamma\left(\tfrac{1}{2}\right) &=& \sqrt{\pi} &\approx& 1.772\,453\,850\,906 \\ \Gamma(1) &=& 0! &=& 1 \\ \Gamma\left(\tfrac{3}{2}\right) &=& \tfrac{1}{2}\sqrt{\pi} &\approx& 0.886\,226\,925\,453 \\ \Gamma(2) &=& 1! &=& 1 \\ \Gamma\left(\tfrac{5}{2}\right) &=& \tfrac{3}{4}\sqrt{\pi} &\approx& 1.329\,340\,388\,179 \\ \Gamma(3) &=& 2! &=& 2 \\ \Gamma\left(\tfrac{7}{2}\right) &=& \tfrac{15}{8}\sqrt{\pi} &\approx& 3.323\,350\,970\,448 \\ \Gamma(4) &=& 3! &=& 6 \end{array}

特殊值内容来自中文wiki,所以出错了不负责哦,嘿嘿……

当然这里用到了伽马函数,也可以采用不用伽马函数的方法。

 

2. 直接积分求解:

啊~这个就是我同学的方法,实名感谢猛某,如果多年后您看见这篇博客别忘了朝我要稿费。

$$ \begin{aligned}E(X^2) & = \int_{-\infty }^{+\infty}x^2N(x|\mu, \sigma^2)dx \\ &= \int_{-\infty }^{+\infty}x^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ &= \int_{-\infty }^{+\infty}\tfrac{(x-\mu)(x+\mu) +\mu^2}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ &= \int_{-\infty }^{+\infty}\tfrac{(x-\mu)(x+\mu)}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx + \mu^2\int_{-\infty }^{+\infty}\tfrac{ 1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ &= \int_{-\infty }^{+\infty}-\tfrac{(x+\mu)\sigma}{\sqrt{2\pi} }dexp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\} + \mu^2 \\ &= -\tfrac{(x+\mu)\sigma}{\sqrt{2\pi} }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}|^{+\infty}_{-\infty} + \int_{-\infty }^{+\infty}\tfrac{\sigma}{\sqrt{2\pi} }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx + \mu^2 \\ &= 0 + \sigma^2\int_{-\infty }^{+\infty}\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx + \mu^2 \\ &= \sigma^2 + \mu^2 \end{aligned}$$


方差推导证明:

既然我们已经求的了一阶矩、二阶矩,那么再求方差就简单了:

$$ \begin{aligned}D(X) & = E(X^2) - E(X)^2 \\ &= \sigma^2 + \mu^2 - \mu^2\\ &= \sigma^2 \end{aligned}$$

 

当然方差也可以直接求,因为这部分已经有前辈推导过了,我就直接上图了!(才不是嫌麻烦,不想写latex代码

这里标明出处,前辈的推导很棒,给了我很大帮助。


留个坑:

本来是想写个PRML的全公式推导的读书笔记,然而码完了这些代码,突然觉得好麻烦收获好大,尽力吧,如果时间充裕会补一补,留个坑,溜……

 

这篇关于高斯分布归一化、期望、二阶矩、方差推导证明的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/837137

相关文章

uva 10014 Simple calculations(数学推导)

直接按照题意来推导最后的结果就行了。 开始的时候只做到了第一个推导,第二次没有继续下去。 代码: #include<stdio.h>int main(){int T, n, i;double a, aa, sum, temp, ans;scanf("%d", &T);while(T--){scanf("%d", &n);scanf("%lf", &first);scanf

【无线通信发展史⑧】测量地球质量?重力加速度g的测量?如何推导单摆周期公式?地球半径R是怎么测量出来的?

前言:用这几个问答形式来解读下我这个系列的来龙去脉。如果大家觉得本篇文章不水的话希望帮忙点赞收藏加关注,你们的鼓舞是我继续更新的动力。 我为什么会写这个系列呢? 首先肯定是因为我本身就是一名从业通信者,想着更加了解自己专业的知识,所以更想着从头开始了解通信的来源以及在每一个时代的发展进程。 为什么会从头开始写通信? 我最早是学习了中华上下五千年,应该说朝代史,这个算个人兴趣,从夏

CF #278 (Div. 2) B.(暴力枚举+推导公式+数学构造)

B. Candy Boxes time limit per test 1 second memory limit per test 256 megabytes input standard input output standard output 题目链接: http://codeforces.com/contest/488/problem/B There

HDU2524(规律推导)

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2524 解题思路: 暴力推出矩阵,以n = 2 , m = 4为例: 1 3  6  10 3 9 18 30 可以发现第一行和第一列都是有规律的,彼此相差2、3、4·····,其他元素为相应行第一个元素乘以第一列元素的积。预处理之后,我们O(1)就可以输出g[n][m]的值。 另外,

Ural1209(数学推导)

题目链接:点击打开链接 解题思路: 此题甚好。推导公式,首先观察序列110100100010000·····,我们把为1的下标单独拿出来看。依次为1、2、4 、7、 11·····,可以分解为1+(0) 、1+(0+1)、1+(0+1+2)、1+(0+1+2+3)、1+(0+1+2+3+4),可以推导出规律1 + x * (x - 1) / 2。 那么对于每个n,我们只要判断是否存在x

Python中如何实现列表推导式(List Comprehension)

Python中的列表推导式(List Comprehension)是一种简洁且高效的方式来创建列表。它不仅让代码更加简洁,而且通常比使用循环和条件语句生成列表更快。列表推导式的基本形式允许你从现有的列表或其他可迭代对象中创建新的列表,同时应用过滤和转换操作。下面我将详细解释列表推导式的概念、基本语法、高级用法以及其在实际应用中的优势。 一、列表推导式的基本概念 列表推导式是Python中的一种

对极约束及其性质 —— 公式详细推导

Title: 对极约束及其性质 —— 公式详细推导 文章目录 前言1. 对极约束 (Epipolar Constraint)2. 坐标转换 (Coordinate Transformations)3. 像素坐标 (Pixel Coordinates)4. 像素坐标转换 (Transformations of Pixel Coordinates)5. 本质矩阵 (Essential Matr

【深度学习 误差计算】10分钟了解下均方差和交叉熵损失函数

常见的误差计算函数有均方差、交叉熵、KL 散度、Hinge Loss 函数等,其中均方差函数和交叉熵函数在深度学习中比较常见,均方差主要用于回归问题,交叉熵主要用于分类问题。下面我们来深刻理解下这两个概念。 1、均方差MSE。 预测值与真实值之差的平方和,再除以样本量。 均方差广泛应用在回归问题中,在分类问题中也可以应用均方差误差。 2、交叉熵 再介绍交叉熵损失函数之前,我们首先来介绍信息

【Python基础】Python推导式

本文收录于 《Python编程入门》专栏,从零基础开始,分享一些Python编程基础知识,欢迎关注,谢谢! 文章目录 一、前言二、列表推导式三、元组推导式(生成器表达式)四、字典推导式五、集合推导式六、总结 一、前言 Python推导式(Comprehensions)是Python语言中一种独特且强大的语法特性,用于从已有的可迭代对象(如列表、元组、字典、集合)快速创建

《机器学习》 基于SVD的矩阵分解 推导、案例实现

目录 一、SVD奇异值分解 1、什么是SVD 2、SVD的应用         1)数据降维         2)推荐算法         3)自然语言处理 3、核心         1)什么是酉矩阵         2)什么是对角矩阵 4、分解过程 二、推导 1、如何求解这三个矩阵         1)已知:          2)根据酉矩阵的特点即可得出: