多维高斯分布(多元正态分布)的概率密度函数和最大似然估计

本文主要是介绍多维高斯分布(多元正态分布)的概率密度函数和最大似然估计,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

多元高斯分布的概率密度函数

f μ , Σ ( x ) = 1 ( 2 π ) D / 2 1 ∣ Σ ∣ 1 / 2 e x p { − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) } f_{\mu, \Sigma}(x)=\frac{1}{(2 \pi)^{D/2}} \frac{1}{|\Sigma|^{1/2}} exp\{-\frac{1}{2}(x-\mu)^T \Sigma ^{-1}(x-\mu)\} fμ,Σ(x)=(2π)D/21∣Σ1/21exp{21(xμ)TΣ1(xμ)}

这是多维高斯分布(多元正态分布)的概率密度函数。让我逐步解释这个公式的各个部分:

  • f μ , Σ ( x ) f_{\mu, \Sigma}(x) fμ,Σ(x) 是表示多维高斯分布的概率密度函数,其中 x x x 是一个 D 维向量( x ∈ R D x \in \mathbb{R}^D xRD)。
  • D D D 是数据的维度,表示向量 x x x 包含了 D 个随机变量。
  • μ \mu μ(mu)是一个 D 维向量,表示多维高斯分布的均值向量。
  • Σ \Sigma Σ(Sigma)是一个 DxD 的协方差矩阵,表示不同维度之间的协方差关系。
  • ( x − μ ) T (x-\mu)^T (xμ)T 表示向量 ( x − μ ) (x-\mu) (xμ) 的转置(transpose)。
  • ∣ Σ ∣ |\Sigma| ∣Σ∣ 表示协方差矩阵 Σ \Sigma Σ 的行列式(determinant)。
  • Σ − 1 \Sigma^{-1} Σ1 表示协方差矩阵 Σ \Sigma Σ 的逆矩阵(inverse)。

公式的含义:

这个公式描述了 D 维多维高斯分布的概率密度。它告诉我们在给定均值 μ \mu μ 和协方差矩阵 Σ \Sigma Σ 的情况下,随机变量 x x x 出现在空间中的概率密度。

  • 1 ( 2 π ) D / 2 \frac{1}{(2 \pi)^{D/2}} (2π)D/21 是一个标准化系数,用于确保概率密度的积分等于 1,使其成为一个合法的概率分布。
  • 1 ∣ Σ ∣ 1 / 2 \frac{1}{|\Sigma|^{1/2}} ∣Σ1/21 是协方差矩阵的行列式的平方根的倒数,也是标准化系数的一部分,用于调整概率密度的幅度。
  • e x p { − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) } exp\{-\frac{1}{2}(x-\mu)^T \Sigma ^{-1}(x-\mu)\} exp{21(xμ)TΣ1(xμ)} 是指数部分,它包含了 x x x 与均值 μ \mu μ 的差异与协方差矩阵 Σ \Sigma Σ 的逆之间的关系。这一部分体现了多维高斯分布的形状和方差。它与 D 维空间中的点 x x x 到均值 μ \mu μ 的距离以及协方差矩阵的逆有关。

多维高斯分布的概率密度函数用于描述多维数据的分布,通常在统计、模式识别、机器学习等领域中广泛应用。不同的协方差矩阵 Σ \Sigma Σ 和均值向量 μ \mu μ 可以产生不同形状的多维高斯分布,从而用于建模不同类型的数据分布。

多元高斯分布的最大似然估计

L ( μ , Σ ) = f μ , Σ ( x 1 ) f μ , Σ ( x 2 ) f μ , Σ ( x 3 ) . . . . . . f μ , Σ ( x 7 9 ) L(\mu,\Sigma)=f_{\mu,\Sigma}(x^1) f_{\mu,\Sigma}(x^2) f_{\mu,\Sigma}(x^3)......f_{\mu,\Sigma}(x^79) L(μ,Σ)=fμ,Σ(x1)fμ,Σ(x2)fμ,Σ(x3)......fμ,Σ(x79)
μ ∗ , Σ ∗ = a r g max ⁡ μ , Σ L ( μ , Σ ) \mu^*,\Sigma^*=arg \max\limits_{\mu,\Sigma}L(\mu,\Sigma) μ,Σ=argμ,ΣmaxL(μ,Σ)

这个问题是要通过最大似然估计(MLE)来估计多元高斯分布的参数 μ ∗ \mu^* μ Σ ∗ \Sigma^* Σ,以使给定数据集的似然 L ( μ , Σ ) L(\mu, \Sigma) L(μ,Σ) 最大化。

在这个上下文中, L ( μ , Σ ) L(\mu, \Sigma) L(μ,Σ) 表示似然函数,它是一个关于参数 μ \mu μ Σ \Sigma Σ 的函数,用于描述观测数据 x 1 , x 2 , x 3 , . . . , x 79 x^1, x^2, x^3, ..., x^{79} x1,x2,x3,...,x79 在给定参数下的概率。似然函数通常假设数据是根据多元高斯分布生成的,公式如下:

L ( μ , Σ ) = f μ , Σ ( x 1 ) ⋅ f μ , Σ ( x 2 ) ⋅ f μ , Σ ( x 3 ) ⋅ . . . ⋅ f μ , Σ ( x 79 ) L(\mu, \Sigma) = f_{\mu, \Sigma}(x^1) \cdot f_{\mu, \Sigma}(x^2) \cdot f_{\mu, \Sigma}(x^3) \cdot ... \cdot f_{\mu, \Sigma}(x^{79}) L(μ,Σ)=fμ,Σ(x1)fμ,Σ(x2)fμ,Σ(x3)...fμ,Σ(x79)

其中, f μ , Σ ( x ) f_{\mu, \Sigma}(x) fμ,Σ(x) 是多元高斯分布的概率密度函数,参数为 μ \mu μ Σ \Sigma Σ。这个似然函数表示了给定参数下观测数据集中每个数据点的出现概率,然后将它们的概率连乘得到整个数据集的似然。

你的目标是找到最大化似然函数的参数 μ ∗ \mu^* μ Σ ∗ \Sigma^* Σ,即:

μ ∗ , Σ ∗ = arg ⁡ max ⁡ μ , Σ L ( μ , Σ ) \mu^*, \Sigma^* = \arg\max_{\mu, \Sigma} L(\mu, \Sigma) μ,Σ=argμ,ΣmaxL(μ,Σ)

这通常涉及到通过数值方法(如梯度上升法或牛顿法)来找到似然函数的极大值点,从而找到最可能的参数值 μ ∗ \mu^* μ Σ ∗ \Sigma^* Σ,以使数据集的生成概率最大化。这是多元高斯分布的最大似然估计过程。
在这里插入图片描述

假设概率P(x|C_1)的分布服从 f μ , Σ ( x ) = 1 ( 2 π ) D / 2 1 ∣ Σ ∣ 1 / 2 e x p { − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) } f_{\mu, \Sigma}(x)=\frac{1}{(2 \pi)^{D/2}} \frac{1}{|\Sigma|^{1/2}} exp\{-\frac{1}{2}(x-\mu)^T \Sigma ^{-1}(x-\mu)\} fμ,Σ(x)=(2π)D/21∣Σ1/21exp{21(xμ)TΣ1(xμ)},如何计算概率P

其中
μ = [ 75.0 71.3 ] \mu=\begin{bmatrix} 75.0\\ 71.3\\ \end{bmatrix} μ=[75.071.3]

Σ = [ 874 327 327 929 ] \Sigma=\begin{bmatrix} 874&327\\ 327&929\\ \end{bmatrix} Σ=[874327327929]

根据提供的信息,我们知道概率密度函数 P ( x ∣ C 1 ) P(x|C_1) P(xC1) 符合多元高斯分布,其中参数如下:

均值向量 μ \mu μ
μ = [ 75.0 71.3 ] \mu=\begin{bmatrix} 75.0\\ 71.3\\ \end{bmatrix} μ=[75.071.3]

协方差矩阵 Σ \Sigma Σ
Σ = [ 874 327 327 929 ] \Sigma=\begin{bmatrix} 874&327\\ 327&929\\ \end{bmatrix} Σ=[874327327929]

现在,如果你想计算在给定条件 C 1 C_1 C1 下,随机变量 x x x 落在某个区域 [ a , b ] [a, b] [a,b] 内的概率,你可以使用概率密度函数来计算。具体来说,你可以计算 P ( x ∣ C 1 ) P(x|C_1) P(xC1) 的积分,从 a a a b b b,如下:

P ( a ≤ x ≤ b ∣ C 1 ) = ∫ a b 1 ( 2 π ) D / 2 ∣ Σ ∣ 1 / 2 exp ⁡ ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) d x P(a \leq x \leq b | C_1) = \int_{a}^{b} \frac{1}{(2 \pi)^{D/2} |\Sigma|^{1/2}} \exp\left(-\frac{1}{2}(x-\mu)^T \Sigma^{-1} (x-\mu)\right) dx P(axbC1)=ab(2π)D/2∣Σ1/21exp(21(xμ)TΣ1(xμ))dx

在这个公式中,你可以将 a a a b b b 设置为你感兴趣的区间的上下限。通过计算上述积分,你可以获得随机变量 x x x 落在该区间内的条件概率。

这是一个连续分布的概率计算示例,根据具体的区间和需要计算的概率,你可以替换 a a a b b b 来计算不同区域内的条件概率。

这篇关于多维高斯分布(多元正态分布)的概率密度函数和最大似然估计的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/211887

相关文章

poj 3723 kruscal,反边取最大生成树。

题意: 需要征募女兵N人,男兵M人。 每征募一个人需要花费10000美元,但是如果已经招募的人中有一些关系亲密的人,那么可以少花一些钱。 给出若干的男女之间的1~9999之间的亲密关系度,征募某个人的费用是10000 - (已经征募的人中和自己的亲密度的最大值)。 要求通过适当的招募顺序使得征募所有人的费用最小。 解析: 先设想无向图,在征募某个人a时,如果使用了a和b之间的关系

poj 3258 二分最小值最大

题意: 有一些石头排成一条线,第一个和最后一个不能去掉。 其余的共可以去掉m块,要使去掉后石头间距的最小值最大。 解析: 二分石头,最小值最大。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <c

poj 2175 最小费用最大流TLE

题意: 一条街上有n个大楼,坐标为xi,yi,bi个人在里面工作。 然后防空洞的坐标为pj,qj,可以容纳cj个人。 从大楼i中的人到防空洞j去避难所需的时间为 abs(xi - pi) + (yi - qi) + 1。 现在设计了一个避难计划,指定从大楼i到防空洞j避难的人数 eij。 判断如果按照原计划进行,所有人避难所用的时间总和是不是最小的。 若是,输出“OPETIMAL",若

poj 2135 有流量限制的最小费用最大流

题意: 农场里有n块地,其中约翰的家在1号地,二n号地有个很大的仓库。 农场有M条道路(双向),道路i连接着ai号地和bi号地,长度为ci。 约翰希望按照从家里出发,经过若干块地后到达仓库,然后再返回家中的顺序带朋友参观。 如果要求往返不能经过同一条路两次,求参观路线总长度的最小值。 解析: 如果只考虑去或者回的情况,问题只不过是无向图中两点之间的最短路问题。 但是现在要去要回

poj 2594 二分图最大独立集

题意: 求一张图的最大独立集,这题不同的地方在于,间接相邻的点也可以有一条边,所以用floyd来把间接相邻的边也连起来。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <sta

poj 3422 有流量限制的最小费用流 反用求最大 + 拆点

题意: 给一个n*n(50 * 50) 的数字迷宫,从左上点开始走,走到右下点。 每次只能往右移一格,或者往下移一格。 每个格子,第一次到达时可以获得格子对应的数字作为奖励,再次到达则没有奖励。 问走k次这个迷宫,最大能获得多少奖励。 解析: 拆点,拿样例来说明: 3 2 1 2 3 0 2 1 1 4 2 3*3的数字迷宫,走两次最大能获得多少奖励。 将每个点拆成两个

poj 3692 二分图最大独立集

题意: 幼儿园里,有G个女生和B个男生。 他们中间有女生和女生认识,男生男生认识,也有男生和女生认识的。 现在要选出一些人,使得这里面的人都认识,问最多能选多少人。 解析: 反过来建边,将不认识的男生和女生相连,然后求一个二分图的最大独立集就行了。 下图很直观: 点击打开链接 原图: 现图: 、 代码: #pragma comment(

最大流、 最小费用最大流终极版模板

最大流  const int inf = 1000000000 ;const int maxn = 20000 , maxm = 500000 ;struct Edge{int v , f ,next ;Edge(){}Edge(int _v , int _f , int _next):v(_v) ,f(_f),next(_next){}};int sourse , mee

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

最大流=最小割=最小点权覆盖集=sum-最大点权独立集

二分图最小点覆盖和最大独立集都可以转化为最大匹配求解。 在这个基础上,把每个点赋予一个非负的权值,这两个问题就转化为:二分图最小点权覆盖和二分图最大点权独立集。   二分图最小点权覆盖     从x或者y集合中选取一些点,使这些点覆盖所有的边,并且选出来的点的权值尽可能小。 建模:     原二分图中的边(u,v)替换为容量为INF的有向边(u,v),设立源点s和汇点t