估计理论(2):多元高斯变量的条件概率密度函数(PDF)

2024-03-13 18:38

本文主要是介绍估计理论(2):多元高斯变量的条件概率密度函数(PDF),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本节内容摘自Steven M. Kay,《Fundamentals of Statistical Signal Processing: Estimation Theory》。

【定理10.2】多元高斯向量的条件PDF

如果 x ∈ R k × 1 {\bf x}\in \mathbb{R}^{k\times 1} xRk×1 y ∈ R l × 1 {\bf y}\in \mathbb{R}^{l\times 1} yRl×1为联合高斯分布随机向量,均值向量为 [ E ( x ) E ( x ) ] T [{\rm E}({\bf x})\ {\rm E}({\bf x})]^{\rm T} [E(x) E(x)]T,分块协方差矩阵为
C = [ C x x C x y C y x C y y ] , (10.23) \tag{10.23} {\bf C}= \left[ \begin{matrix} {\bf C}_{xx} & {\bf C}_{xy} \\{\bf C}_{yx}& {\bf C}_{yy}\end{matrix} \right], C=[CxxCyxCxyCyy],(10.23)其中 C x x ∈ R k × k {\bf C}_{xx}\in \mathbb{R}^{k\times k} CxxRk×k C y y ∈ R l × l {\bf C}_{yy}\in \mathbb{R}^{l\times l} CyyRl×l分别为向量 x \bf x x y \bf y y的自协方差阵, C x y ∈ R k × l {\bf C}_{xy}\in \mathbb{R}^{k\times l} CxyRk×l C y x ∈ R l × k {\bf C}_{yx}\in \mathbb{R}^{l\times k} CyxRl×k为向量 x \bf x x y \bf y y的互协方差阵。显然,我们可以得到 x \bf x x y \bf y y的联合概率密度函数为
p ( x , y ) = 1 ( 2 π ) k + l 2 d e t 1 2 ( C ) e x p [ − 1 2 ( [ x − E ( x ) y − E ( y ) ] ) T C − 1 ( [ x − E ( x ) y − E ( y ) ] ) ] , p({\bf x},{\bf y})=\frac{1}{(2\pi)^{\frac{k+l}{2}}{\rm det}^{\frac{1}{2}}(\bf C)}{\rm exp}\left[-\frac{1}{2}\left( \left[\begin{matrix}{\bf x}-{\rm E}({\bf x} )\\ {\bf y}-{\rm E}({\bf y})\end{matrix}\right]\right)^{\rm T}{\bf C}^{-1}\left( \left[\begin{matrix}{\bf x}-{\rm E}({\bf x} )\\ {\bf y}-{\rm E}({\bf y})\end{matrix}\right]\right)\right], p(x,y)=(2π)2k+ldet21(C)1exp[21([xE(x)yE(y)])TC1([xE(x)yE(y)])],因此,条件PDF p ( y ∣ x ) p(\bf y|x) p(yx)也为高斯的,且
E ( y ∣ x ) = E ( y ) + C y x C x x − 1 ( x − E ( x ) ) (10.24) \tag{10.24} {\rm E}({\bf y|x})={\rm E}({\bf y})+{\bf C}_{yx}{\bf C}^{-1}_{xx}(x-{\rm E}({\bf x})) E(yx)=E(y)+CyxCxx1(xE(x))(10.24) C y ∣ x = C y y − C y x C x x − 1 C x y . (10.25) \tag{10.25} {\bf C}_{y|x}={\bf C}_{yy}-{\bf C}_{yx}{\bf C}^{-1}_{xx}{\bf C}_{xy}. Cyx=CyyCyxCxx1Cxy.(10.25)注意,条件PDF的协方差矩阵并不依赖于 x \bf x x,尽管这个属性通常并不成立。

【附录10A】条件高斯PDF的推导

我们来推导【定理10.2】的结论。显然,我们有
p ( y ∣ x ) = p ( x , y ) p ( x ) = 1 ( 2 π ) k + l 2 d e t 1 2 ( C ) e x p [ − 1 2 ( [ x − E ( x ) y − E ( y ) ] ) T C − 1 ( [ x − E ( x ) y − E ( y ) ] ) ] 1 ( 2 π ) k 2 det ⁡ 1 2 ( C x x ) exp ⁡ [ − 1 2 ( x − E ( x ) ) T C x x − 1 ( x − E ( x ) ) ] . \begin{aligned} p({\bf y}|{\bf x})&=\frac{p({\bf x,y})}{p({\bf x})}\\ &=\frac{\frac{1}{(2\pi)^{\frac{k+l}{2}}{\rm det}^{\frac{1}{2}}(\bf C)}{\rm exp}\left[-\frac{1}{2}\left( \left[\begin{matrix}{\bf x}-{\rm E}({\bf x} )\\ {\bf y}-{\rm E}({\bf y})\end{matrix}\right]\right)^{\rm T}{\bf C}^{-1}\left( \left[\begin{matrix}{\bf x}-{\rm E}({\bf x} )\\ {\bf y}-{\rm E}({\bf y})\end{matrix}\right]\right)\right]}{\frac{1}{(2\pi)^{\frac{k}{2}}\det^{\frac{1}{2}}({\bf C}_{xx})}\exp[-\frac{1}{2}({\bf x}-{\rm E}({\bf x}))^{\rm T}{\bf C}_{xx}^{-1}({\bf x}-{\rm E}({\bf x}))]}. \end{aligned} p(yx)=p(x)p(x,y)=(2π)2kdet21(Cxx)1exp[21(xE(x))TCxx1(xE(x))](2π)2k+ldet21(C)1exp[21([xE(x)yE(y)])TC1([xE(x)yE(y)])].
x = [ I 0 0 0 ] [ x y ] . {\bf x}=\left[ \begin{matrix}{\bf I} & {\bf 0}\\{\bf 0}&{\bf 0}\end{matrix}\right]\left[ \begin{matrix}{\bf x}\\{\bf y}\end{matrix}\right]. x=[I000][xy].下面我们来看分块协方差阵。由于
det ⁡ ( [ A 11 A 12 A 21 A 22 ] ) = det ⁡ ( A 11 ) det ⁡ ( A 22 − A 21 A 11 − 1 A 12 ) , \det\left(\left[ \begin{matrix} {\bf A}_{11} & {\bf A}_{12}\\ {\bf A}_{21} & {\bf A}_{22} \end{matrix} \right]\right)=\det({\bf A}_{11})\det({\bf A}_{22}-{\bf A}_{21}{\bf A}_{11} ^{-1}{\bf A}_{12} ) , det([A11A21A12A22])=det(A11)det(A22A21A111A12),可以得到
det ⁡ C = det ⁡ ( C x x ) det ⁡ ( C y y − C y x C x x − 1 C x y ) , \det {\bf C} =\det({\bf C}_{xx})\det({\bf C}_{yy}-{\bf C}_{yx}{\bf C}_{xx} ^{-1}{\bf C}_{xy}), detC=det(Cxx)det(CyyCyxCxx1Cxy),因此,有
det ⁡ C det ⁡ ( C x x ) det ⁡ ( C y y − C y x C x x − 1 C x y ) . \frac{\det {\bf C}}{\det({\bf C}_{xx})}\det({\bf C}_{yy}-{\bf C}_{yx}{\bf C}_{xx} ^{-1}{\bf C}_{xy}). det(Cxx)detCdet(CyyCyxCxx1Cxy).如果令
Q = [ x − E ( x ) y − E ( y ) ] T C − 1 [ x − E ( x ) y − E ( y ) ] − ( x − E ( x ) ) T C x x − 1 ( x − E ( x ) ) , Q=\left[\begin{matrix}{\bf x}-{\rm E}({\bf x} )\\ {\bf y}-{\rm E}({\bf y})\end{matrix}\right]^{\rm T}{\bf C}^{-1} \left[\begin{matrix}{\bf x}-{\rm E}({\bf x} )\\ {\bf y}-{\rm E}({\bf y})\end{matrix}\right]-({\bf x}-{\rm E}({\bf x}))^{\rm T}{\bf C}_{xx}^{-1}({\bf x}-{\rm E}({\bf x})), Q=[xE(x)yE(y)]TC1[xE(x)yE(y)](xE(x))TCxx1(xE(x)),我们可以得到
p ( y ∣ x ) = 1 ( 2 π ) l 2 det ⁡ 1 2 ( C y y − C y x C x x − 1 C x y ) exp ⁡ ( − 1 2 Q ) . \begin{aligned} p({\bf y}|{\bf x})=\frac{1}{{(2\pi)^{\frac{l}{2}}\det^{\frac{1}{2}}({\bf C}_{yy}-{\bf C}_{yx}{\bf C}_{xx} ^{-1}{\bf C}_{xy})}}\exp\left(-\frac{1}{2}Q\right). \end{aligned} p(yx)=(2π)2ldet21(CyyCyxCxx1Cxy)1exp(21Q).下面我们来求 C − 1 {\bf C}^{-1} C1,从而得到 Q Q Q。由于对称分块矩阵的逆矩阵有
[ A 11 A 12 A 21 A 22 ] − 1 = [ ( A 11 − A 12 A 22 − 1 A 21 ) − 1 − A 11 − 1 A 12 ( A 22 − A 21 A 11 − 1 A 12 ) − 1 − ( A 22 − A 21 A 11 − 1 A 12 ) − 1 A 21 A 11 − 1 ( A 22 − A 21 A 11 − 1 A 12 ) − 1 ] . \left[ \begin{matrix} {\bf A}_{11} & {\bf A}_{12}\\ {\bf A}_{21} & {\bf A}_{22} \end{matrix} \right]^{-1}=\left[ \begin{matrix} ({\bf A}_{11}-{\bf A}_{12}{\bf A}_{22}^{-1}{\bf A}_{21})^{-1} & -{\bf A}_{11}^{-1}{\bf A}_{12}({\bf A}_{22}-{\bf A}_{21}{\bf A}_{11}^{-1}{\bf A}_{12})^{-1}\\ -({\bf A}_{22}-{\bf A}_{21}{\bf A}_{11}^{-1}{\bf A}_{12})^{-1}{\bf A}_{21}{\bf A}_{11}^{-1} & ({\bf A}_{22}-{\bf A}_{21}{\bf A}_{11}^{-1}{\bf A}_{12})^{-1} \end{matrix} \right]. [A11A21A12A22]1=[(A11A12A221A21)1(A22A21A111A12)1A21A111A111A12(A22A21A111A12)1(A22A21A111A12)1].采用这种形式,非对角线元素互为转置,因此逆矩阵是对称的。这是由于 C \bf C C为对称的,因此 C − 1 {\bf C}^{-1} C1也是对称的。根据逆矩阵性质,我们有
( A 11 − A 12 A 22 − 1 A 21 ) − 1 = A 11 − 1 + A 11 − 1 A 12 ( A 22 − A 21 A 11 − 1 A 12 ) − 1 A 21 A 11 − 1 , ({\bf A}_{11}-{\bf A}_{12}{\bf A}_{22}^{-1}{\bf A}_{21})^{-1}={\bf A}_{11}^{-1}+{\bf A}_{11}^{-1}{\bf A}_{12}({\bf A}_{22}-{\bf A}_{21}{\bf A}_{11}^{-1}{\bf A}_{12})^{-1}{\bf A}_{21}{\bf A}_{11}^{-1}, (A11A12A221A21)1=A111+A111A12(A22A21A111A12)1A21A111,因此得到
C − 1 = [ C x x − 1 + C x x − 1 C x y B − 1 C y x C x x − 1 C x x − 1 C x y B − 1 − B − 1 C y x C x x − 1 B − 1 ] , {\bf C}^{-1}=\left[ \begin{matrix} {\bf C}_{xx}^{-1}+{\bf C}_{xx}^{-1}{\bf C}_{xy}{\bf B}^{-1}{\bf C}_{yx}{\bf C}_{xx}^{-1} & {\bf C}_{xx}^{-1}{\bf C}_{xy}{\bf B}^{-1}\\ -{\bf B}^{-1} {\bf C}_{yx}{\bf C}_{xx}^{-1} & {\bf B}^{-1}\end{matrix}\right], C1=[Cxx1+Cxx1CxyB1CyxCxx1B1CyxCxx1Cxx1CxyB1B1],其中
B = C y y − C y x C x x − 1 C x y . {\bf B}={\bf C}_{yy}-{\bf C}_{yx}{\bf C}_{xx}^{-1}{\bf C}_{xy}. B=CyyCyxCxx1Cxy.进一步,有
C − 1 = [ I − C x x − 1 C x y 0 I ] [ C x x − 1 0 0 B − 1 ] [ I 0 − C y x C x x − 1 I ] . {\bf C}^{-1}=\left[ \begin{matrix} {\bf I}& -{\bf C}_{xx}^{-1}{\bf C}_{xy} \\ {\bf 0} & {\bf I}\end{matrix}\right] \left[ \begin{matrix} {\bf C}_{xx}^{-1}&{\bf 0} \\ {\bf 0} & {\bf B}^{-1}\end{matrix}\right] \left[ \begin{matrix} {\bf I}& {\bf 0}\\ -{\bf C}_{yx}{\bf C}_{xx}^{-1} & {\bf I}\end{matrix}\right]. C1=[I0Cxx1CxyI][Cxx100B1][ICyxCxx10I].再令 x ~ = x − E ( x ) {\tilde {\bf x}}={\bf x}-{\rm E}({\bf x}) x~=xE(x) y ~ = y − E ( y ) {\tilde {\bf y}}={\bf y}-{\rm E}({\bf y}) y~=yE(y),我们可以得到
Q = [ x ~ y ~ ] T [ I − C x x − 1 C x y 0 I ] [ C x x − 1 0 0 B − 1 ] [ I 0 − C y x C x x − 1 I ] [ x ~ y ~ ] − x ~ T C x x − 1 x ~ = [ x ~ y ~ − C y x C x x − 1 x ~ ] T [ C x x − 1 0 0 B − 1 ] [ x ~ y ~ − C y x C x x − 1 x ~ ] T − x ~ T C x x − 1 x ~ = ( y ~ − C y x C x x − 1 x ~ ) T B − 1 ( y ~ − C y x C x x − 1 x ~ ) \begin{aligned} Q&=\left[ \begin{matrix} {\tilde {\bf x}}\\{\tilde {\bf y}} \end{matrix}\right] ^{\rm T} \left[ \begin{matrix} {\bf I}& -{\bf C}_{xx}^{-1}{\bf C}_{xy} \\ {\bf 0} & {\bf I}\end{matrix}\right] \left[ \begin{matrix} {\bf C}_{xx}^{-1}&{\bf 0} \\ {\bf 0} & {\bf B}^{-1}\end{matrix}\right] \left[ \begin{matrix} {\bf I}& {\bf 0}\\ -{\bf C}_{yx}{\bf C}_{xx}^{-1} & {\bf I}\end{matrix}\right]\left[ \begin{matrix} {\tilde {\bf x}}\\{\tilde {\bf y}} \end{matrix}\right] -{\tilde {\bf x}}^{\rm T}{\bf C}_{xx}^{-1}{\tilde {\bf x}}\\ &=\left[ \begin{matrix} {\tilde {\bf x}}\\ {\tilde {\bf y}-{\bf C}_{yx}{\bf C}_{xx}^{-1}{\tilde {\bf x}}}\end{matrix}\right]^{\rm T} \left[ \begin{matrix} {\bf C}_{xx}^{-1}&{\bf 0} \\ {\bf 0} & {\bf B}^{-1}\end{matrix}\right] \left[ \begin{matrix} {\tilde {\bf x}}\\ {\tilde {\bf y}-{\bf C}_{yx}{\bf C}_{xx}^{-1}{\tilde {\bf x}}}\end{matrix}\right]^{\rm T} -{\tilde {\bf x}}^{\rm T}{\bf C}_{xx}^{-1}{\tilde {\bf x}}\\ &=({\tilde {\bf y}-{\bf C}_{yx}{\bf C}_{xx}^{-1}{\tilde {\bf x}}})^{\rm T}{\bf B}^{-1}{(\tilde {\bf y}}-{\bf C}_{yx}{\bf C}_{xx}^{-1}{\tilde {\bf x}}) \end{aligned} Q=[x~y~]T[I0Cxx1CxyI][Cxx100B1][ICyxCxx10I][x~y~]x~TCxx1x~=[x~y~CyxCxx1x~]T[Cxx100B1][x~y~CyxCxx1x~]Tx~TCxx1x~=(y~CyxCxx1x~)TB1(y~CyxCxx1x~)最终,得到
Q = [ y − ( E ( y ) + C y x C x x − 1 ( x − E ( x ) ) ) ] T [ C y y − C y x C x x − 1 C x y ] − 1 [ y − ( E ( y ) + C y x C x x − 1 ( x − E ( x ) ) ) ] . Q=[{\bf y}-({\rm E}({\bf y})+{\bf C}_{yx}{\bf C}_{xx}^{-1}({\bf x}-{\rm E}({\bf x})))]^{\rm T} [{\bf C}_{yy}-{\bf C}_{yx}{\bf C}_{xx}^{-1}{\bf C}_{xy}]^{-1} [{\bf y}-({\rm E}({\bf y})+{\bf C}_{yx}{\bf C}_{xx}^{-1}({\bf x}-{\rm E}({\bf x})))]. Q=[y(E(y)+CyxCxx1(xE(x)))]T[CyyCyxCxx1Cxy]1[y(E(y)+CyxCxx1(xE(x)))].因此均值和方差分别如(10.24)和(10.25)所示。

这篇关于估计理论(2):多元高斯变量的条件概率密度函数(PDF)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/805820

相关文章

2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题

题库来源:安全生产模拟考试一点通公众号小程序 2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题是由安全生产模拟考试一点通提供,流动式起重机司机证模拟考试题库是根据流动式起重机司机最新版教材,流动式起重机司机大纲整理而成(含2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题参考答案和部分工种参考解析),掌握本资料和学校方法,考试容易。流动式起重机司机考试技

变量与命名

引言         在前两个课时中,我们已经了解了 Python 程序的基本结构,学习了如何正确地使用缩进来组织代码,并且知道了注释的重要性。现在我们将进一步深入到 Python 编程的核心——变量与命名。变量是我们存储数据的主要方式,而合理的命名则有助于提高代码的可读性和可维护性。 变量的概念与使用         在 Python 中,变量是一种用来存储数据值的标识符。创建变量很简单,

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

【机器学习】高斯网络的基本概念和应用领域

引言 高斯网络(Gaussian Network)通常指的是一个概率图模型,其中所有的随机变量(或节点)都遵循高斯分布 文章目录 引言一、高斯网络(Gaussian Network)1.1 高斯过程(Gaussian Process)1.2 高斯混合模型(Gaussian Mixture Model)1.3 应用1.4 总结 二、高斯网络的应用2.1 机器学习2.2 统计学2.3

PDF 软件如何帮助您编辑、转换和保护文件。

如何找到最好的 PDF 编辑器。 无论您是在为您的企业寻找更高效的 PDF 解决方案,还是尝试组织和编辑主文档,PDF 编辑器都可以在一个地方提供您需要的所有工具。市面上有很多 PDF 编辑器 — 在决定哪个最适合您时,请考虑这些因素。 1. 确定您的 PDF 文档软件需求。 不同的 PDF 文档软件程序可以具有不同的功能,因此在决定哪个是最适合您的 PDF 软件之前,请花点时间评估您的

封装MySQL操作时Where条件语句的组织

在对数据库进行封装的过程中,条件语句应该是相对难以处理的,毕竟条件语句太过于多样性。 条件语句大致分为以下几种: 1、单一条件,比如:where id = 1; 2、多个条件,相互间关系统一。比如:where id > 10 and age > 20 and score < 60; 3、多个条件,相互间关系不统一。比如:where (id > 10 OR age > 20) AND sco

JS_变量

二、JS的变量 JS中的变量具有如下特征 1 弱类型变量,可以统一声明成var 2 var声明的变量可以再次声明 3 变量可以使用不同的数据类型多次赋值 4 JS的语句可以以; 结尾,也可以不用;结尾 5 变量标识符严格区分大小写 6 标识符的命名规则参照JAVA 7 如果使用了 一个没有声明的变量,那么运行时会报uncaught ReferenceError: *** is not de