MMSE估计(一):连续随机变量的估计

2024-03-13 18:48

本文主要是介绍MMSE估计(一):连续随机变量的估计,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【本文内容摘自"Signals, Systems and Inferences"之"8.1-Estimation of a Continuous Random Variable", by Alan V.Oppenheim and George C.Verghese, 2010.】

连续随机变量的MMSE估计

首先,我们假定对随机变量 Y Y Y感兴趣想要估计它的值,但我们只知道它的概率密度函数(PDF)。随后,我们把讨论扩展到我们知道另外一个随机变量 X X X的测量或者观察结果,也知道 X X X Y Y Y的联合概率密度函数的情况。

  • 只有 Y Y Y的PDF可知的情况
E { ( Y − y ^ ) 2 } = ∫ ( y − y ^ ) 2 p Y ( y ) d y {\rm E}\left\{ (Y-\hat{y})^2 \right\}=\int(y-\hat{y})^2p_Y(y)dy E{(Yy^)2}=(yy^)2pY(y)dy

将上式对 y ^ \hat y y^求导且令导数等于零,可以得到
− 2 ∫ ( y − y ^ ) p Y ( y ) d y = 0 ( 1 ) -2\int(y-\hat{y})p_Y(y)dy=0 \qquad \qquad (1) 2(yy^)pY(y)dy=0(1)
或者
∫ y ^ p Y ( y ) d y = ∫ y p Y ( y ) d y \int \hat yp_{Y}(y)dy=\int yp_{Y}(y)dy y^pY(y)dy=ypY(y)dy
因此,
y ^ = E { y } . ( 2 ) \hat y={\rm E}\{y\}. \qquad \qquad(2) y^=E{y}.(2)

E { ( Y − y ^ ) 2 } {\rm E}\left\{ (Y-\hat{y})^2 \right\} E{(Yy^)2}关于 y ^ \hat y y^的二次导数为
2 ∫ p Y ( y ) d y = 2 2\int p_{Y}(y)dy=2 2pY(y)dy=2
结果为正,因此(2)给出了最小化MSE时的 y ^ \hat y y^值。显然,(1)中的MMSE就是 Y Y Y的方差,即
min ⁡ E { ( Y − y ^ ) 2 } = E { ( Y − E { Y } ) 2 } = σ Y 2 \min {\rm E}\left\{ (Y-\hat{y})^2 \right\}={\rm E}\left\{ (Y-{\rm E}\{Y\})^2 \right\}=\sigma_Y^2 minE{(Yy^)2}=E{(YE{Y})2}=σY2

  • Y Y Y有关随机变量X的测量值或观察值可知的情况

由于有了关于 X X X的额外的测量,我们用后验概率密度函数 p Y ∣ X ( y ∣ x ) p_{Y|X}(y|x) pYX(yx)代替 p Y ( y ) p_Y(y) pY(y)

因此,我们的目标是最小化(3)式
E [ { Y − y ^ ( x ) } 2 ∣ X = x ] = ∫ { y − y ^ ( x ) } 2 p Y ∣ X ( y ∣ x ) d y ( 3 ) {\rm E}[\{ Y-\hat{y}(x)\}^2|X=x ]=\int\{y-\hat{y}(x)\}^2p_{Y|X}(y|x)dy \qquad \qquad (3) E[{Yy^(x)}2X=x]={yy^(x)}2pYX(yx)dy(3)
这里为我们的估计引入了 y ^ ( x ) \hat y(x) y^(x),从而表明通常来说它将依赖于特定的 x x x值。与无测量的情况时候相同,我们可以得到
y ^ ( x ) = E [ Y ∣ X = x ] \hat y(x)={\rm E}[Y|X=x] y^(x)=E[YX=x]
与之相关的MMSE为条件方差 σ Y ∣ X 2 \sigma_{Y|X}^2 σYX2。因而与无测量时候的唯一区别在于,我们现在将测量值作为条件。
再进一步,如果我们有多个测量值, X 1 = x 1 , X 2 = x 2 , … , X L = x L X_1=x_1, X_2=x_2, \ldots, X_L=x_L X1=x1,X2=x2,,XL=xL,我们采用后验概率密度
P Y ∣ X 1 , X 2 , … , X L ( y ∣ x 1 , x 2 , … , x L ) P_{Y|X_1,X_2,\ldots,X_L}(y| x_1,x_2,\ldots,x_L) PYX1,X2,,XL(yx1,x2,,xL)

【结论】
y ^ ( x ) = ∫ y p Y ∣ X ( y ∣ X = x ) = E [ Y ∣ X = x \hat y(x)=\int yp_{Y|{\bf X} }(y| {\bf X}={\bf x})={\rm E}[Y| {\bf X}={\bf x} y^(x)=ypYX(yX=x)=E[YX=x
其对应的MMSE为条件方差 σ Y ∣ X 2 \sigma_{Y|{\bf X}}^2 σYX2

例:二元高斯随机变量的MMSE估计

两个随机变量 X X X Y Y Y被称为具有二元高斯联合PDF,如果对其归一化之后得到随机变量
V = X − μ x σ X , W = Y − μ Y σ Y V=\frac{X-\mu_x}{\sigma_X},\ W=\frac{Y-\mu_Y}{\sigma_Y} V=σXXμx, W=σYYμY
满足
p V , W ( v , w ) = 1 2 π 1 − ρ 2 exp ⁡ { − v 2 − 2 ρ v w + w 2 2 ( 1 − ρ 2 ) } p_{V,W}(v,w)=\frac{1}{2\pi \sqrt{1-\rho^2}}\exp \{-\frac{v^2-2\rho v w+w^2}{2(1-\rho^2)}\} pV,W(v,w)=2π1ρ2 1exp{2(1ρ2)v22ρvw+w2}
其中 ρ = σ X Y σ X σ Y \rho=\frac{\sigma_{XY}}{\sigma_X\sigma_Y} ρ=σXσYσXY X X X Y Y Y的相关系数,而 C X Y = E [ X Y ] − μ X μ Y C_{XY}={\rm E}[XY]-\mu_X\mu_Y CXY=E[XY]μXμY X X X Y Y Y的协方差。

下面考虑给定 X = x X=x X=x Y Y Y的MMSE估计,即 y ^ ( x ) \hat y(x) y^(x),可以得到
y ^ ( x ) = E [ Y ∣ X = x ] \hat y(x)={\rm E}[Y|X=x] y^(x)=E[YX=x]
或者
y ^ ( x ) = E { ( σ Y W + μ Y ) ∣ V = x − μ X σ X } = σ Y E { W ∣ V = x − μ x σ X } + μ Y . \hat y(x)={\rm E}\left\{(\sigma_YW+\mu_Y)|V=\frac{x-\mu_X}{\sigma_X}\right\}=\sigma_Y{\rm E}\left\{W|V=\frac{x-\mu_x}{\sigma_X} \right\}+\mu_Y . y^(x)=E{(σYW+μY)V=σXxμX}=σYE{WV=σXxμx}+μY.

由于
p W ∣ V ( w ∣ v ) = 1 2 π ( 1 − p 2 ) exp ⁡ { − ( w − ρ v ) 2 2 ( 1 − ρ 2 ) } . p_{W|V}(w|v)=\frac{1}{\sqrt{2\pi(1-p^2)}}\exp\left\{-\frac{(w-\rho v)^2}{2(1-\rho^2)}\right\}. pWV(wv)=2π(1p2) 1exp{2(1ρ2)(wρv)2}.
即均值为 ρ v \rho v ρv,因此
y ^ ( x ) = μ Y + σ Y ρ v = μ Y + ρ σ Y σ X ( x − μ X ) . \hat y(x)=\mu_Y+\sigma_Y \rho v =\mu_Y+\rho\frac{\sigma_Y}{\sigma_X}(x-\mu_X). y^(x)=μY+σYρv=μY+ρσXσY(xμX).

我们来看此时的最小MSE,即
E { [ Y − y ^ ( x ) ] 2 ∣ X = x } {\rm E}\{[Y-\hat y(x)]^2|{\bf X}=x\} E{[Yy^(x)]2X=x}
p Y ∣ X ( y ∣ X = x ) p_{Y|{\bf X}}(y|{\bf X}=x) pYX(yX=x)的方差,又由于 p Y ∣ X ( y ∣ X = x ) = σ Y p W ∣ V ( w ∣ V = v ) p_{Y|{\bf X}}(y|{\bf X}=x)=\sigma_Y p_{W|{\bf V}}(w|{\bf V}=v) pYX(yX=x)=σYpWV(wV=v) p W ∣ V ( w ∣ V = v ) p_{W|{\bf V}}(w|{\bf V}=v) pWV(wV=v)的方差为 1 − ρ 2 1-\rho^2 1ρ2,因此
E { [ Y − y ^ ( x ) ] 2 ∣ X = x } = σ Y 2 ( 1 − ρ 2 ) . {\rm E}\{[Y-\hat y(x)]^2|{\bf X}=x\}=\sigma^2_Y(1-\rho^2). E{[Yy^(x)]2X=x}=σY2(1ρ2).

这篇关于MMSE估计(一):连续随机变量的估计的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/805844

相关文章

poj2406(连续重复子串)

题意:判断串s是不是str^n,求str的最大长度。 解题思路:kmp可解,后缀数组的倍增算法超时。next[i]表示在第i位匹配失败后,自动跳转到next[i],所以1到next[n]这个串 等于 n-next[n]+1到n这个串。 代码如下; #include<iostream>#include<algorithm>#include<stdio.h>#include<math.

XTU 1233 n个硬币连续m个正面个数(dp)

题面: Coins Problem Description: Duoxida buys a bottle of MaiDong from a vending machine and the machine give her n coins back. She places them in a line randomly showing head face or tail face o

数据集 3DPW-开源户外三维人体建模-姿态估计-人体关键点-人体mesh建模 >> DataBall

3DPW 3DPW-开源户外三维人体建模数据集-姿态估计-人体关键点-人体mesh建模 开源户外三维人体数据集 @inproceedings{vonMarcard2018, title = {Recovering Accurate 3D Human Pose in The Wild Using IMUs and a Moving Camera}, author = {von Marc

Leetcode面试经典150题-128.最长连续序列-递归版本另解

之前写过一篇这个题的,但是可能代码比较复杂,这回来个简洁版的,这个是递归版本 可以看看之前的版本,两个版本面试用哪个都保过 解法都在代码里,不懂就留言或者私信 class Solution {/**对于之前的解法,我现在提供一共更优的解,但是这种可能会比较难懂一些(思想方面)代码其实是很简洁的,总体思想如下:不需要排序直接把所有数放入map,map的key是当前数字,value是当前数开始的

数据集 Ubody人体smplx三维建模mesh-姿态估计 >> DataBall

Ubody开源人体三维源数据集-smplx-三维建模-姿态估计 UBody:一个连接全身网格恢复和真实生活场景的上半身数据集,旨在拟合全身网格恢复任务与现实场景之间的差距。 UBody包含来自多人的现实场景的1051k张高质量图像,这些图像拥有2D全身关键点、3D SMPLX模型。 UBody由国际数字经济学院(IDEA)提供。 (UBody was used for mesh r

LCP 485. 最大连续 1 的个数[lleetcode -11]

从今天起,我们的算法开始研究搜索,首先就是DFS深度优先搜索(depth-first seach,DFS)在搜索到一个新的节点时,立即对该新节点进行遍 历;因此遍历需要用先入后出的栈来实现,也可以通过与栈等价的递归来实现。对于树结构而言, 由于总是对新节点调用遍历,因此看起来是向着“深”的方向前进。 下面是一个一维的DFS算法 LCP 485. 最大连续 1 的个数 给定一个二进制数组 nu

百度之星 2015 初赛(1) 1002 找连续数

找连续数      Accepts: 401      Submissions: 1911  Time Limit: 2000/1000 MS (Java/Others)      Memory Limit: 32768/32768 K (Java/Others) Problem Description 小度熊拿到了一个无序的数组,对于这个数组,小度熊想知道是

Denodo 连续 4 年获评 Gartner® 数据集成工具魔力象限™ 领导者

Gartner® 在其 2023 年数据集成工具魔力象限中连续第四年将 Denodo 评为“领导者”。 Gartner 表示:“由于对数据编织架构、数据产品交付以及支持生成式 AI 的集成数据的需求即将到来,数据集成工具市场正在蓬勃发展。数据和分析领导者应该利用这项研究来评估合适的供应商,以满足他们的数据集成需求。” 该魔力象限报告由 Ehtisham Zaidi 等人于 2023 年 1

Qlik数据集成 | Qlik 连续 14 年稳居 2024 Gartner® ABI Magic Quadrant™ 领导者

Qlik 再次当选 2024 年 Gartner® 分析和商业智能平台 Magic Quadrant™ 领导者! 近日,作为引领当今数据集成、数据质量和分析解决方案市场的行业领导者, Qlik 再次当选 2024 年 Gartner® 分析和商业智能平台 Magic Quadrant™ 领导者! 得益于 Qlik 在愿景完备性和执行能力方面的出色表现,这已经是 Qlik 第 14 年位居领导者象

面试题41:和为s的两个数VS和为s的连续正数数列

问题说明: 1.和为s的两个数问题是从一个排序的数组中找出和为s的两个数; 2.原题是找出一个即可,现在全部找出; 3.和为s的连续正数数列是给定一个数找出所有连续正数数列的和为s,例如s为9,(2,3,4)就是其中一组。 (一)和为s的两个数问题 public static int findNumbersWithSum(int[] sorted, int fromIndex, in