估计理论(3):充分统计量的完备性

2024-03-13 18:38

本文主要是介绍估计理论(3):充分统计量的完备性,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

      • 1、CRLB
        • 【定理3.1:标量参数的CRLB】
      • 2、线性模型
        • 【定理4.1:线性模型的最小方差无偏估计】
      • 3、一般最小方差无偏估计
        • 【定理5.2:Rao-Blackwell-Lehmann-Scheffe,RBLS】
        • 3.1 什么是充分统计量?
        • 3.2 如何找到充分统计量?
        • 【定理5.1:Neyman-Fisher因式分解】
        • 3.3 什么是充分统计量的完备性?
      • 4、总结:求解MVU估计的过程

  根据下面两个定理,我们知道如果能够找到CRLB界,或者对于线性模型,都能够很容易找到MVU估计。

1、CRLB

【定理3.1:标量参数的CRLB】

假设概率密度函数满足正则条件
E [ ∂ ln ⁡ p ( x ; θ ) ∂ θ ] = 0 , {\rm E}\left[\frac{\partial \ln p({\bf x};\theta)}{\partial \theta}\right]=0, E[θlnp(x;θ)]=0

例如, x [ n ] = θ + w [ n ] x[n]=\theta+w[n] x[n]=θ+w[n],其中的 N N N个样本 { x [ 1 ] , x [ 2 ] , … x [ N ] } \{x[1],x[2],\ldots x[N]\} {x[1],x[2],x[N]},构成观测数据向量 x \bf x x,因此有概率密度函数为 p ( x ; θ ) p({\bf x};\theta) p(x;θ)。上面式子中对 p ( x ; θ ) p({\bf x};\theta) p(x;θ)求期望。

则任何无偏估计 θ ^ \hat \theta θ^都满足
v a r ( θ ^ ) ≥ 1 − E [ ∂ 2 ln ⁡ p ( x ; θ ) ∂ θ 2 ] . (3.6) \tag{3.6} {\rm var}(\hat \theta)\ge \frac{1}{-{\rm E}\left[\frac{\partial^2\ln p({\bf x};\theta)}{\partial \theta^2} \right]}. var(θ^)E[θ22lnp(x;θ)]1.(3.6)进一步,当且仅当
∂ ln ⁡ p ( x ; θ ) ∂ θ = I ( θ ) [ g ( x ) − θ ] , (3.7) \tag{3.7} \frac{\partial \ln p({\bf x};\theta) }{\partial \theta}=I(\theta)[g({\bf x})-\theta], θlnp(x;θ)=I(θ)[g(x)θ],(3.7)有可能找到在所有 θ \theta θ值上达到(3.6)的界的无偏估计,这里 g ( ⋅ ) g(\cdot) g() I ( ⋅ ) I(\cdot) I()为某个函数。此时,该估计 θ ^ = g ( x ) \hat \theta=g({\bf x}) θ^=g(x)为MVU估计,最小方差为 1 / I ( θ ) 1/I(\theta) 1/I(θ)

显然,如果(3.7)能够成立,则CRLB可达,且能够得到MVU估计。

2、线性模型

【定理4.1:线性模型的最小方差无偏估计】

  如果观察到的数据可以建模为
x = H θ + w , (4.8) \tag{4.8} \bf x=H\bm \theta+w, x=Hθ+w,(4.8)其中 x \bf x x N × 1 N\times 1 N×1维观测向量, H \bf H H为已知 N × p N\times p N×p维观测矩阵(这里 N > p N>p N>p p p p为矩阵的秩), θ \bm \theta θ p × 1 p\times 1 p×1维的待估计参数矩阵, w ∼ N ( 0 , σ 2 I ) \bf w\sim {\mathcal N}(0,\sigma^2I) wN(0,σ2I) N × 1 N\times 1 N×1维的噪声向量,因此可以得到MVU估计为
θ ^ = ( H T H ) − 1 H T x (4.9) \tag{4.9} \hat \bm \theta=({\bf H}^{\rm T}{\bf H})^{-1}{\bf H}^{\rm T}{\bf x} θ^=(HTH)1HTx(4.9) θ ^ \hat \bm \theta θ^的协方差矩阵为
C θ ^ = σ 2 ( H T H ) − 1 . (4.10) \tag{4.10} {\bf C}_{\hat \bm \theta}=\sigma^2({\bf H}^{\rm T}{\bf H})^{-1}. Cθ^=σ2(HTH)1.(4.10)对于线性模型,MVU估计是高效的,因为其达到了CRLB界。

对于线性模型,可以很容易得到其CRLB和MVU估计。

3、一般最小方差无偏估计

  现在我们面对的问题是,如果不存在高效估计(即达到CRLB的估计),那么如何找到MVU估计?当然前提是MVU估计确实存在的情况下。因此引出RBLS定理。

【定理5.2:Rao-Blackwell-Lehmann-Scheffe,RBLS】

  如果 θ ˇ \check \theta θˇ θ \theta θ的无偏估计, T ( x ) T(\bf x) T(x) θ \theta θ的充分统计量,则 θ ^ = E ( θ ˇ ∣ T ( x ) ) \hat \theta={\rm E}(\check \theta|T(\bf x)) θ^=E(θˇT(x))

  1. θ \theta θ的有效估计(与 θ \theta θ独立);
  2. 无偏的;
  3. 其方差小于或等于 θ ˇ \check \theta θˇ,for all θ \theta θ.
    进一步,如果充分统计量是完备的,则 θ ^ \hat \theta θ^为MVU估计。

这个定理是说,如果我们能够得到完备的充分统计量,就可以找到无偏估计。定理中有两个重要的概念,第一个是充分统计量,第二个是完备性,下面我们分别来看看。

3.1 什么是充分统计量?

  考虑我们需要对参数 A A A进行估计,得到的观测数据为 x {\bf x} x,因此有PDF为 p ( x ; A ) , p({\bf x};A), p(x;A),现在假设我们有统计量 T ( x ) T(\bf x) T(x),为了判断它是不是充分统计量,我们就需要得到条件PDF
p ( x ∣ T ( x ) ; A ) p({\bf x}|T({\bf x});A) p(xT(x);A)来表示在观测到统计量 T ( x ) T(\bf x) T(x)之后的条件PDF。显然,如果 T ( x ) T(\bf x) T(x)是充分统计量,则这个条件PDF就应该独立于 A A A,否则的话,就说明还有些有关 A A A的信息没有包含在 T ( x ) T(\bf x) T(x)里面。因此,为了判断统计量是否是充分的,就需要确定这个条件PDF,并且证实其独立于 A A A

所谓充分统计量,就是把待估计参数的所有信息都包含在内。为了证明这一点,就需要证实这个条件PDF与 A A A无关。

3.2 如何找到充分统计量?

  下面的定理可以用来找到充分统计量。

【定理5.1:Neyman-Fisher因式分解】

  如果我们能够把PDF进行如下分解
p ( x ; θ ) = g ( T ( x ) , θ ) h ( x ) , (5.3) \tag{5.3} p({\bf x};\theta)=g(T(\bf x),\theta)h(\bf x), p(x;θ)=g(T(x),θ)h(x),(5.3)其中 g g g为只通过 T ( x ) T(\bf x) T(x)依赖于 x \bf x x的函数, h h h为只依赖于 x \bf x x的函数,则 T ( x ) T(\bf x) T(x) θ \theta θ的充分统计量。反之,如果 T ( x ) T(\bf x) T(x)为充分统计量,则PDF可以分解为(5.3)。

3.3 什么是充分统计量的完备性?

  具体来说,如果充分统计量 T ( x ) T(\bf x) T(x)只有唯一的一个函数是无偏的,我们就说 T ( x ) T(\bf x) T(x)是完备的。在【定理5.2】中,则 θ ^ = E ( θ ˇ ∣ T ( x ) ) \hat \theta={\rm E}(\check \theta|T(\bf x)) θ^=E(θˇT(x)) θ \theta θ的MVU估计。

在这里插入图片描述

  Fig.5.2中,实线内部区域表示所有无偏估计的集合。通过确定 E ( θ ˇ ∣ T ( x ) ) {\rm E}(\check \theta|T(\bf x)) E(θˇT(x)),我们可以减小估计方差(定理5.2的性质3),并且仍然保持在集合内(性质2)。但是, E ( θ ˇ ∣ T ( x ) ) {\rm E}(\check \theta|T(\bf x)) E(θˇT(x))仅为充分统计量 T ( x ) T(\bf x) T(x)的一个函数,这是因为
θ ^ = E ( θ ˇ ∣ T ( x ) ) = ∫ θ ˇ p ( θ ˇ ∣ T ( x ) ) d θ ˇ = g ( T ( x ) ) . \hat \theta={\rm E}(\check \theta|T({\bf x}))=\int \check \theta p(\check \theta|T({\bf x}))d\check \theta=g(T({\bf x})). θ^=E(θˇT(x))=θˇp(θˇT(x))dθˇ=g(T(x)).
  如果 T ( x ) T(\bf x) T(x)为完备的,意味着只有 T ( x ) T(\bf x) T(x)的一个函数是无偏的。因此 θ ^ \hat \theta θ^是唯一的,独立于我们从图5.2的集合中选择的 θ ˇ \check \theta θˇ。所有的 θ ˇ \check \theta θˇ都映射到相同的 θ ^ \hat \theta θ^。由于 θ ^ \hat \theta θ^的方差必须小于集合中所有 θ ˇ \check \theta θˇ的方差(性质3),因此 θ ^ \hat \theta θ^一定是MVU估计。

因此,如果 T ( x ) T(\bf x) T(x)为完备的,只要能够找到它的函数得到无偏估计(一定也是唯一的一个),就是它的MVU估计。

4、总结:求解MVU估计的过程

过程如下:

  1. 基于Neyman-Fisher因式分解定理,找到 θ \theta θ的充分统计量 T ( x ) T({\bf x}) T(x)
  2. 确定 T ( x ) T({\bf x}) T(x)是否为完备的,如果是,则继续;否则,停止。

我们用下面条件验证充分统计量 T T T完备。
如果
∫ − ∞ ∞ v ( T ) p ( T ; θ ) d T = 0 f o r a l l θ (5.8) \tag{5.8} \int_{-\infty}^{\infty}v(T)p(T;\theta)dT=0\ {\rm for \ all}\ \theta v(T)p(T;θ)dT=0 for all θ(5.8)只在 v ( T ) = 0 v(T)=0 v(T)=0的时候成立,则 T T T为完备的。

3.找到函数 g g g,使得 θ ^ = g ( T ( x ) ) \hat \theta=g(T({\bf x})) θ^=g(T(x))为无偏的,则 θ ^ \hat \theta θ^为MVU估计。
3’ θ ^ = E ( θ ˇ ∣ T ( x ) ) \hat \theta={\rm E}(\check \theta|T({\bf x})) θ^=E(θˇT(x)),这里 θ ˇ \check \theta θˇ为无偏估计。

由于确定条件PDF太繁琐,所以3’不常用。

这篇关于估计理论(3):充分统计量的完备性的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/805821

相关文章

opencv实现像素统计的示例代码

《opencv实现像素统计的示例代码》本文介绍了OpenCV中统计图像像素信息的常用方法和函数,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 统计像素值的基本信息2. 统计像素值的直方图3. 统计像素值的总和4. 统计非零像素的数量

如何使用 Bash 脚本中的time命令来统计命令执行时间(中英双语)

《如何使用Bash脚本中的time命令来统计命令执行时间(中英双语)》本文介绍了如何在Bash脚本中使用`time`命令来测量命令执行时间,包括`real`、`user`和`sys`三个时间指标,... 使用 Bash 脚本中的 time 命令来统计命令执行时间在日常的开发和运维过程中,性能监控和优化是不

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题

题库来源:安全生产模拟考试一点通公众号小程序 2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题是由安全生产模拟考试一点通提供,流动式起重机司机证模拟考试题库是根据流动式起重机司机最新版教材,流动式起重机司机大纲整理而成(含2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题参考答案和部分工种参考解析),掌握本资料和学校方法,考试容易。流动式起重机司机考试技

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

flume系列之:查看flume系统日志、查看统计flume日志类型、查看flume日志

遍历指定目录下多个文件查找指定内容 服务器系统日志会记录flume相关日志 cat /var/log/messages |grep -i oom 查找系统日志中关于flume的指定日志 import osdef search_string_in_files(directory, search_string):count = 0

hdu4267区间统计

题意:给一些数,有两种操作,一种是在[a,b] 区间内,对(i - a)% k == 0 的加value,另一种操作是询问某个位置的值。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import

hdu4417区间统计

给你一个数列{An},然后有m次查询,每次查询一段区间 [l,r] <= h 的值的个数。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamRead

hdu3333区间统计

题目大意:求一个区间内不重复数字的和,例如1 1 1 3,区间[1,4]的和为4。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;

实例:如何统计当前主机的连接状态和连接数

统计当前主机的连接状态和连接数 在 Linux 中,可使用 ss 命令来查看主机的网络连接状态。以下是统计当前主机连接状态和连接主机数量的具体操作。 1. 统计当前主机的连接状态 使用 ss 命令结合 grep、cut、sort 和 uniq 命令来统计当前主机的 TCP 连接状态。 ss -nta | grep -v '^State' | cut -d " " -f 1 | sort |