杂记——极大似然估计的渐近正态性

2024-04-24 20:08

本文主要是介绍杂记——极大似然估计的渐近正态性,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

结论

  假设 x 1 , ⋯ , x n x_1, \cdots, x_n x1,,xn是来自 f θ ( x ) f_{\theta}(x) fθ(x)的独立同分布样本, θ ^ M L E \hat{\theta}_{MLE} θ^MLE是参数 θ \theta θ的极大似然估计,那么 θ ^ M L E ∼ ˙ N ( θ , 1 n I ( θ ) ) (1) \hat{\theta}_{MLE}\dot{\sim}N(\theta, \frac{1}{nI(\theta)})\tag{1} θ^MLE˙N(θ,nI(θ)1)(1)其中, I ( θ ) I(\theta) I(θ) F i s h e r Fisher Fisher信息量。

证明

  首先来看单样本的情况,即有样本 x x x来自 f θ ( x ) f_{\theta}(x) fθ(x),则其似然函数为 l x ( θ ) = l o g ( f θ ( x ) ) (2) l_x(\theta)=log (f_{\theta}(x))\tag{2} lx(θ)=log(fθ(x))(2) θ \theta θ求导有 l ˙ x ( θ ) = ∂ ∂ θ l o g ( f θ ( x ) ) = f ˙ θ ( x ) f θ ( x ) (3) \dot{l}_x(\theta)=\frac{\partial }{\partial \theta}log(f_{\theta}(x))=\frac{\dot{f}_\theta(x)}{f_\theta(x)}\tag{3} l˙x(θ)=θlog(fθ(x))=fθ(x)f˙θ(x)(3) l ˙ x ( θ ) \dot{l}_x(\theta) l˙x(θ)被称作得分函数,它的期望为: E ( l ˙ x ( θ ) ) = ∫ χ f ˙ θ ( x ) f θ ( x ) f θ ( x ) d x = ∫ χ f ˙ θ ( x ) d x = ∫ χ ∂ ∂ x f θ ( x ) d x = ∂ ∂ x ∫ χ f θ ( x ) d x = ∂ ∂ x 1 = 0 (4) E(\dot{l}_x(\theta))=\int_{\chi}\frac{\dot{f}_\theta(x)}{f_\theta(x)}f_\theta(x)dx=\int_{\chi}\dot{f}_\theta(x)dx=\int_{\chi}\frac{\partial }{\partial x}f_\theta(x)dx=\frac{\partial }{\partial x}\int_{\chi}f_\theta(x)dx=\frac{\partial }{\partial x}1=0\tag{4} E(l˙x(θ))=χfθ(x)f˙θ(x)fθ(x)dx=χf˙θ(x)dx=χxfθ(x)dx=xχfθ(x)dx=x1=0(4)
I ( θ ) I(\theta) I(θ) F i s h e r Fisher Fisher信息量,被定义为得分函数 l ˙ x ( θ ) \dot{l}_x(\theta) l˙x(θ)的方差:
I ( θ ) = E { l ˙ x ( θ ) − E ( l ˙ x ( θ ) ) } 2 (5) I(\theta)=E\{\dot{l}_x(\theta)-E(\dot{l}_x(\theta))\}^2\tag{5} I(θ)=E{l˙x(θ)E(l˙x(θ))}2(5)
而由 E ( l ˙ x ( θ ) ) = 0 E(\dot{l}_x(\theta))=0 E(l˙x(θ))=0可知:
I ( θ ) = E { l ˙ x ( θ ) } 2 = E { f ˙ θ ( x ) f θ ( x ) } 2 (6) I(\theta)=E\{\dot{l}_x(\theta)\}^2=E\{\frac{\dot{f}_{\theta}(x)}{{f}_{\theta}(x)}\}^2\tag{6} I(θ)=E{l˙x(θ)}2=E{fθ(x)f˙θ(x)}2(6)
因此可记 l ˙ x ( θ ) \dot{l}_x(\theta) l˙x(θ)为: l ˙ x ( θ ) ∼ ( 0 , I ( θ ) ) (7) \dot{l}_x(\theta)\sim(0, I(\theta))\tag{7} l˙x(θ)(0,I(θ))(7)
接下来考虑得分函数的二阶导数 l ¨ x ( θ ) \ddot{l}_x(\theta) l¨x(θ),即对式子 ( 3 ) (3) (3)等号两边同时对 θ \theta θ求导:
l ¨ x ( θ ) = ∂ ∂ θ ( f ˙ θ ( x ) f θ ( x ) ) = f ¨ θ ( x ) f θ ( x ) − ( f ˙ θ ( x ) f θ ( x ) ) 2 (8) \ddot{l}_x(\theta)=\frac{\partial}{\partial \theta}(\frac{\dot{f}_\theta(x)}{f_\theta(x)})=\frac{\ddot{f}_{\theta}(x)}{{f}_{\theta}(x)}-(\frac{\dot{f}_{\theta}(x)}{{f}_{\theta}(x)})^2\tag{8} l¨x(θ)=θ(fθ(x)f˙θ(x))=fθ(x)f¨θ(x)(fθ(x)f˙θ(x))2(8)
因此得分函数的二阶导数 l ¨ x ( θ ) \ddot{l}_x(\theta) l¨x(θ)的期望为: E { l ¨ x ( θ ) } = 0 − E { f ˙ θ ( x ) f θ ( x ) } 2 = − I ( θ ) (9) E\{\ddot{l}_x(\theta)\}=0-E\{\frac{\dot{f}_{\theta}(x)}{{f}_{\theta}(x)}\}^2=-I(\theta)\tag{9} E{l¨x(θ)}=0E{fθ(x)f˙θ(x)}2=I(θ)(9)
同样可记 l ¨ x ( θ ) \ddot{l}_x(\theta) l¨x(θ)为: − l ¨ x ( θ ) ∼ ( I ( θ ) , J ( θ ) ) (10) -\ddot{l}_x(\theta)\sim(I(\theta), J(\theta))\tag{10} l¨x(θ)(I(θ),J(θ))(10)
其中, J ( θ ) J(\theta) J(θ) l ¨ x ( θ ) \ddot{l}_x(\theta) l¨x(θ)的方差,我们这里不进行考虑。

  接下来讨论 n n n个样本的情况,即 x 1 , ⋯ , x n x_1, \cdots, x_n x1,,xn是来自 f θ ( x ) f_{\theta}(x) fθ(x)的独立同分布样本,那么此时的联合密度函数为: f θ ( X ) = ∏ i = 1 n f θ ( x i ) f_{\theta}(X)=\prod\limits_{i=1}^nf_{\theta}(x_i) fθ(X)=i=1nfθ(xi),同样的,总的得分函数为: l ˙ X ( θ ) = ∑ i = 1 n l ˙ x i ( θ ) (11) \dot{l}_X({\theta})=\sum\limits_{i=1}^n\dot{l}_{x_i}(\theta)\tag{11} l˙X(θ)=i=1nl˙xi(θ)(11)
根据 ( 7 ) (7) (7),每个 l ˙ x i ( θ ) ∼ ( 0 , I ( θ ) ) \dot{l}_{x_i}(\theta)\sim(0, I(\theta)) l˙xi(θ)(0,I(θ)),结合样本之间是独立的,可知: l ˙ X ( θ ) ∼ ( 0 , n I ( θ ) ) (12) \dot{l}_X({\theta})\sim(0, nI(\theta))\tag{12} l˙X(θ)(0,nI(θ))(12)
类似的,有: − l ¨ X ( θ ) = ∑ i = 1 n ( − l ¨ x i ( θ ) ) (13) -\ddot{l}_X({\theta})=\sum\limits_{i=1}^n(-\ddot{l}_{x_i}(\theta))\tag{13} l¨X(θ)=i=1n(l¨xi(θ))(13)
同样的,根据 ( 10 ) (10) (10),每个 − l ¨ x i ( θ ) ∼ ( I ( θ ) , J ( θ ) ) -\ddot{l}_{x_i}(\theta)\sim(I(\theta), J(\theta)) l¨xi(θ)(I(θ),J(θ)),因此有: − l ¨ X ( θ ) ∼ ( n I ( θ ) , n J ( θ ) ) (14) -\ddot{l}_X({\theta})\sim(nI(\theta), nJ(\theta))\tag{14} l¨X(θ)(nI(θ),nJ(θ))(14)
根据定义,基于样本 x 1 , ⋯ , x n x_1, \cdots, x_n x1,,xn,参数 θ \theta θ的极大似然估计 θ ^ M L E \hat{\theta}_{MLE} θ^MLE满足最大化条件 l ˙ X ( θ ^ ) = 0 \dot{l}_X{(\hat{\theta})}=0 l˙X(θ^)=0,对其在 θ \theta θ处一阶泰勒展开有: 0 = l ˙ X ( θ ^ ) ≈ l ˙ X ( θ ) + l ¨ X ( θ ) ( θ ^ − θ ) (15) 0=\dot{l}_X{(\hat{\theta})}\approx\dot{l}_X{(\theta)}+\ddot{l}_X{(\theta)}(\hat{\theta}-\theta)\tag{15} 0=l˙X(θ^)l˙X(θ)+l¨X(θ)(θ^θ)(15)
对其变形,有: θ ^ ≈ θ − l ˙ X ( θ ) l ¨ X ( θ ) = θ + l ˙ X ( θ ) n − l ¨ X ( θ ) n (16) \hat{\theta}\approx\theta-\frac{\dot{l}_X(\theta)}{\ddot{l}_X(\theta)}=\theta+\frac{\frac{\dot{l}_X(\theta)}{n}}{-\frac{\ddot{l}_X(\theta)}{n}}\tag{16} θ^θl¨X(θ)l˙X(θ)=θ+nl¨X(θ)nl˙X(θ)(16)
( 12 ) (12) (12)和中心极限定理表明: l ˙ X ( θ ) n ∼ ˙ N ( 0 , I ( θ ) n ) (17) \frac{\dot{l}_X(\theta)}{n}\dot{\sim} N(0, \frac{I(\theta)}{n})\tag{17} nl˙X(θ)˙N(0,nI(θ))(17)
( 14 ) (14) (14)和大数定律表明: − l ¨ X ( θ ) n 趋 于 常 量 I ( θ ) (18) -\frac{\ddot{l}_X(\theta)}{n}趋于常量I(\theta)\tag{18} nl¨X(θ)I(θ)(18)
综合式 ( 16 ) , ( 17 ) , ( 18 ) (16), (17), (18) (16),(17),(18),即可得到 θ ^ ∼ ˙ N ( θ , 1 n I ( θ ) ) (19) \hat{\theta}\dot{\sim}N(\theta, \frac{1}{nI(\theta)})\tag{19} θ^˙N(θ,nI(θ)1)(19)此即 ( 1 ) (1) (1)式,证毕。

这篇关于杂记——极大似然估计的渐近正态性的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/932719

相关文章

【杂记-浅谈DHCP动态主机配置协议】

DHCP动态主机配置协议 一、DHCP概述1、定义2、作用3、报文类型 二、DHCP的工作原理三、DHCP服务器的配置和管理 一、DHCP概述 1、定义 DHCP,Dynamic Host Configuration Protocol,动态主机配置协议,是一种网络协议,主要用于在IP网络中自动分配和管理IP地址以及其他网络配置参数。 2、作用 DHCP允许计算机和其他设备通

【论文精读】分类扩散模型:重振密度比估计(Revitalizing Density Ratio Estimation)

文章目录 一、文章概览(一)问题的提出(二)文章工作 二、理论背景(一)密度比估计DRE(二)去噪扩散模型 三、方法(一)推导分类和去噪之间的关系(二)组合训练方法(三)一步精确的似然计算 四、实验(一)使用两种损失对于实现最佳分类器的重要性(二)去噪结果、图像质量和负对数似然 论文:Classification Diffusion Models: Revitalizing

基于协方差信息的Massive MIMO信道估计算法性能研究

1. 引言 随着移动互联网不断发展,人们对通信的速率和可靠性的要求越来越高[1]。目前第四代移动通信系统已经逐渐商用,研究人员开始着手研究下一代移动通信系统相关技术[2][3]。在下一代移动通信系统中要求下行速率达到10Gbps,这就要求我们使用更先进的技术和更宽的系统带宽。MIMO技术由于可以在不增加系统带宽和功率的前提下,成倍的提升系统容量和可靠性,已经广泛应用于各种无线通信系统中,但仅采用

基于CDMA的多用户水下无线光通信(2)——系统模型和基于子空间的延时估计

本文首先介绍了基于CDMA的多用户UOWC系统模型,并给出了多用户收发信号的数学模型。然后介绍基于子空间的延时估计算法,该算法只需要已知所有用户的扩频码,然后根据扩频波形的循环移位在观测空间的信号子空间上的投影进行延时估计。 1、基于CDMA的多用户UOWC系统模型   首先介绍基于CDMA的多用户UOWC系统模型,系统框图如下图所示。   该系统包括发送端、UOWC信道和接收端。该系统

【C++PCL】点云处理稳健姿态估计配准

作者:迅卓科技 简介:本人从事过多项点云项目,并且负责的项目均已得到好评! 公众号:迅卓科技,一个可以让您可以学习点云的好地方 重点:每个模块都有参数如何调试的讲解,即调试某个参数对结果的影响是什么,大家有问题可以评论哈,如果文章有错误的地方,欢迎来指出错误的地方。 目录         1.原理介绍         2.代码效果         3.源码展示         4.

Depth Anything V2:抖音开源高性能任何单目图像深度估计V2版本,并开放具有精确注释和多样化场景的多功能评估基准

📜文献卡 题目: Depth Anything V2作者: Lihe Yang; Bingyi Kang; Zilong Huang; Zhen Zhao; Xiaogang Xu; Jiashi Feng; Hengshuang ZhaoDOI: 10.48550/arXiv.2406.09414摘要: This work presents Depth Anything V2. With

【Linux 杂记】TOP命令

top命令用于动态显示系统中正在运行的进程的详细信息,以及系统的整体资源使用情况。以下是其主要输出解释: Header 表头信息: top:当前时间和运行时间。Tasks:进程统计信息,如总进程数、运行中、睡眠中等。CPU(s):CPU使用情况,包括总体利用率和每个CPU核心的使用率。Mem:内存使用情况,包括总内存、已使用、空闲、缓存等。Swap:交换空间使用情况,类似free命令的输出。

【杂记-浅谈多播地址】

多播地址 一、多播地址概述二、多播地址的结构三、多播地址的使用四、多播技术的优势与挑战 一、多播地址概述 多播地址是一种特殊的IP地址,用于网络中的一对多通信。在IP网络中,多播技术允许多个发送者发送单一数据包到多个接收者,而不需要分别发送每个数据包,这样可以显著提高网络带宽的利用率。多播地址通常用于诸如在线视频会议、直播视频流等应用场景,在这些场景下,数据包的目标地址不是单一的

【杂记-浅谈PPP协议】

PPP协议 一、PPP协议概述二、PPP协议组成三、PPP协议的特点、优势、缺点四、PPP协议的应用场景 一、PPP协议概述 PPP,Point-to-Point Protocol,即点到点协议,是一种数据链路层协议,主要用于在两点间的串行连接上传输数据。它不仅支持异步和同步传输,还能封装多种网络层协议,如IP、IPX等,这使得PPP成为一个通用的数据链路层协议。 二、PPP协

SAR动目标检测系列:【4】动目标二维速度估计

在三大类杂波抑制技术(ATI、DPCA和STAP)中,STAP技术利用杂波与动目标在二维空时谱的差异,以信噪比最优为准则,对地杂波抑制的同时有效保留动目标后向散射能量,有效提高运动目标的检测概率和动目标信号输出信杂比,提供理想的动目标检测效果。在检测出动目标之后,接下来的任务是对剩余杂波和噪声中的动目标精确地估计参数。动目标精确参数估计一般是在方位信号中完成的,对图