漫步数理统计三十——依概率收敛

2024-05-08 15:48

本文主要是介绍漫步数理统计三十——依概率收敛,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本篇博文我们将正式地陈述一系列随机变量靠近某个随机变量。

1 {Xn} 是一系列随机变量, X 是定义在样本空间上的随机变量。我们说Xn依概率收敛到 X ,如果对于ϵ>0

limnP[|XnX|ϵ]=0

或者等价的

limnP[|XnX|<ϵ]=1

如果成立,我们一般写成

XnPX

如果 XnPX ,我们常说 XnX 的差收敛到0。极限随机变量 X 经常是一个常数;例如X是一个退化的随机变量。

说明依概率收敛的一种方法是用切比雪夫定理,具体会在下面的证明中给出,为了强调我们是一系列随机变量,我们在随机变量上给出下标,像 X¯ 写成 X¯n

1 (弱大数定理) {Xn} 是一系列独立同分布的随机变量,均值为 μ ,方差为 σ2< X¯n=n1ni=1Xi ,那么

X¯nPμ

回忆一下 X¯n 的均值与方差分别为 μ,σ2/n ,因此根据切比雪夫定理,对于任意的 ϵ>0

P[|X¯μ|ϵ]=P[|X¯μ|](ϵn/σ)(σ/n)σ2nϵ20

||

这个定理说明,当 n 取向时, X¯ 分布的所有质量收敛到 μ 。也就时候对于大的 n X¯接近 μ ,但是多接近呢?例如如果我们用 X¯n 估计 μ ,那么估计误差是多少?这个问题留到下篇博文讲解。

还有一个强大数定理,它弱化了定理1的假设:随机变量 Xi 独立且都有有限的均值 μ ,因此强大数定理是一阶矩定理,而弱大数定理需要二阶矩存在。

还有些关于依概率收敛的定理,我们在后面会用到,首先是两个关于依概率收敛对线性封闭的定理。

2 假设 XnPX,YnPY ,那么 Xn+YnPX+Y

ϵ>0 已给定,利用三角不等式可得

|XnX|+|YnY||(Xn+Yn)(X+Y)|ϵ

因为 P 是单调的,所以我们有

P[(Xn+Yn)(X+Y)ϵ]P[|XnX|+|YnY|ϵ]P[|XnX|ϵ/2]+P[|YnY|ϵ/2]

根据定理的假设,后两项收敛到0,从而得证。 ||

3 假设 XnPX a 是一个常数,那么aXnPaX

如果 a=0 ,结论明显成立。假设 a0 ,令 ϵ>0 ,那么

P[|aXnaX|ϵ]=P[|a||XnX|ϵ]=P[|XnX|ϵ/|a|]

根据假设最后一项趋于0。 ||

4 假设 XnPa 且函数 g a点连续,那么 g(Xn)Pg(a)

ϵ>0 ,那么因为 g a点连续,所以存在 δ>0 使得如果 |xa|<δ,|g(x)g(a)|<ϵ ,所以

|g(x)g(a)|ϵ|xa|δ

代入 Xn 可得

P[|g(Xn)g(a)|ϵ]P[|Xna|δ]

根据假设,最后一项在 n 时趋于0,得证。 ||

这个定理给出了许多有用的结论。例如,如果 XnPa ,那么

X2n1/XnXnPa2P1/a,a0Pa,a0

实际上,如果 XnPX g 是连续函数,那么g(Xn)Pg(X),下面的定理就用了这个结论。

5 假设 XnPX,YnPY ,那么 XnYnPXY

利用上面的结论,我们有

XnYn=12X2n+12Y2n12(XnYn)2P12X2+12Y212(XY)2=XY

现在回到采样与统计的讨论,考虑这么一种情况,随机变量 X 的分布有未知参数θΩ,我们要基于样本找到一个统计量来估计 θ ,上篇博文我们介绍了无偏性,现在介绍一致性:
2 X 是cdf为F(x,θ),θΩ的随机变量, X1,,Xn X 分布的样本且Tn表示一个统计量。我们说 Tn θ 的一致估计,如果

TnPθ

如果 X1,,Xn 是有限均值 μ 和方差 σ2 分布的随机样本,那么根据弱大数定理,样本均值 X¯ μ 的一致估计。

1 X1,,Xn 表示均值为 μ 方差为 σ2 分布的随机样本,定理1说明 X¯Pμ 。为了说明样本均值依概率收敛到 σ2 ,假设 E[X41]< ,这样的话 var(S2)< 。根据前面的结论可得:

S2n=1n1i=1n(XiX¯n)2=nn1(1ni=1nX2iX¯2n)P1[E(X21)μ2]=σ2

因此样本方差是 σ2 的一致估计。

不像上面的例子,有时候我们可以用分布函数得出收敛,如下例所示:

2 X1,,Xn 是均匀分布 (0,θ) 的随机样本, Yn=max{X1,,Xn} ,从 Yn 的cdf中很容易看出 YnPθ 且样本最大值是 θ 的一致估计。注意无偏估计 ((n+1)/n)Yn 也是一致的。

接下里扩展下例2,根据定理1可得 X¯n θ/2 的一致估计,所以 2X¯n θ 的一致估计,注意 Yn,2X¯n 依概率收敛到 θ 的区别。对 Yn 而言我们用的是 Yn 的cdf,但对 2X¯n 而言,我们用的是弱大数定理。事实上 2X¯n 的cdf非常复杂。在许多情况下,统计量的cdf无法得到但是我们可以用近似理论来建立结论。其实还有许多其他 θ 的估计量,那么哪个是最好的呢?后面的文章会继续介绍。

一致性是估计量非常重要的性质,当样本数量增大时差的估计量不可能靠近目标。注意这对无偏性是不成立的。例如我们不用样本方差来估计 σ2 ,假设用 V=n1ni=1(XiX¯)2 ,那么 V σ2的一致估计,但是是有偏的,因为 E(V)=(n1)σ2/n ,所以 V 的偏置为σ2/n,当 n 时该项消失。

这篇关于漫步数理统计三十——依概率收敛的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/970747

相关文章

hdu4865(概率DP)

题意:已知前一天和今天的天气概率,某天的天气概率和叶子的潮湿程度的概率,n天叶子的湿度,求n天最有可能的天气情况。 思路:概率DP,dp[i][j]表示第i天天气为j的概率,状态转移如下:dp[i][j] = max(dp[i][j, dp[i-1][k]*table2[k][j]*table1[j][col] )  代码如下: #include <stdio.h>#include

概率DP (由一道绿题引起的若干问题。目前为一些老题,蒟蒻的尝试学习1.0)

概率DP: 利用动态规划去解决 概率 期望 的题目。 概率DP 求概率(采用顺推) 从 初始状态推向结果,同一般的DP类似,只是经历了概率论知识的包装。 老题: 添加链接描述 题意: 袋子里有w只白鼠,b只黑鼠,A和B轮流从袋子里抓,谁先抓到白色谁就赢。A每次随机抓一只,B每次随机 抓完一只后 会有另外一只随机老鼠跑出来。如果两个人都没有抓到白色,那么B赢。A先抓,问A赢得概率。 w b 均在

2024国赛论文拿奖快对照这几点及评阅要点,勿踩雷区!(国赛最后冲刺,提高获奖概率)

↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑ 2024“高教社杯”全国大学生数学建模竞赛已过去第三个夜晚,小伙伴们都累了没有,如果感到思维滞涩,别忘了稍作休息,放松一下自己,准备迎接国赛非常重要的收尾阶段——论文。 国赛这几天的努力最后都

HDU 1428 漫步校园 (搜索 + dp)

OJ题目:click here ~~ 题意分析:题目中有句话“他考虑从A区域到B区域仅当存在一条从B到机房的路线比任何一条从A到机房的路线更近(否则可能永远都到不了机房了…)。”,关键是对这句话的理解。此刻在A区域,选择下面要走的B区域的条件是,存在一条B区域到机房的路线比A区域到机房的所有路线都近,也就是说,存在一条B区域到机房的路线比A区域到机房的最短路线更近(比最短的近

HDU 4035 Maze (树状dp + 概率)

OJ题目 : click here ~~~ 题目分析 :这篇文章已经说的很好很好了 , 直接借用 ,猛戳~~ int n;double k[10002] , e[10002];double A[10002] , B[10002] , C[10002];vector<int> List[10002];bool dfs(int u , int father){if(List[u].s

概率论与数理统计(1)

第一节博客已经整理了求导的公式,一些常用的概念。链接如下:高等数学基础(1)-CSDN博客。         第二节博客整理了微积分的公式及其相关概念。链接如下:高等数学基础(2)——微积分-CSDN博客         第三节博客则整理了泰勒公式和拉格朗日公式的相关概念。链接如下:高等数学基础(3)——泰勒公式与拉格朗日-CSDN博客         第四节博客则整理了行

前端自查【知识点】(高概率)2024最新版

HTML 如何理解 HTML 语义化 ? 仅通过标签便能判断内容的类型,特别是区分标题、段落、图片和表格 增加代码可读性(让人更容易读懂)对SEO更加友好 (让搜索引擎更容易读懂) HTML有哪些内联元素和块状元素 ? 内联元素 宽度由内容决定 display :inline 若非替换元素,不能设置宽高 img,span , a 等 display :inline-bl

(176)时序收敛--->(26)时序收敛二六

1 目录 (a)FPGA简介 (b)Verilog简介 (c)时钟简介 (d)时序收敛二六 (e)结束 1 FPGA简介 (a)FPGA(Field Programmable Gate Array)是在PAL (可编程阵列逻辑)、GAL(通用阵列逻辑)等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了

(175)时序收敛--->(25)时序收敛二五

1 目录 (a)FPGA简介 (b)Verilog简介 (c)时钟简介 (d)时序收敛二五 (e)结束 1 FPGA简介 (a)FPGA(Field Programmable Gate Array)是在PAL (可编程阵列逻辑)、GAL(通用阵列逻辑)等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了

【校招面经】统计与概率基础 part2

十六、对偶问题 线性规划有一个有趣的特性,就是任何一个求极大的问题都有一个与其匹配的求极小的线性规划问题。 例;原问题为 MAX X=8*Z1+10*Z2+2*Z3 s.t. 2*Z1+1*Z2+3*Z3 〈=70 4*Z1+2*Z2+2*Z3 〈=80 3*Z1+ 1*Z3 〈=15 2*Z1+2*Z2 〈=50 Z1,Z2,Z3 〉=0 Z则其对偶问题为 MIN =70*Y