统计是一门艺术(点估计)

2024-06-24 08:12
文章标签 点估计 一门 艺术 统计

本文主要是介绍统计是一门艺术(点估计),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1 点估计

1.1 点估计理解(point estimate)

总体\sim f(x,\theta_{1},...,\theta_{k}),样本X=(X_{1},...,X_{n}),\theta=(\theta_{1},...,\theta_{k})属于参数空间

一般\theta未知,要由样本对\theta作一个估计,或对g(\theta )作一个估计,这种估计称为点估计

通常用\hat{g}(X)记为g(\theta )的一个点估计。

1.2 点估计的方法

(1)矩估计:

就是用样本矩来代替总体矩,当然有好有坏

X=(X_{1},...,X_{n})为总体的一个简单随机样本,k\in N

分别称a_{nk} = \frac{1}{n}\sum_{i=1}^{n}X_{i}^{k}m_{nk} = \frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{k}

为k阶样本原点矩和k阶样本中心矩.

\alpha_{k} = EX^{k},\mu_{k} = E(X-\alpha_{1})^{k}

为什么能用矩估计?原理?

根据大数定理,当n\rightarrow\inftyn\geq 30)时,

a_{nk}\overset{P}{\rightarrow}\alpha_{k}m_{nk}\overset{P}{\rightarrow}\mu_{k},所以当样本数据量到达一定数目时,就可以用样本的矩来估计总体的矩,从而估计一系列矩的函数。

定义:在应用中用样本矩来代替总体矩,得到的估计称为矩估计,

前提:未知参数可以使用总体矩来表示

核心:样本矩来代替总体矩

区别:不同的样本矩表达的效果不同

g(\theta ) = G(\alpha_{1},...,\alpha_{k},\mu_{1},...,\mu_{l}),则\hat{g}(X) = G(a_{n1},...,a_{nk},m_{n1},...,m_{nl}),称为g(\theta )的一个矩估计

例1. 总体均值a,总体方差为\sigma^{2},则\hat{a}_{M} = EX = \bar{X}\hat{\sigma}^{2}_{M} = m_{nl}\tilde{\sigma}^{2}_{M} = S^{2}

故未知参数的矩估计不唯一,那么那种估计是最好的?

低阶矩比高阶矩好

例2.总体\sim P(\lambda )EX = \lambda ,Var(X)=\lambda

\hat{\lambda }_{M1}=\bar{X},\hat{\lambda }_{M2}=S^{2},故未知参数的矩估计不唯一

例3.总体\sim U(\theta_{1},\theta_{2}),求\hat{\theta }_{M1},\hat{\theta }_{M2}

因为EX=\frac{1}{2}(\theta _{1}+\theta _{2})

Var(X) = \frac{1}{12}(\theta_{1}-\theta_{2})^{2}

\bar{X}代替EX,S^{2}代替Var(X)可以反解出结果。

例4.总体\sim f(x,\theta ) = \frac{1}{\pi(1+(x-\theta)^2)},EX不存在,所以未知参数的矩估计不存在

统计量与统计值(由样本表示具有样本的性质)

偏度系数/峰度系数/变异系数,对于一个总体是否服从正态分布,可以先计算其系数,若与正态分布的值相差不大,则可认为是正态分布

例5.(X,Y)协方差及相关系数的矩估计

Cov(X,Y) = E(X-EX)(Y-EY)

\rho_{xy} = \frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y)}}

用样本数据取估计总体的协方差和相关系数

广义矩估计

总而言之:矩估计即使用样本矩代替总体矩,至于准不准,需要后面的判断

\sqrt{DX}=\sqrt{DX_{1}}

(2)极大似然估计(MLE)

概率密度函数的两种形态:

a.当未知参数固定,就是概率函数

b.当随机变量取值固定,此时就是似然函数

原理:既然随机变量取值固定,那么这些变量取这些值的概率就应该为1,那么变化未知参数,使得概率密度取值最大,这个未知参数就是我们想要的。似然函数表达了在给定样本下,概率结构的变化

例1.标志重捕法

定义:

那么接下来就是求极值的问题了,此时的变量只有未知参数,所以一般而言是对未知参数求导

对于简单随机样本X=(X_{1},...,X_{n}),若总体\sim f(x,\theta ),则X=(X_{1},...,X_{n})\sim \prod_{i=1}^{n}f(x_{i},\theta ),

L(x_{1},...,x_{n},\theta )=L(x,\theta ),

lnL(x,\theta )=\prod_{i=1}^{n}lnf(x_{i},\theta )

定理\prod_{i=1}^{n}f(x_{i},\theta )有指数族的自然形式,lnL(x,\theta )的驻点在参数空间内部,则该驻点唯一,且为极大似然估计(这里需要继续看)

例1:

例2:

如果矩估计和极大似然都不可以做,那么用什么估计?

例3:

对于定数截尾,可以使用次序统计量的概率密度函数来进行判断,次序统计量是实际观察到的量

对于定时结尾如何判断?什么是实际观察到的量?

y_{i}为第i个产品的寿命,所以服从指数分布\sim exp(\lambda )

X_{i}=\left\{\begin{matrix} Y_{i}, &Y_{i}<T & \\ T,& Y_{i}\geq T& \end{matrix}\right.,故X_{i}为观测到的量

即为X_{i} = Y_{i}I_{(Y_{i}<T)}+TI_{(Y_{i}\geq T)}

f(t,\lambda ) = f_{y}(t,\lambda )I_{(t<T)}+e^{\lambda T}I_{(t=T)}=\lambda e^{-\lambda t}I_{(t<T)}+e^{\lambda T}I_{(t=T)}

设有r个T之前失效,n-r个T之后失效,则似然函数为

L(t,\lambda ) = \lambda^{r}e^{(t_{1}+...+t_{r})\lambda }e^{-(n-r)\lambda T }

求解即可,同时这也是既非离散也非连续的情况

例4:

总而言之,MLE就是在样本取值固定的情况下,使得取这些值的概率最大,因为此时只有未知参数是不确定的,所以就成了对未知参数求导,求得未知参数的极值。

1.3 点估计的评价标准

(1)无偏性

对未知参数的估计是由统计量来表示的,统计量是随机变量,故存在均值和方差

含义:没有系统偏差

尽管某一次可能会吃亏,但长远来看是相当的

总体的均值为a,总体方差为\sigma^{2}a=\bar{X},\hat{\sigma^{2}}=m_{n2},\hat{\sigma^{2}_{1}}=S^{2}

E\bar{X}=a,Em_{n2}=\frac{n-1}{n}\sigma^{2}——>修正为S^{2}

a_{nk}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{k}\rightarrow Ea_{nk}=\alpha_{k}

m_{nk}=\frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{k}Em_{nk}\neq \mu_{k}

样本n阶原点矩是总体n阶原点矩的无偏估计,如果未知参数等于总体n阶原点矩,那么就是未知参数的无偏估计

样本n阶中点矩通常不是总体n阶中点矩的无偏估计

在独立同分布的条件下,k阶原点矩是易求的,如何求k阶中心矩?

以三阶中心距为例:

m_{n3}=\frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{3}Em_{n3}=E\frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{3},标准化:

Em_{n3}=E\frac{1}{n}\sum_{i=1}^{n}((X_{i}-a)-(\bar{X}-a))^{3}

Y_{i}=X_{i}-a

则化简为:Em_{n3}=E\frac{1}{n}\sum_{i=1}^{n}(Y_{i}-\bar{Y})^{3}

Em_{n3}=E\frac{1}{n}\sum_{i=1}^{n}(Y_{i}^{3}-3Y_{i}^{2}\bar{Y}+3Y_{i}\bar{Y}^{2}-\bar{Y}^{3})=\frac{1}{n}(n\mu_{3}-3\mu_{3}+3nE\bar{Y}^{3}-En\bar{Y}^{3})

PS:\mu_{3} = E\frac{1}{n}\sum_{i=1}^{n}Y_{i}^{2}\bar{Y}=E\frac{1}{n}\sum_{i=1}^{n}Y_{1}^{2}\bar{Y}=EY_{1}^{2}\bar{Y}=EY_{1}^{3}=\mu_{3}

最终:Em_{n3}=\mu_{3}(1-\frac{3}{n})+2nE\bar{Y}^{3}=\frac{(n-1)(n-2)}{n^{2}}\mu_{3}

E\bar{Y}^{3}=\frac{1}{n^{3}}n\mu_{3}可以展开,单阶项可以通过刚才的标准化归为0

可以修正为:\hat{\mu_{3}}=\frac{n^{2}}{(n-1)(n-2)}m_{n3}

X i.i.d ,EX=0,E(X_{1}+...+X_{n})^{k}\sim n^{\frac{k}{2}}(需要看看)

例1:总体\sim P(\lambda )

\hat{\lambda_{1}}=\bar{X},\hat{\lambda_{2}}=S^{2}

E\bar{X}=ES^{2}=\lambda

两个都是无偏估计,那么谁最好?这时比方差,一般低阶矩的方差小

例2:gamma分布的可加性

例3 总体X\sim B(1,\theta ),求\hat{\theta }_{M}\hat{\theta(1-\theta)}_{M}

对于两点分布:

EX=\theta\hat{\theta }_{M}=\bar{X},由于E\bar{X}=\theta,所以无偏

\hat{\theta(1-\theta)}_{M}=\bar{X}(1-\bar{X}),由于E\bar{X}(1-\bar{X})= \frac{n-1}{n}\theta (1-\theta ),系统偏小

和的期望是无条件的

注意n3服从二项分布

(2)有效性

如果的波动程度小,那么一次取样就越接近均值

一般低阶矩更加有效

(3)大样本性质

小样本性质:n固定

大样本性质:n在变化,(n\rightarrow \infty

a.渐进无偏估计

b.相合性

正态分布正交变换的性质

弱大数定律的连续函数形式

柯尔莫哥洛夫强大数定律:

均方相合估计:

c.相合渐进正态估计

如何证明?

若n个独立同分布变量的和,则使用弱大数定律,如辛钦大数定律

若不是n个独立同分布变量的和,则使用切比雪夫不等式,概率计算公式 

1.4 一致最小方差无偏估计(UMVUE)

是无偏估计就是可估的,不是无偏估计就是不可估的

无偏估计不是总是存在的

均方误差:E_{\theta }(\hat{g}(X)-g(\theta ))^{2},兼顾方差和均值的一种衡量标准

E_{\theta }(\hat{g}(X)-g(\theta ))^{2}=E[(\hat{g}(X)-E\hat{g}(X))+(E\hat{g}(X)-g(\theta ))]^{2}

=Var\hat{g}(X)+(E\hat{g}(X)-g(\theta ))^{2}+2E[(\hat{g}(X)-E\hat{g}(X)(E\hat{g}(X)-g(\theta))]

=Var\hat{g}(X)+(E\hat{g}(X)-g(\theta ))^{2}

TIPS:E\hat{g}(X)-g(\theta)为一个常数,故E[(\hat{g}(X)-E\hat{g}(X)]=0

使这两部分都小的情况很难找到,那么退而求其次,使得后一项达到0,即为在无偏估计的情况下

一致最小均方误差估计通常很难找到,那么退而求其次,使得后一项达到0,即为在无偏估计的情况下,此时比较的标准只有方差:

因为后一项为0,所以只需要比较前一项即D

引理:

从引理中可以得到:

对于任意的g(\theta )的无偏估计\hat{g}(X),若T为充分统计量,则

1)E(\hat{g}|T)=h(T)仍为g(\theta )的无偏估计

2)若\hat{g}(X)不是T的函数,则可以找到T的函数h(T),使h(T)为g(\theta )的无偏估计,且方差不超过Var\hat{g}(X)

综上UMVUE只需要在T的函数中寻找。

如何寻找一致最小方差无偏估计:

\theta可估:\exists \hat{g}(X),E\hat{g}(X)=\theta

g(\theta)可估:\exists \hat{g}_{1}(X),E\hat{g}_{1}(X) = g(\theta)

(1)Lehmann-Scheffe定理

指数族的自然形式——>完全充分统计量

步骤:

先找充分完全统计量T

再找g(\theta )的无偏估计,设为\varphi (X):

\varphi (X)可以表达为T的函数,则直接使用

\varphi (X)不是T的函数,则将其修正为T的函数,修正后函数直接使用,h(T)=E(\varphi (X)|T)

那么怎么去找\varphi (X)g(\theta )的无偏估计?

a.先求充分完全统计量的期望,方差,二阶原点矩,然后凑出待求变量

b.生成函数

c.直接用定义

例如:

如果充分完全统计量包括两个以上,那么\varphi (X)只需是其中一个,那么就是T的函数

例1 :是T的函数

例2 :是T的函数

另一种解法:

例3:找完全充分统计量的无偏估计

对于r.v. X,生成函数为:

p(X=k) = p_{k}

h(t) = Et^{X} = \sum t^{k}p_{k}

h^{'}(t)|_{t=1} = EXt^{X-1} = EX

h^{''}(t)|_{t=1} = EX(X-1)t^{X-2} = EX(X-1)

h^{r}(t)|_{t=1} = EX(X-1)...(X-r+1)

对于泊松分布:

h(t) = \sum t^{k}\frac{e^{-\lambda}\lambda^{k}}{k!}=e^{\lambda(t-1)}

h^{''}(t)|_{t=1} = \lambda^{2}

h^{r}(t)|_{t=1} = \lambda^{r}

T=\sum X为完全充分统计量

因为E_{\lambda }T(T-1)(T-2)...(T-r+1)=(n\lambda )^{r}

所以\frac{T(T-1)...(T-r+1)}{n^{r}}\lambda^{r}的无偏估计

例4:

另加:求g_{1}(\lambda ) = 1-e^{-x_{0}\lambda }的UMVUE

E\hat{g}(X) = 1-e^{-\lambda x_{0}}

h(T)=E(\hat{g}(X)|T=t)=P(X_{1}\leq x_{0}|T=t)I_{x_{0}\leq t}=\int_{0}^{\infty }f_{X_{1}|T}(x_{1}|t)dx

f_{X_{1}|t}(x_{1}|t) = \frac{f(X_{1} = x_{1},\sum X_{i}=t)}{f(\sum X_{i}=t)}

例5:

另外:求g_{1}(\theta )=\frac{a}{\sigma ^{2}}的UMVUE

T1与T2是独立的

(2)零无偏估计法

为什么要选用充分统计量?因为包含了全部信息

1.5 Cramer-Rao不等式

达到C-R下界的一定是最小方差无偏估计,但满足C-R不等式的通常很少 ,一般来说C-R下界会偏小。

I(\theta )从总体中计算

(1)单参数C-R不等式

有了上面的正则条件才能证明,统计学的函数空间的投影理论?

指数族:未知参数*exp{未知参数与样本组合}*不含未知参数

Fisher信息函数:

(2)多参数的C-R不等式

效率和有效估计:

拉格朗日乘数法:(条件极值)

怎么求UMVUE:

a.L-S定理

b.零无偏估计

c.拉格朗日乘数法(约束条件是期望无偏)

2.多元函数求极值

极值:

最值:

无条件极值:

注:极值点存在于驻点和不可导的点

条件极值:

几种题目:有界区域:分为无条件极值和条件极值,所有极值比较大小即为最值

无条件极值求区域内部不包含边界,条件极值求边界,综合起来就是最值

矩阵的正定性(二阶连续可导就是为了保证对称)

hassen矩阵求解极值:

3.期望和方差的性质

和的期望可以无条件拆开,乘积的期望需要独立才能拆开

4.线性空间

5.数理统计的线性空间描述

投影?

6.Be分布与Γ分布

指数分布和卡方分布是特殊形式的Γ分布

0-1区间的均匀分布是特殊的Be分布

https://zhuanlan.zhihu.com/p/69606875icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/69606875

这篇关于统计是一门艺术(点估计)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1089593

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

AI与音乐:当技术与艺术发生冲突

AI在创造还是毁掉音乐? 在科技日新月异的今天,人工智能(AI)已经渗透到了我们生活的方方面面,音乐领域也不例外。然而,尽管AI为音乐创作带来了前所未有的便利,我却深感其正在毁掉音乐的本质。 首先,AI的介入使得音乐创作过程变得过于机械化。传统的音乐创作往往需要音乐家们经过长时间的思考、尝试和修改,最终才能创作出触动人心的作品。这一过程不仅体现了音乐家的才华和技艺,更蕴含了他们对生活的感悟和对

AI与音乐:共创未来还是艺术终结?

随着人工智能技术的不断进步,AI在音乐创作领域的应用已经成为了一个不可忽视的现象。最近一个月,一系列音乐大模型的推出,不仅极大地降低了普通人创作音乐的门槛,也引发了关于音乐产业未来的广泛讨论。AI是否正在创造音乐的新纪元,还是正在逐渐毁掉这一艺术形式?本文将深入探讨人工智能和音乐人的合作模式,讨论AI在音乐创作中的辅助作用,以及如何实现人机共同创作的可能性。 AI与音乐人的合作模式 在探讨

金蝶盘点机PDA进行工序汇报扫描,工时工资统计使用说明书

使用盘点机PDA扫描商品条码(序列号)进行工序汇报,自动生成电脑里的【工序汇报单】,自动计算工时,工资。这样就不用去电脑上人工手工一行行录单,大大提高工作效率和数据准确性。 操作时,只需要商品条码(序列号)即可实现快速,准确的工序汇报。从而防止电脑进行工序汇报耗时,费事,不准确的问题。 注意商品条码规则:产品代码+钢管长度+炉号+管号+合同号+序列号 下面我们看下【工序汇报单】的操作步骤

地推利器Xinstall:全方位二维码统计,打造高效地推策略,轻松掌握市场脉搏!

在移动互联网时代,地推作为一种传统的推广方式,依然占据着重要的地位。然而,随着市场竞争的加剧,地推也面临着诸多挑战,如如何有效监测下载来源、解决填码和人工登记的繁琐、避免重复打包和iOS限制、以及如何准确考核推广业绩等。针对这些痛点,Xinstall作为一款强大的移动应用统计与推广平台,推出了全面的地推二维码统计功能,助力地推人员轻松应对各种挑战。 一、一键生成统计二维码,告别繁琐填码 地推

吴恩达教程以及《统计学习方法》学习笔记

之前都在有道云笔记写的,CSDN不能上传文件,搬运过来实在比较耗费精力,在此给出分享链接: 1、吴恩达教程 2、统计学习方法

36 - 按分类统计薪水(高频 SQL 50 题基础版)

36 - 按分类统计薪水 -- 方法一select'Low Salary' category,sum(income <20000) accounts_count fromAccounts unionselect'Average Salary' category,sum(income between 20000 and 50000) accounts_count fromA

JSON数据操作艺术

在现代Web开发和数据交换场景中,JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,扮演着至关重要的角色。它以易于阅读的文本形式存储和传输数据对象,而这些对象的核心便是由属性名(键)和对应的值组成的键值对。本文将深入探讨如何利用字符串作为属性名,在JavaScript环境中高效地对JSON数据进行增删改查操作。 理解基础:JSON对象与属性访问 JS

【Rust日报】 2020-1-30 r/rust 频道的数据统计

r/rust 频道的数据统计 在过去的一年左右的时间里,reddit.com 的 r/rust 频道的订阅人数约为过去六年的总和。 数据源:https://subredditstats.com/r/rust Reddit 上参与讨论:https://www.reddit.com/r/rust/comments/ew1i8w/in_the_last_year_or_so_rrust_gained