2. 数理统计---样本分布

2024-03-14 16:18
文章标签 数理统计 样本分布

本文主要是介绍2. 数理统计---样本分布,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2. 样本分布

定义1:
统计量 g ( X 1 , X 2 , . . . , X n ) g(X_1, X_2, ..., X_n) g(X1,X2,...,Xn)的分布称为抽样分布. 主要介绍与标准正态总体相关的抽样分布.
包括, χ 2 \chi^2 χ2分布, t t t分布和 F F F分布.

2.1 χ 2 \chi^2 χ2分布

定义2:
X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn相互独立, 且都服从标准正态分布N(0,1), 则称随机变量
X 1 2 + X 2 2 + . . . + X n 2 X_1^2+X_2^2+...+X_n^2 X12+X22+...+Xn2
服从自由度为n的 χ 2 \chi^2 χ2分布, 记为:
∑ i = 1 n X i 2 ∼ χ 2 ( n ) \sum_{i=1}^nX_i^2\sim \chi^2(n) i=1nXi2χ2(n)
性质:

    1. 可加性
      Y 1 ∼ χ 2 ( n ) , Y 2 ∼ χ 2 ( m ) Y_1\sim\chi^2(n), Y_2\sim\chi^2(m) Y1χ2(n),Y2χ2(m), 且 Y 1 , Y 2 Y_1,Y_2 Y1,Y2相互独立, 则有
      Y 1 + Y 2 ∼ χ 2 ( n + m ) Y_1+Y_2\sim \chi^2(n+m) Y1+Y2χ2(n+m)
    1. 数字特征
      Y ∼ χ 2 ( n ) Y\sim \chi^2(n) Yχ2(n), 则有 E ( Y ) = n , D ( Y ) = 2 n E(Y)=n, D(Y)=2n E(Y)=n,D(Y)=2n
      证明: 存在 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn独立同分布, 都服从正态分布, 使得 Y = X 1 2 + X 2 2 + . . . + X n 2 Y=X_1^2+X_2^2+...+X_n^2 Y=X12+X22+...+Xn2
      E ( Y ) = E ( X 1 2 + X 2 2 + . . . + X n 2 ) = E ( X 1 2 ) + E ( X 2 2 ) + . . . + E ( X n 2 ) = n ( D ( X 1 ) + E ( X 1 2 ) ) = n D ( Y ) = D ( X 1 2 + X 2 2 + . . . + X n 2 ) = D ( X 1 2 ) + D ( X 2 2 ) + . . . + D ( X n 2 ) = n D ( X 1 2 ) = n [ E ( X 1 4 ) − E ( X 1 2 ) 2 ] = n [ E ( X 1 4 ) − 1 ] \begin{aligned} E(Y)&=E(X_1^2+X_2^2+...+X_n^2)\\ &=E(X_1^2)+E(X_2^2)+...+E(X_n^2)\\ &=n(D(X_1)+E(X_1^2))\\ &=n\\ D(Y)&=D(X_1^2+X_2^2+...+X_n^2)\\ &=D(X_1^2)+D(X_2^2)+...+D(X_n^2)\\ &=nD(X_1^2)\\ &=n[E(X_1^4)-E(X_1^2)^2]\\ &=n[E(X_1^4)-1]\\ \end{aligned} E(Y)D(Y)=E(X12+X22+...+Xn2)=E(X12)+E(X22)+...+E(Xn2)=n(D(X1)+E(X12))=n=D(X12+X22+...+Xn2)=D(X12)+D(X22)+...+D(Xn2)=nD(X12)=n[E(X14)E(X12)2]=n[E(X14)1]

2.2 t t t分布

定义:
X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X\sim N(0,1), Y\sim \chi^2(n) XN(0,1),Yχ2(n), 且 X X X Y Y Y相互独立, 则称随机变量
T = X Y / n T=\frac{X}{\sqrt{Y/n}} T=Y/n X
服从自由度为n的t分布, 记为
T ∼ t ( n ) T\sim t(n) Tt(n)

2.3 F F F分布

X ∼ χ 2 ( m ) , Y ∼ χ 2 ( n ) X\sim \chi^2(m), Y\sim \chi^2(n) Xχ2(m),Yχ2(n), 且 X X X Y Y Y相互独立, 则称随机变量
F = X / m Y / n F=\frac{X/m}{Y/n} F=Y/nX/m
服从自由度为 ( m , n ) (m,n) (m,n) F F F分布, 记为:
F ∼ F ( m , n ) F\sim F(m,n) FF(m,n)
性质:
F ∼ F ( m , n ) F\sim F(m,n) FF(m,n), 则 1 F ∼ F ( n , m ) \frac{1}{F}\sim F(n,m) F1F(n,m)

2.4 分位点

定义:
设连续型随机变量 X ∼ f ( x ) X\sim f(x) Xf(x), 对给定的 α , 0 < α < 1 \alpha, 0<\alpha<1 α,0<α<1, 存在一个实数 x α x_\alpha xα,使得
P { X ≤ x α } = ∫ − ∞ x α f ( x ) d x = α P\{X\leq x_\alpha\}=\int_{-\infty}^{x_\alpha}f(x)dx=\alpha P{Xxα}=xαf(x)dx=α
则称 x α x_\alpha xα为密度函数 f ( x ) f(x) f(x)的** α \alpha α分位点.**

常用分位点
标准正态分布 u α u_\alpha uα
χ α 2 \chi^2_\alpha χα2分位点
t α t_\alpha tα分位点
F α ( m , n ) F_\alpha(m,n) Fα(m,n)分位点

这篇关于2. 数理统计---样本分布的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/808960

相关文章

概率论与数理统计(1)

第一节博客已经整理了求导的公式,一些常用的概念。链接如下:高等数学基础(1)-CSDN博客。         第二节博客整理了微积分的公式及其相关概念。链接如下:高等数学基础(2)——微积分-CSDN博客         第三节博客则整理了泰勒公式和拉格朗日公式的相关概念。链接如下:高等数学基础(3)——泰勒公式与拉格朗日-CSDN博客         第四节博客则整理了行

【概率论与数理统计】第六章:数理统计基础

文章目录 一. 随机样本1. 总体与个体2. 总体对应随机变量X 二. 直方图和箱线图(ing)1. 直方图2. 箱线图 三. 抽样分布1. 统计量2. 三大样本分布2.1. 卡方分布2.2. t分布2.3. F分布 3. 正态总体的样本均值与样本方差的分布 数理统计(Mathematics Statistics)以概率论为基础,根据试验或者观察得到的数据来研究随机现象,对随机

概率论与数理统计期末复习

概率论常考知识点汇总 总括 1. 基础概率论 概率定义:理解概率是事件发生的可能性度量,范围从0(不可能)到1(必然发生)。概率公理:掌握概率的三大公理,即非负性、规范性和可加性。条件概率:P(A|B)表示在事件B已发生的条件下,事件A发生的概率。贝叶斯定理:用于计算在已知某些证据或数据的条件下,某个假设为真的概率。独立事件与相关事件:理解独立事件的概率乘法规则及相关事件的处理方

概率论与数理统计 -- 大数定理及切比雪夫不等式整理

大数定理、切比雪夫不等式及其推导 大数定律 弱大数定律(Weak Law of Large Numbers, WLLN) 弱大数定律指出,当试验次数 (n) 趋向无穷大时,样本平均值 (\bar{X_n}) 与期望值 (\mu) 之间的差异以概率收敛于0。数学上表示为: ∀ ϵ > 0 , lim ⁡ n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − μ ∣ ≥ ϵ ) =

漫步数理统计六——条件概率与独立(下)

$$\textbf{例5:}$瓶$C_1$中有$3$个红球,$7$个白球,瓶$C_2$中有$8$个红球,$2$个白球,这些球大小与形状都是一样的,现在假设选择瓶$C_1$的概率为$P(C_1)=\frac{2}{6}$,而选$C_2$的概率为$P(C_2)=\frac{4}{6}$。选完瓶子后我们随机抽一个球,抽到红球的事件用$C$表示,显然条件概率$P(C|C_1)=\frac{3}{10},P

漫步数理统计三——概率集合函数(上)

令 C \textbf{C}表示样本空间,那么事件集应该是什么呢?我们感兴趣的是给事件、事件的补、事件的并或交分配概率,因此我们希望事件集包含这些事件的组合,这样的事件集称为 C \textbf{C}子集的 σ \sigma域,定义如下: 定义1: \textbf{定义1:}( σ \sigma域)令 B \textbf{B}表示 C \textbf{C}子集的集合,如果 ϕ∈B \phi

漫步数理统计三十一——依分布收敛

上篇博文我们介绍了依概率收敛的概念,利用着概念我们可以说统计量收敛到一个参数,而且在许多情况下即便不知道统计量的分布函数也能说明收敛。但是统计量有多接近估计量呢?本篇博文讲的收敛就回答了这个问题。 定义1: \textbf{定义1:}(依分布收敛) {Xn} \{X_n\}是一系列随机变量, X X是随机变量。FXn,FXF_{X_n},F_X分别是 Xn,X X_n,X的cdf,令 C(Fx

漫步数理统计三十——依概率收敛

本篇博文我们将正式地陈述一系列随机变量靠近某个随机变量。 定义1: \textbf{定义1:} {Xn} \{X_n\}是一系列随机变量, X X是定义在样本空间上的随机变量。我们说XnX_n依概率收敛到 X X,如果对于ϵ>0\epsilon>0 limn→∞P[|Xn−X|≥ϵ]=0 \lim_{n\to\infty}P[|X_n-X|\geq\epsilon]=0

数据挖掘中所需的概率论与数理统计知识(补充)

1.极大似然估计原理详解: 2.共轭先验: 先验概率通常是主观的猜测,为了使计算后验概率方便,有时候会选择共轭先验。如果后验概率和先验概率是同一族的,则认为它们是共轭分布,这个先验概率就是对应于似然函数的共轭先验。 贝叶斯学派和频率学派的区别之一是特别重视先验信息对于inference的影响,而引入先验信息的手段有“贝叶斯原则“(即把先验信息当着均匀分布)等四大类 其

数理统计中95%置信区间的含义

95%置信区间,意味着如果你用同样的步骤,去选样本,计算置信区间,那么100次这样的独立过程,有95%的概率你计算出来的区间会包含真实参数值,即大概会有95个置信区间会包含真值。而对于某一次计算得到的某一个置信区间,其包含真值的概率,我们无法讨论。参源 1.点估计与区间估计 首先我们看看点估计的含义: 是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表