本文主要是介绍数理统计复习笔记五——假设检验之显著性检验,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、基本概念
在统计中,我们把需要用样本去推断“正确”与否的命题称为一个假设。当然,假设是可以关于参数的,也可以是关于分布的。
通过样本对一个假设作出“对”或“不对”的具体判断规则就称为该假设的一个检验。检验的结果若“是”,则否定该命题,就称拒绝该假设,否则就称为接受原假设。这里的拒绝和接受原假设,只是在当前样本下作出的判断,并没有从逻辑或理论上“证明”该命题正确与否。
设有样本 X X X,取值于样本空间 X \mathcal X X,且知道样本来自某一个参数分布族 { F ( x , θ ) : θ ∈ Θ } \{F(x,\theta): \theta\in\Theta\} {F(x,θ):θ∈Θ},其中 Θ \Theta Θ为参数空间。设 Θ 0 ⊂ Θ \Theta_0\subset\Theta Θ0⊂Θ,且 Θ 0 ≠ ∅ \Theta_0\ne\varnothing Θ0=∅,则命题 H 0 : θ ∈ Θ 0 H_0:\theta\in\Theta_0 H0:θ∈Θ0称为一个假设或零假设。如记 Θ 1 = Θ − Θ 0 \Theta_1=\Theta-\Theta_0 Θ1=Θ−Θ0,则命题 H 1 : θ ∈ Θ 1 H_1:\theta\in\Theta_1 H1:θ∈Θ1称为 H 0 H_0 H0的备择假设。于是 H 0 : θ ∈ Θ 0 ↔ H 1 : θ ∈ Θ 1 (1) H_0:\theta\in\Theta_0\leftrightarrow H_1:\theta\in\Theta_1\tag1 H0:θ∈Θ0↔H1:θ∈Θ1(1)
称为假设检验问题。
对于上述假设的检验就是指这样一个法则或策略:当有了具体的样本后,由该法则或策略就可决定是接受 H 0 H_0 H0还是拒绝 H 0 H_0 H0,即检验就等价于把样本空间 X \mathcal X X划分成两个互不相交的部分 W W W和 W ‾ \overline W W,当样本属于 W ‾ \overline W W时,接受 H 0 H_0 H0;否则拒绝 H 0 H_0 H0。于是,我们称 W W W为该检验的拒绝域,而 W ‾ \overline W W称为接受域
由于样本是随机的,所以我们有可能会做出错误的决策,即当 θ ∈ Θ 0 \theta\in\Theta_0 θ∈Θ0时,样本却落入了拒绝域 W W W,于是采取了拒绝 H 0 H_0 H0的错误决策,称这样的错误为第一类错误;当 θ ∈ Θ 1 \theta\in\Theta_1 θ∈Θ1时,样本却落入了接受域 W ‾ \overline W W,于是采取了接受 H 0 H_0 H0的错误决策,称这样的错误为第二类错误。具体可见下表:
决策 | H 0 H_0 H0为真 | H 1 H_1 H1为真 |
---|---|---|
接受 H 0 H_0 H0 | 正确 | 第二类错误 |
拒绝 H 0 H_0 H0 | 第一类错误 | 正确 |
- 定义犯第一类错误的概率为 α = P { X ∈ W ∣ H 0 } \alpha=P\{\bm X\in W|H_0\} α=P{X∈W∣H0}
- 定义犯第二类错误的概率为 β = P { X ∈ W ‾ ∣ H 1 } \beta=P\{\bm X\in\overline W|H_1\} β=P{X∈W∣H1}
- 对于固定的样本容量,找不到一个检验方法,使得犯第一、二类错误的概率均达到最小
势函数:对于假设 ( 1 ) (1) (1)的一个检验方法 ψ \psi ψ,其拒绝域记作 W W W,则称 β ψ ( θ ) = P θ { X ∈ W } , ∀ θ ∈ Θ (2) \beta_\psi(\theta)=P_\theta\{\bm X\in W\}, \forall\theta\in\Theta\tag2 βψ(θ)=Pθ{X∈W},∀θ∈Θ(2)
为此检验的势函数。
所以当 θ ∈ Θ 0 \theta\in\Theta_0 θ∈Θ0时,此检验犯第一类错误的概率等于其势函数 β ψ ( θ ) \beta_\psi(\theta) βψ(θ);而当 θ ∈ Θ 1 \theta\in\Theta_1 θ∈Θ1时,检验犯第二类错误的概率等于 1 − β ψ ( θ ) 1-\beta_\psi(\theta) 1−βψ(θ)
显著性水平:对于检验 ψ \psi ψ和事先给定的 α ∈ ( 0 , 1 ) \alpha\in(0,1) α∈(0,1),如果它满足 P θ { X ∈ W } ≤ α , ∀ θ ∈ Θ 0 (3) P_\theta\{\bm X\in W\}\le\alpha, \forall \theta\in\Theta_0\tag3 Pθ{X∈W}≤α,∀θ∈Θ0(3)
则称 α \alpha α是检验 ψ \psi ψ的显著性水平或水平,也称 ψ \psi ψ为显著性水平 α \alpha α的检验。即检验 ψ \psi ψ犯第一类错误的概率不大于 α \alpha α.
只控制一个检验犯第一类错误的概率时,称这样的检验为显著性检验。一般情况下,求取某假设的显著性检验的步骤如下:
- 根据实际问题,建立统计假设 H 0 ↔ H 1 H_0\leftrightarrow H_1 H0↔H1
- 选取一个合适的统计量 T ( X ) T(\bm X) T(X),使当 H 0 H_0 H0成立时, T T T的分布已知,且与参数 θ \theta θ无关(称此分布为统计量 T T T的零分布)
- 根据 H 0 H_0 H0及 H 1 H_1 H1的特点,确定拒绝域 W W W的区间形式
- 对于给定的显著性水平 α \alpha α,确定拒绝域 W W W
- 由样本观测值 x \bm x x,计算统计量 T ( X ) T(\bm X) T(X)的值 T ( x ) T(\bm x) T(x),由 T ( x ) T(\bm x) T(x)是否属于 W W W,作出最终判断。
二、单样本正态总体参数的显著性检验
在本节中,始终假设 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn为来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的 I I D IID IID样本,且我们感兴趣的是关于 μ \mu μ和 σ 2 \sigma^2 σ2的检验问题。
2.1 单样本正态总体均值的检验
方差 | 假设 | 检验统计量 | 拒绝域 | 名字 |
---|---|---|---|---|
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0↔H1:μ=μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {∣U∣>uα/2} | 双侧 u u u检验 |
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0↔H1:μ<μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U < − u α } \{U\lt -u_{\alpha}\} {U<−uα} | 单侧 u u u检验 |
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0↔H1:μ>μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U > u α } \{U\gt u_{\alpha}\} {U>uα} | 单侧 u u u检验 |
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ≤μ0↔H1:μ>μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U > u α } \{U\gt u_{\alpha}\} {U>uα} | 单侧 u u u检验 |
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ≥μ0↔H1:μ<μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U < − u α } \{U\lt -u_{\alpha}\} {U<−uα} | 单侧 u u u检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0↔H1:μ=μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { ∣ T ∣ > t α / 2 ( n − 1 ) } \{\mid T\mid\gt t_{\alpha/2}(n-1)\} {∣T∣>tα/2(n−1)} | 双侧 t t t检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0↔H1:μ<μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} {T<−tα(n−1)} | 单侧 t t t检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0↔H1:μ>μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} {T>tα(n−1)} | 单侧 t t t检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ≤μ0↔H1:μ>μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} {T>tα(n−1)} | 单侧 t t t检验 |
σ 2 \sigma^2 σ2未知 | H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ≥μ0↔H1:μ<μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} {T<−tα(n−1)} | 单侧 t t t检验 |
以 σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知时,求检验 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0↔H1:μ=μ0的拒绝域为例:
由于 X ‾ \overline X X是 μ \mu μ的一个很好的点估计,于是,当 H 0 H_0 H0成立,即 μ = μ 0 \mu=\mu_0 μ=μ0时, X ‾ \overline X X应该与 μ 0 \mu_0 μ0相差不多。而当 μ 1 \mu_1 μ1成立时, X ‾ \overline X X与 μ 0 \mu_0 μ0应相差较大。这样,可以用 ∣ X ‾ − μ 0 ∣ \mid\overline X-\mu_0\mid ∣X−μ0∣的大小来反映假设,并且当 ∣ X ‾ − μ 0 ∣ > c \mid\overline X-\mu_0\mid\gt c ∣X−μ0∣>c时,有理由拒绝 H 0 H_0 H0,即认为 H 1 H_1 H1成立。
因为 V a r ( X ‾ − μ 0 ) = σ 2 / n Var(\overline X-\mu_0)=\sigma^2/n Var(X−μ0)=σ2/n,为了标准化,可以取此假设的检验统计量为 U ( X ) = n ( X ‾ − μ 0 ) σ 0 (4) U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag4 U(X)=σ0n(X−μ0)(4)
根据以上分析,此检验的拒绝域为 W = { x : ∣ U ( x ) ∣ > c } (5) W=\{x:\mid U(\bm x)\mid\gt c\}\tag5 W={x:∣U(x)∣>c}(5)
根据显著性水平的特点,上述拒绝域中的常数 c c c由事先给定的显著性水平 α \alpha α确定,即要求此检验犯第一类错误的概率不大于 α \alpha α,也就是说,其常数 c c c满足 P H 0 { ∣ U ( x ) ∣ > c } ≤ α (6) P_{H_0}\{\mid U(\bm x)\mid\gt c\}\le \alpha\tag6 PH0{∣U(x)∣>c}≤α(6)
由于当 H 0 H_0 H0成立时, U ( X ) ∼ N ( 0 , 1 ) U(\bm X)\sim N(0, 1) U(X)∼N(0,1),故上述拒绝域中的常数 c c c可取 c = u α / 2 c=u_{\alpha/2} c=uα/2,又因为此常数是拒绝与接受零假设的分水岭,因此称之为检验的临界值。
总之,关于上述假设的显著性检验总结如下:
- 检验统计量: U ( X ) = n ( X ‾ − μ 0 ) σ 0 (7) U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag7 U(X)=σ0n(X−μ0)(7)
- 检验的拒绝域: { x : ∣ U ( x ) ∣ > u α / 2 } (8) \{\bm x:\mid U(\bm x)\mid\gt u_{\alpha/2}\}\tag8 {x:∣U(x)∣>uα/2}(8)
与置信区间的关系:
对于正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2),当 σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知时, μ \mu μ的置信水平为 1 − α 1-\alpha 1−α的置信区间为 [ X ‾ − u α / 2 σ 0 n , X ‾ + u α / 2 σ 0 n ] (9) [\overline X-u_{\alpha/2}\frac{\sigma_0}{n}, \overline X+u_{\alpha/2}\frac{\sigma_0}{n}]\tag9 [X−uα/2nσ0,X+uα/2nσ0](9)
详情见数理统计复习笔记四——区间估计
而根据式 ( 7 ) (7) (7)和式 ( 8 ) (8) (8)可知,检验的拒绝域可化为 { x : μ 0 < X ‾ − u α / 2 σ 0 n 或 μ 0 > X ‾ + u α / 2 σ 0 n } (10) \{\bm x:\mu_0\lt\overline X-u_{\alpha/2}\frac{\sigma_0}{n}或\mu_0\gt\overline X+u_{\alpha/2}\frac{\sigma_0}{n}\}\tag{10} {x:μ0<X−uα/2nσ0或μ0>X+uα/2nσ0}(10)
对比式 ( 9 ) (9) (9)和式 ( 10 ) (10) (10),可以发现,接受域和置信区间有相同的形式。
所以我们可以这样理解置信区间:当 μ 0 \mu_0 μ0落在 μ \mu μ的置信水平为 1 − α 1-\alpha 1−α的置信区间时,在显著性水平 α \alpha α下,没有理由拒绝 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0。
2.2 单样本正态总体方差的检验
均值 | 假设 | 检验统计量 | 拒绝域 |
---|---|---|---|
μ = μ 0 已 知 \mu=\mu_0已知 μ=μ0已知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02↔H1:σ2=σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n ) } ∪ { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2<χ1−α/22(n)}∪{χ2>χα/22(n)} |
μ = μ 0 \mu=\mu_0 μ=μ0已知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2=σ02↔H1:σ2<σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\} {χ2<χ1−α/22(n)} |
μ = μ 0 \mu=\mu_0 μ=μ0已知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2=σ02↔H1:σ2>σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2>χα/22(n)} |
μ = μ 0 \mu=\mu_0 μ=μ0已知 | H 0 : σ 2 ≤ σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2≤σ02↔H1:σ2>σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2>χα/22(n)} |
μ = μ 0 \mu=\mu_0 μ=μ0已知 | H 0 : σ 2 ≥ σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2≥σ02↔H1:σ2<σ02 | χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1∑n(Xi−μ0)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\} {χ2<χ1−α/22(n)} |
μ \mu μ未知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02↔H1:σ2=σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } ∪ { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2<χ1−α/22(n−1)}∪{χ2>χα/22(n−1)} |
μ \mu μ未知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2=σ02↔H1:σ2<σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\} {χ2<χ1−α/22(n−1)} |
μ \mu μ未知 | H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2=σ02↔H1:σ2>σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2>χα/22(n−1)} |
μ \mu μ未知 | H 0 : σ 2 ≤ σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2≤σ02↔H1:σ2>σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2>χα/22(n−1)} |
μ \mu μ未知 | H 0 : σ 2 ≥ σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2≥σ02↔H1:σ2<σ02 | χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1∑n(Xi−X)2/σ02 | { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\} {χ2<χ1−α/22(n−1)} |
以 μ = μ 0 \mu=\mu_0 μ=μ0时,求检验 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02↔H1:σ2=σ02的拒绝域为例。
当 μ = μ 0 \mu=\mu_0 μ=μ0已知时, ∑ i = 1 n ( X i − μ 0 ) 2 \sum\limits_{i=1}^n(X_i-\mu_0)^2 i=1∑n(Xi−μ0)2是 σ 2 \sigma^2 σ2的一个很好的点估计,且当 H 0 H_0 H0成立时, ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 ∼ χ 2 ( n ) \sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0\sim \chi^2(n) i=1∑n(Xi−μ0)2/σ02∼χ2(n),于是,可以选取统计量为 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 σ 0 2 (11) \chi^2=\frac{\sum\limits_{i=1}^n(X_i-\mu_0)^2}{\sigma^2_0}\tag{11} χ2=σ02i=1∑n(Xi−μ0)2(11)
另外,由备择假设的形式可知其拒绝域为 W = { χ 2 < c 1 } ∪ { χ 2 > c 2 } (12) W=\{\chi^2\lt c_1\}\cup\{\chi^2\gt c_2\}\tag{12} W={χ2<c1}∪{χ2>c2}(12)
其中, c 1 , c 2 c_1, c_2 c1,c2为两个待定的常数,且由检验的显著性水平 α \alpha α来确定,即它们满足 P H 0 { χ 2 < c 1 } + P H 0 { χ 2 > c 2 } ≤ α (13) P_{H_0}\{\chi^2\lt c_1\}+P_{H_0}\{\chi^2\gt c_2\}\le\alpha\tag{13} PH0{χ2<c1}+PH0{χ2>c2}≤α(13)
由于 χ 2 \chi^2 χ2分布的图像并不是对称的,所以 c 1 , c 2 c_1, c_2 c1,c2不能直接确定。于是,一个常用的方法是如下选取 c 1 , c 2 c_1, c_2 c1,c2, P H 0 { χ 2 < c 1 } ≤ α / 2 , P H 0 { χ 2 > c 2 } ≤ α / 2 (14) P_{H_0}\{\chi^2\lt c_1\}\le\alpha/2, P_{H_0}\{\chi^2\gt c_2\}\le\alpha/2\tag{14} PH0{χ2<c1}≤α/2,PH0{χ2>c2}≤α/2(14)
这样可以保证第一类错误概率为 α \alpha α的情况下,第二类错误概率最小
从而可以得到 c 1 = χ 1 − α / 2 2 ( n ) , c 2 = χ α / 2 2 ( n ) c_1=\chi^2_{1-\alpha/2}(n), c_2=\chi^2_{\alpha/2}(n) c1=χ1−α/22(n),c2=χα/22(n)
三、两样本正态总体参数的显著性检验
设 X 1 , ⋯ , X m X_1,\cdots,X_m X1,⋯,Xm为来自正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma^2_1) N(μ1,σ12)的 I I D IID IID样本, Y 1 , ⋯ , Y n Y_1,\cdots,Y_n Y1,⋯,Yn为来自正态总体 N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma^2_2) N(μ2,σ22)的 I I D IID IID样本,且两样本是独立的。
3.1 两样本正态总体均值的显著性检验
方差 | 假设 | 检验统计量 | 拒绝域 |
---|---|---|---|
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 | H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2 | U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(X−Y)/σ12/m+σ22/n | { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {∣U∣>uα/2} |
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 | H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1≤μ2↔H1:μ1>μ2 | U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(X−Y)/σ12/m+σ22/n | { U > u α } \{U\gt u_{\alpha}\} {U>uα} |
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 | H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1≥μ2↔H1:μ1<μ2 | U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(X−Y)/σ12/m+σ22/n | { U < − u α } \{ U\lt -u_{\alpha}\} {U<−uα} |
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 | H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2 | T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n)(X−Y)/Smn∗2 | { ∣ T ∣ > t α / 2 ( m + n − 2 ) } \{\mid T\mid\gt t_{\alpha/2}(m+n-2)\} {∣T∣>tα/2(m+n−2)} |
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 | H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1≤μ2↔H1:μ1>μ2 | T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n)(X−Y)/Smn∗2 | { T > t α ( m + n − 2 ) } \{T\gt t_{\alpha}(m+n-2)\} {T>tα(m+n−2)} |
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 | H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1≥μ2↔H1:μ1<μ2 | T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n)(X−Y)/Smn∗2 | { T < − t α ( m + n − 2 ) } \{T\lt -t_{\alpha}(m+n-2)\} {T<−tα(m+n−2)} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 | H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2 | U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(X−Y)/S1m2/m+S2n2/n | { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {∣U∣>uα/2} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 | H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1≤μ2↔H1:μ1>μ2 | U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(X−Y)/S1m2/m+S2n2/n | { U > u α } \{U\gt u_{\alpha}\} {U>uα} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 | H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1≥μ2↔H1:μ1<μ2 | U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(X−Y)/S1m2/m+S2n2/n | { U < − u α } \{ U\lt -u_{\alpha}\} {U<−uα} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 | H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2 | T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(X−Y)/S1m2/m+S2n2/n | { ∣ T ∣ > t α / 2 ( r ) } \{\mid T\mid\gt t_{\alpha/2}(r)\} {∣T∣>tα/2(r)} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 | H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1≤μ2↔H1:μ1>μ2 | T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(X−Y)/S1m2/m+S2n2/n | { T > t α ( r ) } \{T\gt t_{\alpha}(r)\} {T>tα(r)} |
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 | H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1≥μ2↔H1:μ1<μ2 | T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(X−Y)/S1m2/m+S2n2/n | { T < − t α ( r ) } \{T\lt -t_{\alpha}(r)\} {T<−tα(r)} |
其中, S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 n ( Y i − Y ‾ ) 2 m + n (15) S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{15} Smn∗2=m+ni=1∑m(Xi−X)2+i=1∑n(Yi−Y)2(15) r = S m n 4 S 1 m 4 m 2 ( m − 1 ) + S 2 n 4 n 2 ( n − 1 ) (16) r=\frac{S_{mn}^4}{\frac{S_{1m}^4}{m^2(m-1)}+\frac{S_{2n}^4}{n^2(n-1)}}\tag{16} r=m2(m−1)S1m4+n2(n−1)S2n4Smn4(16)
其中 S m n 2 = S 1 m 2 m + S 2 n 2 n S_{mn}^2=\frac{S_{1m}^2}{m}+\frac{S_{2n}^2}{n} Smn2=mS1m2+nS2n2
以 σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知,求解检验 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2↔H1:μ1=μ2的拒绝域为例进行说明:
由于 X ‾ \overline X X, Y ‾ \overline Y Y分别是 μ 1 \mu_1 μ1, μ 2 \mu_2 μ2的一个很好的点估计,故可用 X ‾ − Y ‾ \overline X-\overline Y X−Y来反映 μ 1 \mu_1 μ1和 μ 2 \mu_2 μ2的区别。考虑到假设的特点,我们知道,当 ∣ X ‾ − Y ‾ ∣ ≥ c \mid \overline X-\overline Y\mid\ge c ∣X−Y∣≥c时,有理由拒绝 H 0 H_0 H0,其中常数 c c c由此检验犯第一类错误的概率 α \alpha α决定。
当 H 0 H_0 H0成立时, X ‾ − Y ‾ ∼ N ( 0 , m + n m n σ 2 ) \overline X-\overline Y\sim N(0,\frac{m+n}{mn}\sigma^2) X−Y∼N(0,mnm+nσ2),其中 σ 2 \sigma^2 σ2未知。此时可利用总的样本方差 S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 n ( Y i − Y ‾ ) 2 m + n (17) S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{17} Smn∗2=m+ni=1∑m(Xi−X)2+i=1∑n(Yi−Y)2(17)来估计 σ 2 \sigma^2 σ2,且在 H 0 H_0 H0成立时, ( m + n − 2 ) S m n ∗ 2 / σ 2 ∼ χ 2 ( m + n − 2 ) (m+n-2)S_{mn}^{*2}/\sigma^2\sim\chi^2(m+n-2) (m+n−2)Smn∗2/σ2∼χ2(m+n−2)(详情见数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布))。
于是,一个自然的检验统计量为 T = ( X ‾ − Y ‾ ) / [ σ ( m + n ) / m n ] ( m + n − 2 ) S m n ∗ 2 / [ σ 2 ( m + n − 2 ) ] = m n m + n X ‾ − Y ‾ S m n ∗ (18) T=\frac{(\overline X-\overline Y)/[\sigma\sqrt{(m+n)/mn}]}{\sqrt{(m+n-2)S_{mn}^{*2}/[\sigma^2(m+n-2)]}}=\frac{mn}{m+n}\frac{\overline X-\overline Y}{S_{mn}^*}\tag{18} T=(m+n−2)Smn∗2/[σ2(m+n−2)](X−Y)/[σ(m+n)/mn]=m+nmnSmn∗X−Y(18)
且当 H 0 H_0 H0成立时, T ∼ t ( m + n − 2 ) T\sim t(m+n-2) T∼t(m+n−2),所以在显著性水平为 α \alpha α下,可以得到拒绝域为: { ∣ T ∣ > t α / 2 ( m + n − 2 ) } (19) \{\mid T\mid\gt t_{\alpha/2}(m+n-2)\}\tag{19} {∣T∣>tα/2(m+n−2)}(19)
3.2 两样本正态总体方差的显著性检验
均值 | 假设 | 检验统计量 | 拒绝域 |
---|---|---|---|
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 | H 0 : σ 1 2 = σ 2 2 ↔ H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2 H0:σ12=σ22↔H1:σ12=σ22 | F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1∑n(Yi−μ2)2/ni=1∑m(Xi−μ1)2/m | { F < F 1 − α / 2 ( m , n ) } ∪ { F > F α / 2 ( m , n ) } \{F\lt F_{1-\alpha/2}(m,n)\}\cup\{F\gt F_{\alpha/2}(m,n)\} {F<F1−α/2(m,n)}∪{F>Fα/2(m,n)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 | H 0 : σ 1 2 ≤ σ 2 2 ↔ H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2 H0:σ12≤σ22↔H1:σ12>σ22 | F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1∑n(Yi−μ2)2/ni=1∑m(Xi−μ1)2/m | { F > F α ( m , n ) } \{F\gt F_{\alpha}(m,n)\} {F>Fα(m,n)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 | H 0 : σ 1 2 ≥ σ 2 2 ↔ H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2 H0:σ12≥σ22↔H1:σ12<σ22 | F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1∑n(Yi−μ2)2/ni=1∑m(Xi−μ1)2/m | { F < F 1 − α ( m , n ) } \{F\lt F_{1-\alpha}(m,n)\} {F<F1−α(m,n)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 | H 0 : σ 1 2 = σ 2 2 ↔ H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2 H0:σ12=σ22↔H1:σ12=σ22 | F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1∑n(Yi−Y)2/(n−1)i=1∑m(Xi−X)2/(m−1) | { F < F 1 − α / 2 ( m − 1 , n − 1 ) } ∪ { F > F α / 2 ( m − 1 , n − 1 ) } \{F\lt F_{1-\alpha/2}(m-1,n-1)\}\cup\{F\gt F_{\alpha/2}(m-1,n-1)\} {F<F1−α/2(m−1,n−1)}∪{F>Fα/2(m−1,n−1)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 | H 0 : σ 1 2 ≤ σ 2 2 ↔ H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2 H0:σ12≤σ22↔H1:σ12>σ22 | F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1∑n(Yi−Y)2/(n−1)i=1∑m(Xi−X)2/(m−1) | { F > F α ( m − 1 , n − 1 ) } \{F\gt F_{\alpha}(m-1,n-1)\} {F>Fα(m−1,n−1)} |
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 | H 0 : σ 1 2 ≥ σ 2 2 ↔ H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2 H0:σ12≥σ22↔H1:σ12<σ22 | F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1∑n(Yi−Y)2/(n−1)i=1∑m(Xi−X)2/(m−1) | { F < F 1 − α ( m − 1 , n − 1 ) } \{F\lt F_{1-\alpha}(m-1,n-1)\} {F<F1−α(m−1,n−1)} |
四、似然比检验
4.1 相关定义
4.1.1 似然比统计量
设 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn为来自分布族 F = { f ( x , θ ) : θ ∈ Θ } \mathcal F=\{f(x,\theta):\theta\in\Theta\} F={f(x,θ):θ∈Θ}的 I I D IID IID样本,对于假设 H 0 : θ ∈ Θ ↔ H 1 : θ ∈ Θ 1 = Θ − θ 0 (20) H_0:\theta\in\Theta\leftrightarrow H_1:\theta\in\Theta_1=\Theta-\theta_0\tag{20} H0:θ∈Θ↔H1:θ∈Θ1=Θ−θ0(20)
令 λ ( X ) = sup θ ∈ Θ 0 f ( X , θ ) sup θ ∈ Θ f ( X , θ ) (21) \lambda(\bm X)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm X,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm X,\theta)}\tag{21} λ(X)=θ∈Θsupf(X,θ)θ∈Θ0supf(X,θ)(21)
则称统计量 λ ( X ) \lambda(\bm X) λ(X)为假设 ( 20 ) (20) (20)的似然比,也称为广义似然比
从 λ ( X ) \lambda(\bm X) λ(X)的定义不难看出,如果 λ ( X ) \lambda(\bm X) λ(X)的值很小,则说明 θ ∈ Θ 0 \theta\in\Theta_0 θ∈Θ0的可能性要比 θ ∈ Θ \theta\in\Theta θ∈Θ的可能性小,于是我们有理由认为 H 0 H_0 H0不成立。这样就有如下的似然比检验。
4.1.2 似然比检验
采用 ( 21 ) (21) (21)式的似然比统计量 λ ( X ) \lambda(\bm X) λ(X)作为假设 ( 20 ) (20) (20)的检验统计量,且取其拒绝域为 { λ ( x ) ≤ c } \{\lambda(\bm x)\le c\} {λ(x)≤c},其中临界值 c c c满足 P θ { λ ( X ) ≤ c } ≤ α , ∀ θ ∈ Θ 0 (22) P_{\theta}\{\lambda(\bm X)\le c\}\le \alpha, \forall\theta\in\Theta_0\tag{22} Pθ{λ(X)≤c}≤α,∀θ∈Θ0(22)
则称此检验为显著性水平为 α \alpha α的似然比检验。
如果似然比统计量的零分布未知,则很难确定似然比检验的临界值。但如果此时存在一个统计量 T ( X ) T(\bm X) T(X)关于似然比统计量式单调的且零分布已知,则可以给出一个基于 T ( X ) T(\bm X) T(X)的显著性检验。
4.2 例子
设 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn是来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的 I I D IID IID样本, μ , σ 2 \mu,\sigma^2 μ,σ2均未知。试求假设 H 0 : μ = μ 0 ↔ H 1 μ ≠ μ 0 H_0:\mu=\mu_0\leftrightarrow H_1\mu\ne\mu_0 H0:μ=μ0↔H1μ=μ0的显著性水平为 α \alpha α的似然比检验。
解:
此时样本分布为 f ( x , θ ) = ( 2 π σ 2 ) − n / 2 exp [ − 1 2 σ 2 ∑ i = 1 n ( X i − μ ) 2 ] f(\bm x, \theta)=(2\pi\sigma^2)^{-n/2}\exp[-\frac{1}{2\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2] f(x,θ)=(2πσ2)−n/2exp[−2σ21i=1∑n(Xi−μ)2], Θ 0 = { ( μ 0 , σ 2 ) : σ 2 > 0 } \Theta_0=\{(\mu_0,\sigma^2):\sigma^2\gt0\} Θ0={(μ0,σ2):σ2>0}, Θ = { ( μ , σ 2 ) : μ ∈ R , σ 2 > 0 } \Theta=\{(\mu,\sigma^2):\mu\in\bm R, \sigma^2\gt0\} Θ={(μ,σ2):μ∈R,σ2>0}
则似然比统计量为 λ ( x ) = sup θ ∈ Θ 0 f ( x , θ ) sup θ ∈ Θ f ( x , θ ) = [ ∑ i = 1 n ( x i − x ‾ ) 2 ∑ i = 1 n ( x i − μ 0 ) 2 ] n / 2 = ( 1 + T 2 n − 1 ) − n / 2 \lambda(\bm x)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm x,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm x,\theta)}=[\frac{\sum\limits_{i=1}^n(x_i-\overline x)^2}{\sum\limits_{i=1}^n(x_i-\mu_0)^2}]^{n/2}=(1+\frac{T^2}{n-1})^{-n/2} λ(x)=θ∈Θsupf(x,θ)θ∈Θ0supf(x,θ)=[i=1∑n(xi−μ0)2i=1∑n(xi−x)2]n/2=(1+n−1T2)−n/2
其中, T = n ( x ‾ − μ 0 ) S n T=\frac{\sqrt n(\overline x-\mu_0)}{S_n} T=Snn(x−μ0)
所以此时的似然比统计量与传统的 t t t统计量的平方成反比,于是,两个检验统计量的拒绝域有如下关系: { λ ( x ) ≤ c } ⇔ { ∣ T ( x ) ∣ ≥ d } (23) \{\lambda(\bm x)\le c\}\Leftrightarrow\{\mid T(\bm x)\mid\ge d\}\tag{23} {λ(x)≤c}⇔{∣T(x)∣≥d}(23)
所以,此时的似然比检验与双侧 t t t检验完全等价
五、p值
详见杂记——假设检验中p值的理解
这篇关于数理统计复习笔记五——假设检验之显著性检验的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!