数理统计复习笔记五——假设检验之显著性检验

2024-04-24 19:58

本文主要是介绍数理统计复习笔记五——假设检验之显著性检验,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、基本概念

在统计中,我们把需要用样本去推断“正确”与否的命题称为一个假设。当然,假设是可以关于参数的,也可以是关于分布的。

通过样本对一个假设作出“对”或“不对”的具体判断规则就称为该假设的一个检验。检验的结果若“是”,则否定该命题,就称拒绝该假设,否则就称为接受原假设这里的拒绝和接受原假设,只是在当前样本下作出的判断,并没有从逻辑或理论上“证明”该命题正确与否。

设有样本 X X X,取值于样本空间 X \mathcal X X,且知道样本来自某一个参数分布族 { F ( x , θ ) : θ ∈ Θ } \{F(x,\theta): \theta\in\Theta\} {F(x,θ):θΘ},其中 Θ \Theta Θ为参数空间。设 Θ 0 ⊂ Θ \Theta_0\subset\Theta Θ0Θ,且 Θ 0 ≠ ∅ \Theta_0\ne\varnothing Θ0=,则命题 H 0 : θ ∈ Θ 0 H_0:\theta\in\Theta_0 H0:θΘ0称为一个假设或零假设。如记 Θ 1 = Θ − Θ 0 \Theta_1=\Theta-\Theta_0 Θ1=ΘΘ0,则命题 H 1 : θ ∈ Θ 1 H_1:\theta\in\Theta_1 H1:θΘ1称为 H 0 H_0 H0备择假设。于是 H 0 : θ ∈ Θ 0 ↔ H 1 : θ ∈ Θ 1 (1) H_0:\theta\in\Theta_0\leftrightarrow H_1:\theta\in\Theta_1\tag1 H0:θΘ0H1:θΘ1(1)
称为假设检验问题

对于上述假设的检验就是指这样一个法则或策略:当有了具体的样本后,由该法则或策略就可决定是接受 H 0 H_0 H0还是拒绝 H 0 H_0 H0,即检验就等价于把样本空间 X \mathcal X X划分成两个互不相交的部分 W W W W ‾ \overline W W,当样本属于 W ‾ \overline W W时,接受 H 0 H_0 H0;否则拒绝 H 0 H_0 H0。于是,我们称 W W W为该检验的拒绝域,而 W ‾ \overline W W称为接受域

由于样本是随机的,所以我们有可能会做出错误的决策,即当 θ ∈ Θ 0 \theta\in\Theta_0 θΘ0时,样本却落入了拒绝域 W W W,于是采取了拒绝 H 0 H_0 H0的错误决策,称这样的错误为第一类错误;当 θ ∈ Θ 1 \theta\in\Theta_1 θΘ1时,样本却落入了接受域 W ‾ \overline W W,于是采取了接受 H 0 H_0 H0的错误决策,称这样的错误为第二类错误。具体可见下表:

决策 H 0 H_0 H0为真 H 1 H_1 H1为真
接受 H 0 H_0 H0正确第二类错误
拒绝 H 0 H_0 H0第一类错误正确
  • 定义犯第一类错误的概率为 α = P { X ∈ W ∣ H 0 } \alpha=P\{\bm X\in W|H_0\} α=P{XWH0}
  • 定义犯第二类错误的概率为 β = P { X ∈ W ‾ ∣ H 1 } \beta=P\{\bm X\in\overline W|H_1\} β=P{XWH1}
  • 对于固定的样本容量,找不到一个检验方法,使得犯第一、二类错误的概率均达到最小

势函数:对于假设 ( 1 ) (1) (1)的一个检验方法 ψ \psi ψ,其拒绝域记作 W W W,则称 β ψ ( θ ) = P θ { X ∈ W } , ∀ θ ∈ Θ (2) \beta_\psi(\theta)=P_\theta\{\bm X\in W\}, \forall\theta\in\Theta\tag2 βψ(θ)=Pθ{XW},θΘ(2)
为此检验的势函数。

所以当 θ ∈ Θ 0 \theta\in\Theta_0 θΘ0时,此检验犯第一类错误的概率等于其势函数 β ψ ( θ ) \beta_\psi(\theta) βψ(θ);而当 θ ∈ Θ 1 \theta\in\Theta_1 θΘ1时,检验犯第二类错误的概率等于 1 − β ψ ( θ ) 1-\beta_\psi(\theta) 1βψ(θ)

显著性水平:对于检验 ψ \psi ψ和事先给定的 α ∈ ( 0 , 1 ) \alpha\in(0,1) α(0,1),如果它满足 P θ { X ∈ W } ≤ α , ∀ θ ∈ Θ 0 (3) P_\theta\{\bm X\in W\}\le\alpha, \forall \theta\in\Theta_0\tag3 Pθ{XW}α,θΘ0(3)
则称 α \alpha α是检验 ψ \psi ψ的显著性水平或水平,也称 ψ \psi ψ为显著性水平 α \alpha α的检验。即检验 ψ \psi ψ犯第一类错误的概率不大于 α \alpha α.

只控制一个检验犯第一类错误的概率时,称这样的检验为显著性检验。一般情况下,求取某假设的显著性检验的步骤如下:

  1. 根据实际问题,建立统计假设 H 0 ↔ H 1 H_0\leftrightarrow H_1 H0H1
  2. 选取一个合适的统计量 T ( X ) T(\bm X) T(X),使当 H 0 H_0 H0成立时, T T T的分布已知,且与参数 θ \theta θ无关(称此分布为统计量 T T T的零分布)
  3. 根据 H 0 H_0 H0 H 1 H_1 H1的特点,确定拒绝域 W W W的区间形式
  4. 对于给定的显著性水平 α \alpha α,确定拒绝域 W W W
  5. 由样本观测值 x \bm x x,计算统计量 T ( X ) T(\bm X) T(X)的值 T ( x ) T(\bm x) T(x),由 T ( x ) T(\bm x) T(x)是否属于 W W W,作出最终判断。

二、单样本正态总体参数的显著性检验

在本节中,始终假设 X 1 , ⋯ , X n X_1,\cdots,X_n X1,,Xn为来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) I I D IID IID样本,且我们感兴趣的是关于 μ \mu μ σ 2 \sigma^2 σ2的检验问题。

2.1 单样本正态总体均值的检验

方差假设检验统计量拒绝域名字
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0H1:μ=μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {U>uα/2}双侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0H1:μ<μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U < − u α } \{U\lt -u_{\alpha}\} {U<uα}单侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0H1:μ>μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U > u α } \{U\gt u_{\alpha}\} {U>uα}单侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μμ0H1:μ>μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U > u α } \{U\gt u_{\alpha}\} {U>uα}单侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μμ0H1:μ<μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U < − u α } \{U\lt -u_{\alpha}\} {U<uα}单侧 u u u检验
σ 2 \sigma^2 σ2未知 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0H1:μ=μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { ∣ T ∣ > t α / 2 ( n − 1 ) } \{\mid T\mid\gt t_{\alpha/2}(n-1)\} {T>tα/2(n1)}双侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0H1:μ<μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} {T<tα(n1)}单侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0H1:μ>μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} {T>tα(n1)}单侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μμ0H1:μ>μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} {T>tα(n1)}单侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μμ0H1:μ<μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} {T<tα(n1)}单侧 t t t检验

σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知时,求检验 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0H1:μ=μ0的拒绝域为例:

由于 X ‾ \overline X X μ \mu μ的一个很好的点估计,于是,当 H 0 H_0 H0成立,即 μ = μ 0 \mu=\mu_0 μ=μ0时, X ‾ \overline X X应该与 μ 0 \mu_0 μ0相差不多。而当 μ 1 \mu_1 μ1成立时, X ‾ \overline X X μ 0 \mu_0 μ0应相差较大。这样,可以用 ∣ X ‾ − μ 0 ∣ \mid\overline X-\mu_0\mid Xμ0的大小来反映假设,并且当 ∣ X ‾ − μ 0 ∣ > c \mid\overline X-\mu_0\mid\gt c Xμ0>c时,有理由拒绝 H 0 H_0 H0,即认为 H 1 H_1 H1成立。

因为 V a r ( X ‾ − μ 0 ) = σ 2 / n Var(\overline X-\mu_0)=\sigma^2/n Var(Xμ0)=σ2/n,为了标准化,可以取此假设的检验统计量为 U ( X ) = n ( X ‾ − μ 0 ) σ 0 (4) U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag4 U(X)=σ0n (Xμ0)(4)
根据以上分析,此检验的拒绝域为 W = { x : ∣ U ( x ) ∣ > c } (5) W=\{x:\mid U(\bm x)\mid\gt c\}\tag5 W={x:U(x)>c}(5)
根据显著性水平的特点,上述拒绝域中的常数 c c c由事先给定的显著性水平 α \alpha α确定,即要求此检验犯第一类错误的概率不大于 α \alpha α,也就是说,其常数 c c c满足 P H 0 { ∣ U ( x ) ∣ > c } ≤ α (6) P_{H_0}\{\mid U(\bm x)\mid\gt c\}\le \alpha\tag6 PH0{U(x)>c}α(6)
由于当 H 0 H_0 H0成立时, U ( X ) ∼ N ( 0 , 1 ) U(\bm X)\sim N(0, 1) U(X)N(0,1),故上述拒绝域中的常数 c c c可取 c = u α / 2 c=u_{\alpha/2} c=uα/2,又因为此常数是拒绝与接受零假设的分水岭,因此称之为检验的临界值

总之,关于上述假设的显著性检验总结如下:

  • 检验统计量: U ( X ) = n ( X ‾ − μ 0 ) σ 0 (7) U(\bm X)=\frac{\sqrt n(\overline X-\mu_0)}{\sigma_0}\tag7 U(X)=σ0n (Xμ0)(7)
  • 检验的拒绝域: { x : ∣ U ( x ) ∣ > u α / 2 } (8) \{\bm x:\mid U(\bm x)\mid\gt u_{\alpha/2}\}\tag8 {x:U(x)>uα/2}(8)

与置信区间的关系

对于正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2),当 σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知时, μ \mu μ的置信水平为 1 − α 1-\alpha 1α的置信区间为 [ X ‾ − u α / 2 σ 0 n , X ‾ + u α / 2 σ 0 n ] (9) [\overline X-u_{\alpha/2}\frac{\sigma_0}{n}, \overline X+u_{\alpha/2}\frac{\sigma_0}{n}]\tag9 [Xuα/2nσ0,X+uα/2nσ0](9)
详情见数理统计复习笔记四——区间估计
而根据式 ( 7 ) (7) (7)和式 ( 8 ) (8) (8)可知,检验的拒绝域可化为 { x : μ 0 < X ‾ − u α / 2 σ 0 n 或 μ 0 > X ‾ + u α / 2 σ 0 n } (10) \{\bm x:\mu_0\lt\overline X-u_{\alpha/2}\frac{\sigma_0}{n}或\mu_0\gt\overline X+u_{\alpha/2}\frac{\sigma_0}{n}\}\tag{10} {x:μ0<Xuα/2nσ0μ0>X+uα/2nσ0}(10)
对比式 ( 9 ) (9) (9)和式 ( 10 ) (10) (10),可以发现,接受域和置信区间有相同的形式
所以我们可以这样理解置信区间: μ 0 \mu_0 μ0落在 μ \mu μ的置信水平为 1 − α 1-\alpha 1α的置信区间时,在显著性水平 α \alpha α下,没有理由拒绝 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0:μ=μ0

2.2 单样本正态总体方差的检验

均值假设检验统计量拒绝域
μ = μ 0 已 知 \mu=\mu_0已知 μ=μ0 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02H1:σ2=σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n ) } ∪ { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2<χ1α/22(n)}{χ2>χα/22(n)}
μ = μ 0 \mu=\mu_0 μ=μ0已知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2=σ02H1:σ2<σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\} {χ2<χ1α/22(n)}
μ = μ 0 \mu=\mu_0 μ=μ0已知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2=σ02H1:σ2>σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2>χα/22(n)}
μ = μ 0 \mu=\mu_0 μ=μ0已知 H 0 : σ 2 ≤ σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2σ02H1:σ2>σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 > χ α / 2 2 ( n ) } \{\chi^2\gt\chi^2_{\alpha/2}(n)\} {χ2>χα/22(n)}
μ = μ 0 \mu=\mu_0 μ=μ0已知 H 0 : σ 2 ≥ σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2σ02H1:σ2<σ02 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0 χ2=i=1n(Xiμ0)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n)\} {χ2<χ1α/22(n)}
μ \mu μ未知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02H1:σ2=σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } ∪ { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\}\cup\{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2<χ1α/22(n1)}{χ2>χα/22(n1)}
μ \mu μ未知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2=σ02H1:σ2<σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\} {χ2<χ1α/22(n1)}
μ \mu μ未知 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2=σ02H1:σ2>σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2>χα/22(n1)}
μ \mu μ未知 H 0 : σ 2 ≤ σ 0 2 ↔ H 1 : σ 2 > σ 0 2 H_0: \sigma^2\le\sigma^2_0\leftrightarrow H_1: \sigma^2\gt\sigma^2_0 H0:σ2σ02H1:σ2>σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 > χ α / 2 2 ( n − 1 ) } \{\chi^2\gt\chi^2_{\alpha/2}(n-1)\} {χ2>χα/22(n1)}
μ \mu μ未知 H 0 : σ 2 ≥ σ 0 2 ↔ H 1 : σ 2 < σ 0 2 H_0: \sigma^2\ge\sigma^2_0\leftrightarrow H_1: \sigma^2\lt\sigma^2_0 H0:σ2σ02H1:σ2<σ02 χ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 / σ 0 2 \chi^2=\sum\limits_{i=1}^n(X_i-\overline X)^2/\sigma^2_0 χ2=i=1n(XiX)2/σ02 { χ 2 < χ 1 − α / 2 2 ( n − 1 ) } \{\chi^2\lt\chi^2_{1-\alpha/2}(n-1)\} {χ2<χ1α/22(n1)}

μ = μ 0 \mu=\mu_0 μ=μ0时,求检验 H 0 : σ 2 = σ 0 2 ↔ H 1 : σ 2 ≠ σ 0 2 H_0: \sigma^2=\sigma^2_0\leftrightarrow H_1: \sigma^2\ne\sigma^2_0 H0:σ2=σ02H1:σ2=σ02的拒绝域为例。

μ = μ 0 \mu=\mu_0 μ=μ0已知时, ∑ i = 1 n ( X i − μ 0 ) 2 \sum\limits_{i=1}^n(X_i-\mu_0)^2 i=1n(Xiμ0)2 σ 2 \sigma^2 σ2的一个很好的点估计,且当 H 0 H_0 H0成立时, ∑ i = 1 n ( X i − μ 0 ) 2 / σ 0 2 ∼ χ 2 ( n ) \sum\limits_{i=1}^n(X_i-\mu_0)^2/\sigma^2_0\sim \chi^2(n) i=1n(Xiμ0)2/σ02χ2(n),于是,可以选取统计量为 χ 2 = ∑ i = 1 n ( X i − μ 0 ) 2 σ 0 2 (11) \chi^2=\frac{\sum\limits_{i=1}^n(X_i-\mu_0)^2}{\sigma^2_0}\tag{11} χ2=σ02i=1n(Xiμ0)2(11)
另外,由备择假设的形式可知其拒绝域为 W = { χ 2 < c 1 } ∪ { χ 2 > c 2 } (12) W=\{\chi^2\lt c_1\}\cup\{\chi^2\gt c_2\}\tag{12} W={χ2<c1}{χ2>c2}(12)
其中, c 1 , c 2 c_1, c_2 c1,c2为两个待定的常数,且由检验的显著性水平 α \alpha α来确定,即它们满足 P H 0 { χ 2 < c 1 } + P H 0 { χ 2 > c 2 } ≤ α (13) P_{H_0}\{\chi^2\lt c_1\}+P_{H_0}\{\chi^2\gt c_2\}\le\alpha\tag{13} PH0{χ2<c1}+PH0{χ2>c2}α(13)
由于 χ 2 \chi^2 χ2分布的图像并不是对称的,所以 c 1 , c 2 c_1, c_2 c1,c2不能直接确定。于是,一个常用的方法是如下选取 c 1 , c 2 c_1, c_2 c1,c2 P H 0 { χ 2 < c 1 } ≤ α / 2 , P H 0 { χ 2 > c 2 } ≤ α / 2 (14) P_{H_0}\{\chi^2\lt c_1\}\le\alpha/2, P_{H_0}\{\chi^2\gt c_2\}\le\alpha/2\tag{14} PH0{χ2<c1}α/2,PH0{χ2>c2}α/2(14)

这样可以保证第一类错误概率为 α \alpha α的情况下,第二类错误概率最小

从而可以得到 c 1 = χ 1 − α / 2 2 ( n ) , c 2 = χ α / 2 2 ( n ) c_1=\chi^2_{1-\alpha/2}(n), c_2=\chi^2_{\alpha/2}(n) c1=χ1α/22(n),c2=χα/22(n)

三、两样本正态总体参数的显著性检验

X 1 , ⋯ , X m X_1,\cdots,X_m X1,,Xm为来自正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma^2_1) N(μ1,σ12) I I D IID IID样本, Y 1 , ⋯ , Y n Y_1,\cdots,Y_n Y1,,Yn为来自正态总体 N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma^2_2) N(μ2,σ22) I I D IID IID样本,且两样本是独立的。

3.1 两样本正态总体均值的显著性检验

方差假设检验统计量拒绝域
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2 U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(XY)/σ12/m+σ22/n { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {U>uα/2}
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1μ2H1:μ1>μ2 U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(XY)/σ12/m+σ22/n { U > u α } \{U\gt u_{\alpha}\} {U>uα}
σ 1 2 , σ 2 2 \sigma^2_1, \sigma^2_2 σ12,σ22已知 H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1μ2H1:μ1<μ2 U = ( X ‾ − Y ‾ ) / σ 1 2 / m + σ 2 2 / n U=(\overline X-\overline Y)/\sqrt{\sigma^2_1/m+\sigma^2_2/n} U=(XY)/σ12/m+σ22/n { U < − u α } \{ U\lt -u_{\alpha}\} {U<uα}
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2 T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n) (XY)/Smn2 { ∣ T ∣ > t α / 2 ( m + n − 2 ) } \{\mid T\mid\gt t_{\alpha/2}(m+n-2)\} {T>tα/2(m+n2)}
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1μ2H1:μ1>μ2 T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n) (XY)/Smn2 { T > t α ( m + n − 2 ) } \{T\gt t_{\alpha}(m+n-2)\} {T>tα(m+n2)}
σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知 H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1μ2H1:μ1<μ2 T = m n / ( m + n ) ( X ‾ − Y ‾ ) / S m n ∗ 2 T=\sqrt{mn/(m+n)}(\overline X-\overline Y)/S_{mn}^{*2} T=mn/(m+n) (XY)/Smn2 { T < − t α ( m + n − 2 ) } \{T\lt -t_{\alpha}(m+n-2)\} {T<tα(m+n2)}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2 U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(XY)/S1m2/m+S2n2/n { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} {U>uα/2}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1μ2H1:μ1>μ2 U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(XY)/S1m2/m+S2n2/n { U > u α } \{U\gt u_{\alpha}\} {U>uα}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较大 H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1μ2H1:μ1<μ2 U = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n U=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} U=(XY)/S1m2/m+S2n2/n { U < − u α } \{ U\lt -u_{\alpha}\} {U<uα}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2 T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(XY)/S1m2/m+S2n2/n { ∣ T ∣ > t α / 2 ( r ) } \{\mid T\mid\gt t_{\alpha/2}(r)\} {T>tα/2(r)}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 H 0 : μ 1 ≤ μ 2 ↔ H 1 : μ 1 > μ 2 H_0:\mu_1\le\mu_2\leftrightarrow H_1:\mu_1\gt\mu_2 H0:μ1μ2H1:μ1>μ2 T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(XY)/S1m2/m+S2n2/n { T > t α ( r ) } \{T\gt t_{\alpha}(r)\} {T>tα(r)}
σ 1 2 \sigma^2_1 σ12, σ 2 2 \sigma^2_2 σ22未知,且 m , n m, n m,n都比较小 H 0 : μ 1 ≥ μ 2 ↔ H 1 : μ 1 < μ 2 H_0:\mu_1\ge\mu_2\leftrightarrow H_1:\mu_1\lt\mu_2 H0:μ1μ2H1:μ1<μ2 T = ( X ‾ − Y ‾ ) / S 1 m 2 / m + S 2 n 2 / n T=(\overline X-\overline Y)/\sqrt{S_{1m}^2/m+S_{2n}^2/n} T=(XY)/S1m2/m+S2n2/n { T < − t α ( r ) } \{T\lt -t_{\alpha}(r)\} {T<tα(r)}

其中, S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 n ( Y i − Y ‾ ) 2 m + n (15) S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{15} Smn2=m+ni=1m(XiX)2+i=1n(YiY)2(15) r = S m n 4 S 1 m 4 m 2 ( m − 1 ) + S 2 n 4 n 2 ( n − 1 ) (16) r=\frac{S_{mn}^4}{\frac{S_{1m}^4}{m^2(m-1)}+\frac{S_{2n}^4}{n^2(n-1)}}\tag{16} r=m2(m1)S1m4+n2(n1)S2n4Smn4(16)
其中 S m n 2 = S 1 m 2 m + S 2 n 2 n S_{mn}^2=\frac{S_{1m}^2}{m}+\frac{S_{2n}^2}{n} Smn2=mS1m2+nS2n2

σ 1 2 = σ 2 2 \sigma^2_1=\sigma^2_2 σ12=σ22未知,求解检验 H 0 : μ 1 = μ 2 ↔ H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2\leftrightarrow H_1:\mu_1\ne\mu_2 H0:μ1=μ2H1:μ1=μ2的拒绝域为例进行说明:

由于 X ‾ \overline X X Y ‾ \overline Y Y分别是 μ 1 \mu_1 μ1 μ 2 \mu_2 μ2的一个很好的点估计,故可用 X ‾ − Y ‾ \overline X-\overline Y XY来反映 μ 1 \mu_1 μ1 μ 2 \mu_2 μ2的区别。考虑到假设的特点,我们知道,当 ∣ X ‾ − Y ‾ ∣ ≥ c \mid \overline X-\overline Y\mid\ge c XYc时,有理由拒绝 H 0 H_0 H0,其中常数 c c c由此检验犯第一类错误的概率 α \alpha α决定。

H 0 H_0 H0成立时, X ‾ − Y ‾ ∼ N ( 0 , m + n m n σ 2 ) \overline X-\overline Y\sim N(0,\frac{m+n}{mn}\sigma^2) XYN(0,mnm+nσ2),其中 σ 2 \sigma^2 σ2未知。此时可利用总的样本方差 S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 n ( Y i − Y ‾ ) 2 m + n (17) S_{mn}^{*2}=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2+\sum\limits_{i=1}^n(Y_i-\overline Y)^2}{m+n}\tag{17} Smn2=m+ni=1m(XiX)2+i=1n(YiY)2(17)来估计 σ 2 \sigma^2 σ2,且在 H 0 H_0 H0成立时, ( m + n − 2 ) S m n ∗ 2 / σ 2 ∼ χ 2 ( m + n − 2 ) (m+n-2)S_{mn}^{*2}/\sigma^2\sim\chi^2(m+n-2) (m+n2)Smn2/σ2χ2(m+n2)(详情见数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布))。

于是,一个自然的检验统计量为 T = ( X ‾ − Y ‾ ) / [ σ ( m + n ) / m n ] ( m + n − 2 ) S m n ∗ 2 / [ σ 2 ( m + n − 2 ) ] = m n m + n X ‾ − Y ‾ S m n ∗ (18) T=\frac{(\overline X-\overline Y)/[\sigma\sqrt{(m+n)/mn}]}{\sqrt{(m+n-2)S_{mn}^{*2}/[\sigma^2(m+n-2)]}}=\frac{mn}{m+n}\frac{\overline X-\overline Y}{S_{mn}^*}\tag{18} T=(m+n2)Smn2/[σ2(m+n2)] (XY)/[σ(m+n)/mn ]=m+nmnSmnXY(18)
且当 H 0 H_0 H0成立时, T ∼ t ( m + n − 2 ) T\sim t(m+n-2) Tt(m+n2),所以在显著性水平为 α \alpha α下,可以得到拒绝域为: { ∣ T ∣ > t α / 2 ( m + n − 2 ) } (19) \{\mid T\mid\gt t_{\alpha/2}(m+n-2)\}\tag{19} {T>tα/2(m+n2)}(19)

3.2 两样本正态总体方差的显著性检验

均值假设检验统计量拒绝域
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 H 0 : σ 1 2 = σ 2 2 ↔ H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2 H0:σ12=σ22H1:σ12=σ22 F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1n(Yiμ2)2/ni=1m(Xiμ1)2/m { F < F 1 − α / 2 ( m , n ) } ∪ { F > F α / 2 ( m , n ) } \{F\lt F_{1-\alpha/2}(m,n)\}\cup\{F\gt F_{\alpha/2}(m,n)\} {F<F1α/2(m,n)}{F>Fα/2(m,n)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 H 0 : σ 1 2 ≤ σ 2 2 ↔ H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2 H0:σ12σ22H1:σ12>σ22 F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1n(Yiμ2)2/ni=1m(Xiμ1)2/m { F > F α ( m , n ) } \{F\gt F_{\alpha}(m,n)\} {F>Fα(m,n)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2已知 H 0 : σ 1 2 ≥ σ 2 2 ↔ H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2 H0:σ12σ22H1:σ12<σ22 F = ∑ i = 1 m ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum\limits_{i=1}^m(X_i-\mu_1)^2/m}{\sum\limits_{i=1}^n(Y_i-\mu_2)^2/n} F=i=1n(Yiμ2)2/ni=1m(Xiμ1)2/m { F < F 1 − α ( m , n ) } \{F\lt F_{1-\alpha}(m,n)\} {F<F1α(m,n)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 H 0 : σ 1 2 = σ 2 2 ↔ H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2\leftrightarrow H_1:\sigma_1^2\ne\sigma_2^2 H0:σ12=σ22H1:σ12=σ22 F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1n(YiY)2/(n1)i=1m(XiX)2/(m1) { F < F 1 − α / 2 ( m − 1 , n − 1 ) } ∪ { F > F α / 2 ( m − 1 , n − 1 ) } \{F\lt F_{1-\alpha/2}(m-1,n-1)\}\cup\{F\gt F_{\alpha/2}(m-1,n-1)\} {F<F1α/2(m1,n1)}{F>Fα/2(m1,n1)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 H 0 : σ 1 2 ≤ σ 2 2 ↔ H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2\le\sigma_2^2\leftrightarrow H_1:\sigma_1^2\gt\sigma_2^2 H0:σ12σ22H1:σ12>σ22 F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1n(YiY)2/(n1)i=1m(XiX)2/(m1) { F > F α ( m − 1 , n − 1 ) } \{F\gt F_{\alpha}(m-1,n-1)\} {F>Fα(m1,n1)}
μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2未知 H 0 : σ 1 2 ≥ σ 2 2 ↔ H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\ge\sigma_2^2\leftrightarrow H_1:\sigma_1^2\lt\sigma_2^2 H0:σ12σ22H1:σ12<σ22 F = ∑ i = 1 m ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum\limits_{i=1}^m(X_i-\overline X)^2/(m-1)}{\sum\limits_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=i=1n(YiY)2/(n1)i=1m(XiX)2/(m1) { F < F 1 − α ( m − 1 , n − 1 ) } \{F\lt F_{1-\alpha}(m-1,n-1)\} {F<F1α(m1,n1)}

四、似然比检验

4.1 相关定义

4.1.1 似然比统计量

X 1 , ⋯ , X n X_1,\cdots,X_n X1,,Xn为来自分布族 F = { f ( x , θ ) : θ ∈ Θ } \mathcal F=\{f(x,\theta):\theta\in\Theta\} F={f(x,θ):θΘ} I I D IID IID样本,对于假设 H 0 : θ ∈ Θ ↔ H 1 : θ ∈ Θ 1 = Θ − θ 0 (20) H_0:\theta\in\Theta\leftrightarrow H_1:\theta\in\Theta_1=\Theta-\theta_0\tag{20} H0:θΘH1:θΘ1=Θθ0(20)
λ ( X ) = sup ⁡ θ ∈ Θ 0 f ( X , θ ) sup ⁡ θ ∈ Θ f ( X , θ ) (21) \lambda(\bm X)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm X,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm X,\theta)}\tag{21} λ(X)=θΘsupf(X,θ)θΘ0supf(X,θ)(21)
则称统计量 λ ( X ) \lambda(\bm X) λ(X)为假设 ( 20 ) (20) (20)似然比,也称为广义似然比

λ ( X ) \lambda(\bm X) λ(X)的定义不难看出,如果 λ ( X ) \lambda(\bm X) λ(X)的值很小,则说明 θ ∈ Θ 0 \theta\in\Theta_0 θΘ0的可能性要比 θ ∈ Θ \theta\in\Theta θΘ的可能性小,于是我们有理由认为 H 0 H_0 H0不成立。这样就有如下的似然比检验。

4.1.2 似然比检验

采用 ( 21 ) (21) (21)式的似然比统计量 λ ( X ) \lambda(\bm X) λ(X)作为假设 ( 20 ) (20) (20)的检验统计量,且取其拒绝域为 { λ ( x ) ≤ c } \{\lambda(\bm x)\le c\} {λ(x)c},其中临界值 c c c满足 P θ { λ ( X ) ≤ c } ≤ α , ∀ θ ∈ Θ 0 (22) P_{\theta}\{\lambda(\bm X)\le c\}\le \alpha, \forall\theta\in\Theta_0\tag{22} Pθ{λ(X)c}α,θΘ0(22)
则称此检验为显著性水平为 α \alpha α的似然比检验。

如果似然比统计量的零分布未知,则很难确定似然比检验的临界值。但如果此时存在一个统计量 T ( X ) T(\bm X) T(X)关于似然比统计量式单调的且零分布已知,则可以给出一个基于 T ( X ) T(\bm X) T(X)的显著性检验。

4.2 例子

X 1 , ⋯ , X n X_1,\cdots,X_n X1,,Xn是来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) I I D IID IID样本, μ , σ 2 \mu,\sigma^2 μ,σ2均未知。试求假设 H 0 : μ = μ 0 ↔ H 1 μ ≠ μ 0 H_0:\mu=\mu_0\leftrightarrow H_1\mu\ne\mu_0 H0:μ=μ0H1μ=μ0的显著性水平为 α \alpha α的似然比检验。


此时样本分布为 f ( x , θ ) = ( 2 π σ 2 ) − n / 2 exp ⁡ [ − 1 2 σ 2 ∑ i = 1 n ( X i − μ ) 2 ] f(\bm x, \theta)=(2\pi\sigma^2)^{-n/2}\exp[-\frac{1}{2\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2] f(x,θ)=(2πσ2)n/2exp[2σ21i=1n(Xiμ)2] Θ 0 = { ( μ 0 , σ 2 ) : σ 2 > 0 } \Theta_0=\{(\mu_0,\sigma^2):\sigma^2\gt0\} Θ0={(μ0,σ2):σ2>0} Θ = { ( μ , σ 2 ) : μ ∈ R , σ 2 > 0 } \Theta=\{(\mu,\sigma^2):\mu\in\bm R, \sigma^2\gt0\} Θ={(μ,σ2):μR,σ2>0}
则似然比统计量为 λ ( x ) = sup ⁡ θ ∈ Θ 0 f ( x , θ ) sup ⁡ θ ∈ Θ f ( x , θ ) = [ ∑ i = 1 n ( x i − x ‾ ) 2 ∑ i = 1 n ( x i − μ 0 ) 2 ] n / 2 = ( 1 + T 2 n − 1 ) − n / 2 \lambda(\bm x)=\frac{\sup\limits_{\theta\in\Theta_0}f(\bm x,\theta)}{\sup\limits_{\theta\in\Theta}f(\bm x,\theta)}=[\frac{\sum\limits_{i=1}^n(x_i-\overline x)^2}{\sum\limits_{i=1}^n(x_i-\mu_0)^2}]^{n/2}=(1+\frac{T^2}{n-1})^{-n/2} λ(x)=θΘsupf(x,θ)θΘ0supf(x,θ)=[i=1n(xiμ0)2i=1n(xix)2]n/2=(1+n1T2)n/2
其中, T = n ( x ‾ − μ 0 ) S n T=\frac{\sqrt n(\overline x-\mu_0)}{S_n} T=Snn (xμ0)
所以此时的似然比统计量与传统的 t t t统计量的平方成反比,于是,两个检验统计量的拒绝域有如下关系: { λ ( x ) ≤ c } ⇔ { ∣ T ( x ) ∣ ≥ d } (23) \{\lambda(\bm x)\le c\}\Leftrightarrow\{\mid T(\bm x)\mid\ge d\}\tag{23} {λ(x)c}{T(x)d}(23)
所以,此时的似然比检验与双侧 t t t检验完全等价

五、p值

详见杂记——假设检验中p值的理解

这篇关于数理统计复习笔记五——假设检验之显著性检验的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/932694

相关文章

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓

忽略某些文件 —— Git 学习笔记 05

忽略某些文件 忽略某些文件 通过.gitignore文件其他规则源如何选择规则源参考资料 对于某些文件,我们不希望把它们纳入 Git 的管理,也不希望它们总出现在未跟踪文件列表。通常它们都是些自动生成的文件,比如日志文件、编译过程中创建的临时文件等。 通过.gitignore文件 假设我们要忽略 lib.a 文件,那我们可以在 lib.a 所在目录下创建一个名为 .gi

取得 Git 仓库 —— Git 学习笔记 04

取得 Git 仓库 —— Git 学习笔记 04 我认为, Git 的学习分为两大块:一是工作区、索引、本地版本库之间的交互;二是本地版本库和远程版本库之间的交互。第一块是基础,第二块是难点。 下面,我们就围绕着第一部分内容来学习,先不考虑远程仓库,只考虑本地仓库。 怎样取得项目的 Git 仓库? 有两种取得 Git 项目仓库的方法。第一种是在本地创建一个新的仓库,第二种是把其他地方的某个

Git 的特点—— Git 学习笔记 02

文章目录 Git 简史Git 的特点直接记录快照,而非差异比较近乎所有操作都是本地执行保证完整性一般只添加数据 参考资料 Git 简史 众所周知,Linux 内核开源项目有着为数众多的参与者。这么多人在世界各地为 Linux 编写代码,那Linux 的代码是如何管理的呢?事实是在 2002 年以前,世界各地的开发者把源代码通过 diff 的方式发给 Linus,然后由 Linus