t检验全析

2024-02-01 08:32
文章标签 检验 全析

本文主要是介绍t检验全析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 两个分布
    • $chi^2$分布
    • t分布
  • 三个关键点
  • 一个重点式子
  • t-检验

两个分布

c h i 2 chi^2 chi2分布

设独立同分布的随机变量 X 1 , X 2 , . . . X n ∼ N ( 0 , 1 ) X_1, X_2, ...X_n \sim N(0, 1) X1,X2,...XnN(0,1)
X = ∑ i = 1 n X i 2 ( 1 ) X = \sum\limits_{i = 1}^{n}X_i^2 \qquad (1) X=i=1nXi2(1)
则称X是自由度为n的 χ 2 \chi^2 χ2随机变量。

t分布

X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X\sim N(0 ,1), Y \sim \chi^2(n) XN(0,1),Yχ2(n), 且X,Y独立,称:
T = X T / n ( 2 ) T = \frac{X}{\sqrt{T/ n}} \qquad (2) T=T/n X(2)
为自由度为n的t变量,其分布称为自由度为n的t分布。

三个关键点

设独立同分布的随机变量 X 1 , X 2 . . . X n ∼ N ( μ , σ 2 ) X_1, X_2... X_n \sim N(\mu, \sigma^2) X1,X2...XnN(μ,σ2)

(3) X ˉ ∼ N ( μ , σ 2 n ) \bar{X}\sim N(\mu, \frac{\sigma^2}{n})\qquad XˉN(μ,nσ2)

(4) ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n1)S2χ2(n1)

(5) X ˉ 和 S 2 独 立 \bar{X}和S^2独立 XˉS2

一个重点式子

X = X ˉ − μ S n ∼ t ( n − 1 ) ( 6 ) X = \frac{\bar X - \mu}{\frac{S}{\sqrt{n}}}\sim t(n-1) \qquad (6) X=n SXˉμt(n1)(6)

由(3)式:
X ˉ − μ σ n ∼ N ( 0 , 1 ) ( 3 ) \frac{\bar{X}- \mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0 ,1) \qquad (3) n σXˉμN(0,1)(3)
由(4)式, 令
Y = ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) ( 4 ) Y = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) \qquad (4) Y=σ2(n1)S2χ2(n1)(4)
∴ X Y / ( n − 1 ) ∼ t ( n − 1 ) ( 7 ) \therefore\frac{X}{\sqrt{Y/(n-1)}} \sim t(n-1) \qquad(7) Y/(n1) Xt(n1)(7)
代入(3)、(4)式,得:
X ˉ − μ σ n ( n − 1 ) S 2 σ 2 / ( n − 1 ) ∼ t ( n − 1 ) ( 8 ) \frac{\frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}}}{\frac{(n-1)S^2}{\sigma^2}/ (n-1)} \sim t(n-1) \qquad(8) σ2(n1)S2/(n1)n σXˉμt(n1)(8)
化简得(6):
X ˉ − μ S n ∼ t ( n − 1 ) \frac{\bar{X} - \mu}{\frac{S}{\sqrt{n}}} \sim t(n-1) \qquad n SXˉμt(n1)

t-检验

QoG2012.csv 数据集中有一列反映了各个国家的gdp。我们使用这一列数据进行假设检验。
首先要明白的是假设检验是一种反证的方法,也就是

在假定原假设正确的基础上进行推理

原假设( H 0 H_0 H0): \qquad μ = 10000 \mu = 10000 μ=10000
备择假设( H 1 H_1 H1): \quad μ ≠ 10000 \mu\neq10000 μ̸=10000

# 导入readr包
library(readr)
library(dplyr)
# 载入data
world_data = read.csv("D://pdf//ucl//day3//day3//QoG2012.csv")
# 对world_data 进行总结
summary(world_data)
# tansform the judiciary to factor
world_data$judiciary <- factor(world_data$judiciary, levels = c(0, 1), labels = c('controled', 'free'))
#transform the former_col to factor
world_data$former_col <- factor(world_data$former_col, levels = c(0, 1), labels = c('no', 'yes'))
# calculate the mean of gdp
gdp_mean = mean(world_data$gdp, na.rm = TRUE)

[1] 10184.09
在这里, gdp_mean就是公式(6)中 X ˉ \bar{X} Xˉ

# calculate se
se <- sd(world_data$gdp, na.rm = TRUE) / sqrt(n)
se

[1] 922.7394
在这里,se就是公式(6)中的 S n \frac{S}{\sqrt{n}} n S

由(6)式:
可以计算得到t.value

t.value <- (gdp_mean - 10000) / se
t.value

[1] 0.1995059

在这里插入图片描述

# p-value calculation
2*(1 - pt(t.value, df = (n-1)))

[1] 0.842
pt 函数是t分布的分布函数,df是自由度,由(6)式,符合t(n-1)分布,所以df =n-1
p t ( t . v a l u e , d f = n − 1 ) = ∫ − ∞ t . v a l u e t ( n − 1 ) ( x ) d x pt(t.value, df = n -1) = \int_{-\infty}^{t.value} t_{(n-1)}(x)dx pt(t.value,df=n1)=t.valuet(n1)(x)dx
1 − p t ( t . v a l u e , d f = n − 1 ) 1 - pt(t.value, df = n-1) 1pt(t.value,df=n1) 是右边的尾部,由于是双侧检验,所以
p-value = 2*(1 - pt(t.value, df = n-1))

与三种显著性标准进行比较,发现p-value很大,比0.05的显著性标准还大。
p-value反映的是:
发生比当前情况更加极端情况的概率
可以发现发生比当前情况极端情况的概率是0.842, 也就是说当前情况很容易发生,所以
不能拒绝原假设,也就是说不能够拒绝 μ = 10000 \mu = 10000 μ=10000

后记:
证明(3):
预备知识:
E ( c X ) = c E ( X ) E(cX) = cE(X) E(cX)=cE(X)
D ( c X ) = c 2 D ( X ) D(cX) = c^2D(X) D(cX)=c2D(X)
由: X ˉ = ∑ i n X i n \bar{X}=\frac{\sum\limits_i^{n}X_i}{n} Xˉ=ninXi
E ( X ˉ ) = E ( ∑ i n X i n ) E(\bar{X})=E(\frac{\sum\limits_i^{n}X_i}{n}) E(Xˉ)=E(ninXi)

s = 1 n E ( ∑ i n X i ) ( 9 ) =\frac{1}{n}E(\sum\limits_i^{n}X_i) \qquad(9) =n1E(inXi)(9)
由于 X 1 , X 2 . . . X n X_1, X_2...X_n X1,X2...Xn是独立同分布的正态变量。由期望线性性

所以(9)式可化简为:
1 n n E ( X ) \frac{1}{n}n E(X) n1nE(X)
= E ( X ) ( 10 ) =E(X) \qquad (10) =E(X)(10)
E ( X ) = μ E(X) = \mu E(X)=μ,所以 E ( X ˉ ) E(\bar{X}) E(Xˉ)

D ( X ˉ ) D(\bar{X}) D(Xˉ)
= D ( ∑ i n X i n ) = D(\frac{\sum\limits_i^{n}X_i}{n}) =D(ninXi)
= 1 n 2 D ( ∑ i n X i ) = \frac{1}{n^2}D(\sum\limits_i^nX_i) =n21D(inXi)
= 1 n 2 n D ( X ) = \frac{1}{n^2}nD(X) =n21nD(X)
= 1 n D ( X ) = \frac{1}{n}D(X) =n1D(X)
即证。

这篇关于t检验全析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/666685

相关文章

2024年高教社杯数学建模国赛最后一步——结果检验-事关最终奖项

2024年国赛已经来到了最后一天,有必要去给大家讲解一下,我们不需要过多的去关注模型的结果,因为模型的结果的分值设定项最多不到20分。但是如果大家真的非常关注的话,那有必要给大家讲解一下论文结果相关的问题。很多的论文,上至国赛优秀论文下至不获奖的论文并不是所有的论文都可以进行完整的复现求解,大部分数模论文都为存在一个灰色地带。         白色地带即认为所有的代码均可运行、公开

【2024高教社杯国赛C题】数学建模国赛建模过程+完整代码论文全解全析

你是否在寻找数学建模比赛的突破点?数学建模进阶思路! 作为经验丰富的数学建模团队,我们将为你带来2024国赛数学建模竞赛(C题)的全面解析。这个解决方案包不仅包括完整的代码实现,还有详尽的建模过程和解析,帮助你全面理解并掌握如何解决类似问题。 完整内容在文章末尾阅读全文获取! C题的第一问是: 假定各种农作物未来的预期销售量、种植成本、亩产量和销售价格相对于 2023 年保持稳定,每季

医院检验系统LIS源码,LIS系统的定义、功能结构以及样本管理的操作流程

本文将对医院检验系统LIS进行介绍,包括LIS系统的定义、功能结构以及样本管理的操作流程方面。 LIS系统定义 LIS系统(Laboratory Information System)是一种专门为临床检验实验室开发的信息管理系统,其主要功能包括实验室信息管理、样本管理、检验结果管理、质量控制管理、数据分析等。其主要作用是管理医院实验室的各项业务,包括样本采集、检验、结果录入和报告生成等。Li

【2024高教社杯国赛A题】数学建模国赛建模过程+完整代码论文全解全析

你是否在寻找数学建模比赛的突破点?数学建模进阶思路! 作为经验丰富的数学建模团队,我们将为你带来2024国赛数学建模竞赛(A题)的全面解析。这个解决方案包不仅包括完整的代码实现,还有详尽的建模过程和解析,帮助你全面理解并掌握如何解决类似问题。 完整内容在文章末尾阅读全文获取! 【2024国赛A题】高教杯全国大学生数学建模国赛建模过程+完整代码论文全解全析已经完成 问题 1是给定舞龙队初

2024 高教社杯 数学建模国赛 (E题)深度剖析|交通流量管控|数学建模完整代码+建模过程全解全析

当大家面临着复杂的数学建模问题时,你是否曾经感到茫然无措?作为2022年美国大学生数学建模比赛的O奖得主,我为大家提供了一套优秀的解题思路,让你轻松应对各种难题! CS团队倾注了大量时间和心血,深入挖掘解决方案。通过数值模拟,蒙特卡罗模拟、风险评估模型等算法,设计了明晰的项目,团队努力体现在每个步骤,确保方案既创新又可行,为大家提供了全面而深入的洞见噢~ 让我们来看看国赛(E题)! 完整内容可

【2024国赛C题】高教杯全国大学生数学建模国赛建模过程+完整代码论文全解全析

完整内容在文章末尾阅读全文获取! 问题 1是针对不同情况下,该乡村未来几年农作物的最优种植方案的研究。 为解决这个数学建模问题,我们需要构建一个优化模型,考虑到各种限制条件和目标函数。以下是解决问题的步骤: 问题分析 目标: (1) 最大化种植收益,避免滞销。 (2) 最大化种植收益,允许超出部分降价销售。 约束条件: 各类地块适合不同作物,不能重茬种植。 三年内至少种

2024 高教社杯 数学建模国赛 (A题)深度剖析|“板凳龙” 闹元宵|数学建模完整代码+建模过程全解全析

当大家面临着复杂的数学建模问题时,你是否曾经感到茫然无措?作为2022年美国大学生数学建模比赛的O奖得主,我为大家提供了一套优秀的解题思路,让你轻松应对各种难题! CS团队倾注了大量时间和心血,深入挖掘解决方案。通过数值模拟,不等式约束等算法,设计了明晰的项目,团队努力体现在每个步骤,确保方案既创新又可行,为大家提供了全面而深入的洞见噢~ 让我们来看看国赛(A题)! 完整内容可以在文章末尾领取

2024 高教社杯 数学建模国赛 (B题)深度剖析|生产过程中的决策问题|数学建模完整代码+建模过程全解全析

当大家面临着复杂的数学建模问题时,你是否曾经感到茫然无措?作为2022年美国大学生数学建模比赛的O奖得主,我为大家提供了一套优秀的解题思路,让你轻松应对各种难题! CS团队倾注了大量时间和心血,深入挖掘解决方案。通过贝叶斯分析、决策树分析、整数规划等算法,设计了明晰的项目,团队努力体现在每个步骤,确保方案既创新又可行,为大家提供了全面而深入的洞见噢~ 让我们来看看国赛(B题)! 完整内容可以在

Springboot中基于X509完成SSL检验的原理与实践

前言 各位对HTTPS不陌生吧?几乎涉及安全的领域,均要求通过HTTPS协议进行数据传输。而在传输过程中,又涉及到了SSL证书的使用。既然提到了SSL证书,那咱们先了解了解什么是SSL证书: SSL证书通过在客户端浏览器和Web服务器之间建立一条SSL安全通道(Secure socket layerSSL,安全套接层)安全协议是由Netscape Communication公司设计开发。该安

[转载]t检验、t分布、t值

1. t检验的历史   阿瑟·健力士公司(Arthur Guinness Son Co.)是一家由阿瑟·健力士(Arthur Guinness)于1759年在爱尔兰都柏林建立的一家酿酒公司:   不过它最出名的却不是啤酒,而是《吉尼斯世界纪录大全》:   1951年11月10日,健力士酒厂的董事休·比佛爵士(Sir Hugh Beaver)在爱尔兰韦克斯福德郡打猎时,因为没打中金鸻,于