【知识管理】统计检验的方法χ²测试,双侧两样本t检验,Whitney–Mann U检验,单侧配对t检验(One-Sided Paired T-Test)

本文主要是介绍【知识管理】统计检验的方法χ²测试,双侧两样本t检验,Whitney–Mann U检验,单侧配对t检验(One-Sided Paired T-Test),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这段描述提到了几种统计检验方法,它们在MATLAB中的实现用于比较不同组之间的性别、年龄、教育背景和临床认知分数的差异,以及比较模型在内部验证中的性能。下面将详细介绍每种方法:

1. χ²测试(Chi-Square Test)

  • 用途:χ²测试用于比较分类变量的观察值与期望值之间的差异,常用于检验两个或多个类别变量之间是否独立。
  • 场景:在这个上下文中,χ²测试通过chi2test在MATLAB中实现,用于测试不同组之间性别分布的差异。
  • 实现:在MATLAB中,你可以使用chi2test函数(假设这里是一个泛用描述,实际上MATLAB使用crosstabchi2gof函数进行χ²检验)来进行χ²检验,输入通常包括每个组中不同性别的频数。

2. 双侧两样本t检验(Two-Sided Two-Sample T-Test)

  • 用途:双侧两样本t检验用于比较两个独立样本的均值是否存在显著差异,假设数据符合正态分布。
  • 场景:在此场景中,使用ttest2函数在MATLAB中执行双侧两样本t检验,用于测试不同组之间年龄、教育和临床认知分数的差异。
  • 实现:在MATLAB中,ttest2函数接收两个向量(代表两组数据)作为输入,并返回是否拒绝了两个样本均值相等的零假设。

3. Whitney–Mann U检验(也称为曼-惠特尼U检验)

  • 用途:当数据不符合正态分布时,使用曼-惠特尼U检验来比较两个独立样本的中位数是否存在显著差异。
  • 场景:在给定场景中,使用ranksum函数在MATLAB中执行曼-惠特尼U检验。
  • 实现ranksum函数在MATLAB中用于比较两个独立样本,它不要求数据符合正态分布,适用于非参数统计。

4. 单侧配对t检验(One-Sided Paired T-Test)

  • 用途:单侧配对t检验用于比较来自相关或配对样本的均值差异,比如同一组受试者在不同条件下的测量值。
  • 场景:在这个上下文中,使用ttest函数在MATLAB中进行单侧配对t检验,用于比较模型在内部验证中的性能差异。
  • 实现ttest函数在MATLAB中用于配对样本,检验配对差异的均值是否显著不为零(或任何指定的非零差异值)。单侧检验特别关注差异的方向,比如是否一个样本的均值显著高于另一个。

这些统计检验方法为研究者提供了强大的工具,以科学的方式分析和解释数据中的模式和差异,帮助做出基于数据的决策。在MATLAB中实现这些检验,使得处理和分析大量数据变得更加高效和准确。
当然可以,我会用更简单的语言来解释每种检验方法:

1. χ²测试(Chi-Square Test)

想象你有两个篮球队,想知道这两个队中男女球员的比例是否相同。χ²测试就像是帮你数数看,比较你观察到的男女比例和如果性别在队伍中完全随机分布时你期望看到的比例之间有没有显著差异。如果差异很大,χ²测试会告诉你这种差异不太可能只是偶然出现的。

2. 双侧两样本t检验(Two-Sided Two-Sample T-Test)

假设你想比较两个班级学生的数学成绩是否有差异,而这两个班级的学生数量可能不同。双侧两样本t检验就像是分别计算每个班级学生数学成绩的平均值,然后评估这两个平均值之间的差异是否足够大到可以认为这不仅仅是偶然出现的差异。双侧意味着你不关心哪个班级的平均成绩更高,只关心是否存在显著差异。

3. 曼-惠特尼U检验(Whitney–Mann U-test)

如果你有两批饼干,想知道哪一批更甜,但是饼干的甜度测量值分布很奇怪,不像正常的钟形曲线,这时你可以用曼-惠特尼U检验。这个测试不关心具体的甜度值,而是比较两批饼干中每一块饼干的甜度排名,看看是否一批饼干普遍比另一批更甜。这种方法不需要假设饼干甜度的分布情况,适用于更多类型的数据。

4. 单侧配对t检验(One-Sided Paired T-Test)

假设你想知道学生们喝了一种新的能量饮料后数学考试成绩是否有提高。你会先记录每个学生喝饮料前的成绩,然后让他们喝饮料,再记录喝了饮料后的成绩。单侧配对t检验就是用来看看喝了饮料后成绩提高了没有。因为你只关心成绩是否提高,这就是“单侧”的意思。配对t检验的“配对”是因为你是在比较同一个学生喝饮料前后的成绩变化。

这些检验方法提供了不同的工具来帮助我们理解和分析数据,了解数据中的模式是否有统计学上的显著性,以及如何根据数据做出决策。
当然,让我们看看这些统计检验的基本计算公式:

1. χ²测试(Chi-Square Test)

χ²测试的计算公式是:

[ \chi^2 = \sum \frac{(O - E)^2}{E} ]

其中:

  • (O) 表示观察频数(实际在数据中观察到的次数)。
  • (E) 表示期望频数(如果没有差异,预期会观察到的次数)。
  • 求和是对所有可能的类别进行。

2. 双侧两样本t检验(Two-Sided Two-Sample T-Test)

两样本t检验的计算公式是:

[ t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} ]

其中:

  • (\bar{x}_1) 和 (\bar{x}_2) 分别是两个样本的平均值。
  • (s_1^2) 和 (s_2^2) 分别是两个样本的方差。
  • (n_1) 和 (n_2) 分别是两个样本的大小(即样本中的观察数)。

3. 曼-惠特尼U检验(Whitney–Mann U-test)

曼-惠特尼U检验的计算较为复杂,不容易用一个简单的公式表示,因为它涉及到对数据的排序和排名。但是,其基本思想是:

  1. 将所有观察值合并并按从小到大排序。
  2. 对每个观察值赋予一个排名。
  3. 分别计算两个样本的排名和。
  4. 使用排名和来计算U统计量。

U统计量的计算方法为:

[ U = R - \frac{n(n+1)}{2} ]

其中:

  • (R) 是样本中观察值排名的和。
  • (n) 是该样本中的观察数。

4. 单侧配对t检验(One-Sided Paired T-Test)

配对t检验的计算公式是:

[ t = \frac{\bar{d}}{s_d / \sqrt{n}} ]

其中:

  • (\bar{d}) 是差异(前后测量值的差)的平均值。
  • (s_d) 是差异的标准差。
  • (n) 是差异的数量(即样本大小)。

这些公式提供了进行各种统计检验的数学基础,帮助我们确定数据集中的模式是否具有统计学意义。在实际应用中,这些计算通常由统计软件自动完成,如MATLAB、R或Python等。

当然,让我们通过一些简化的例子来解释这些公式:

1. χ²测试(Chi-Square Test)

假设我们有两个篮球队,想检查男女球员分布是否一致。球队A有60名球员,其中包括30名男性和30名女性;球队B有40名球员,其中20名男性和20名女性。

期望频数(E)是基于假设两个球队性别分布相同来计算的。所以,我们预期每个队男女各占一半。

  • 球队A的男性期望频数 = (60 \times \frac{1}{2} = 30)
  • 球队B的男性期望频数 = (40 \times \frac{1}{2} = 20)

观察频数(O)是实际观察到的频数,即球队A的男性30名,球队B的男性20名。

对于球队A的男性,χ²的计算为:((30 - 30)^2 / 30 = 0)

对于球队B的男性,χ²的计算也是:((20 - 20)^2 / 20 = 0)

最后,将所有类别的χ²值相加。在这个简化的例子中,χ²测试结果为0,表明观察频数与期望频数完全一致。

2. 双侧两样本t检验(Two-Sided Two-Sample T-Test)

假设我们想比较两个班级的数学成绩。班级1有5名学生,成绩分别为:90, 95, 85, 80, 75(平均值为85),班级2有5名学生,成绩分别为:70, 75, 65, 60, 55(平均值为65)。

  • 班级1的平均成绩 (\bar{x}_1 = 85)
  • 班级2的平均成绩 (\bar{x}_2 = 65)

假设两个班级成绩的方差分别为25和25,样本大小都是5。

t值的计算为:[ t = \frac{85 - 65}{\sqrt{\frac{25}{5} + \frac{25}{5}}} = \frac{20}{\sqrt{10}} = \frac{20}{3.16} = 6.33 ]

这个t值然后可以用来在t分布表中查找对应的P值,以判断这个差异是否统计显著。

3. 曼-惠特尼U检验(Whitney–Mann U-test)

假设两批饼干的甜度评分为:

  • 批次1:5, 6, 7
  • 批次2:1, 2, 3, 4

合并所有评分并排序:1, 2, 3, 4, 5, 6, 7。

分配排名,然后计算每个批次排名的和(批次1的排名和为12+13+14=39,批次2的排名和为1+2+3+4=10)。

计算U值较为复杂,需要比较两个批次的排名和。在这个简化的例子中,我们直接计算每个批次的U值,然后使用统计表来判断差异是否显著。

4. 单侧配对t检验(One-Sided Paired T-Test)

假设一个学生在前后两次考试的成绩为90分和95分,我们想知道这种提高是否具有统计意义。

  • 差异的平均值 (\bar{d} = 5)
  • 假设差异的标准差 (s_d = 0)(因为只有一对数据)
  • 样本大小 (n = 1)

计算t值:[ t = \frac{5}{0 / \sqrt{1}} = \infty ](实际情况中我们需要更多数据来进行这种类型的测试)

在实际研究中,我们会有多对数据,可以计算差异的平均值和标准差,然后使用这个公式来确定成绩提高是否具有统计意义。
确实,对于曼-惠特尼U检验和单侧配对t检验的示例可以进一步优化以提供更清晰的理解。让我们尝试用更合适的例子来解释这两种检验方法:

3. 曼-惠特尼U检验(Whitney–Mann U-test)

假设我们有两组学生参加了不同的教学方法的测试,我们想知道这两种教学方法是否对学生的成绩有不同的影响。第一组使用了传统教学方法,第二组使用了一种新的教学方法。学生的测试成绩如下:

  • 传统教学方法组:65, 70, 75, 80, 85
  • 新教学方法组:60, 65, 75, 80, 95

为了使用曼-惠特尼U检验比较这两组成绩,我们首先将所有成绩合并并排序,然后为每个成绩分配一个排名。接着,我们分别计算两组成绩的排名和。基于这些排名和,我们可以计算出U值,并根据U值使用统计表判断两组成绩是否有显著差异。

4. 单侧配对t检验(One-Sided Paired T-Test)

假设一个班级的10名学生在学期开始和学期末各参加了一次数学测试,我们想知道这个班级的数学成绩是否有显著提升。学生的成绩变化如下(学期末成绩减去学期开始成绩):

  • 成绩变化:2, 3, 1, 5, 4, 3, 2, 4, 3, 2

我们首先计算这些成绩变化的平均值和标准差。然后,我们使用单侧配对t检验来判断这个平均成绩变化是否显著大于0,也就是说,我们关注的是成绩提升的方向。如果t检验的结果显著,那么我们可以认为班级的数学成绩在统计上有显著提升。

在进行单侧配对t检验时,我们假设成绩变化的平均值是正数,并且想知道这种变化是否足够大以至于不太可能仅仅是偶然发生的。我们计算得到的t值和相应的P值会告诉我们成绩提升是否具有统计意义。

通过这两个更具体的例子,我们可以更清楚地理解曼-惠特尼U检验和单侧配对t检验是如何在实际情况中应用的,以及如何根据这些检验的结果来解释数据中的模式和差异。

这篇关于【知识管理】统计检验的方法χ²测试,双侧两样本t检验,Whitney–Mann U检验,单侧配对t检验(One-Sided Paired T-Test)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/765828

相关文章

macOS无效Launchpad图标轻松删除的4 种实用方法

《macOS无效Launchpad图标轻松删除的4种实用方法》mac中不在appstore上下载的应用经常在删除后它的图标还残留在launchpad中,并且长按图标也不会出现删除符号,下面解决这个问... 在 MACOS 上,Launchpad(也就是「启动台」)是一个便捷的 App 启动工具。但有时候,应

SpringBoot日志配置SLF4J和Logback的方法实现

《SpringBoot日志配置SLF4J和Logback的方法实现》日志记录是不可或缺的一部分,本文主要介绍了SpringBoot日志配置SLF4J和Logback的方法实现,文中通过示例代码介绍的非... 目录一、前言二、案例一:初识日志三、案例二:使用Lombok输出日志四、案例三:配置Logback一

Python实现无痛修改第三方库源码的方法详解

《Python实现无痛修改第三方库源码的方法详解》很多时候,我们下载的第三方库是不会有需求不满足的情况,但也有极少的情况,第三方库没有兼顾到需求,本文将介绍几个修改源码的操作,大家可以根据需求进行选择... 目录需求不符合模拟示例 1. 修改源文件2. 继承修改3. 猴子补丁4. 追踪局部变量需求不符合很

mysql出现ERROR 2003 (HY000): Can‘t connect to MySQL server on ‘localhost‘ (10061)的解决方法

《mysql出现ERROR2003(HY000):Can‘tconnecttoMySQLserveron‘localhost‘(10061)的解决方法》本文主要介绍了mysql出现... 目录前言:第一步:第二步:第三步:总结:前言:当你想通过命令窗口想打开mysql时候发现提http://www.cpp

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

MySQL INSERT语句实现当记录不存在时插入的几种方法

《MySQLINSERT语句实现当记录不存在时插入的几种方法》MySQL的INSERT语句是用于向数据库表中插入新记录的关键命令,下面:本文主要介绍MySQLINSERT语句实现当记录不存在时... 目录使用 INSERT IGNORE使用 ON DUPLICATE KEY UPDATE使用 REPLACE

CentOS 7部署主域名服务器 DNS的方法

《CentOS7部署主域名服务器DNS的方法》文章详细介绍了在CentOS7上部署主域名服务器DNS的步骤,包括安装BIND服务、配置DNS服务、添加域名区域、创建区域文件、配置反向解析、检查配置... 目录1. 安装 BIND 服务和工具2.  配置 BIND 服务3 . 添加你的域名区域配置4.创建区域

mss32.dll文件丢失怎么办? 电脑提示mss32.dll丢失的多种修复方法

《mss32.dll文件丢失怎么办?电脑提示mss32.dll丢失的多种修复方法》最近,很多电脑用户可能遇到了mss32.dll文件丢失的问题,导致一些应用程序无法正常启动,那么,如何修复这个问题呢... 在电脑常年累月的使用过程中,偶尔会遇到一些问题令人头疼。像是某个程序尝试运行时,系统突然弹出一个错误提

电脑提示找不到openal32.dll文件怎么办? openal32.dll丢失完美修复方法

《电脑提示找不到openal32.dll文件怎么办?openal32.dll丢失完美修复方法》openal32.dll是一种重要的系统文件,当它丢失时,会给我们的电脑带来很大的困扰,很多人都曾经遇到... 在使用电脑过程中,我们常常会遇到一些.dll文件丢失的问题,而openal32.dll的丢失是其中比较

python中字符串拼接的几种方法及优缺点对比详解

《python中字符串拼接的几种方法及优缺点对比详解》在Python中,字符串拼接是常见的操作,Python提供了多种方法来拼接字符串,每种方法有其优缺点和适用场景,以下是几种常见的字符串拼接方法,需... 目录1. 使用 + 运算符示例:优缺点:2. 使用&nbsjsp;join() 方法示例:优缺点:3