学习笔记|多样本单因素方差分析|事后比较|方差齐性|F检验|韦尔奇检验|两独立样本T检验|两样本方差分析|规范表达|《小白爱上SPSS》课程:SPSS第七讲 | 单因素方差分析怎么做?

本文主要是介绍学习笔记|多样本单因素方差分析|事后比较|方差齐性|F检验|韦尔奇检验|两独立样本T检验|两样本方差分析|规范表达|《小白爱上SPSS》课程:SPSS第七讲 | 单因素方差分析怎么做?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 单因素方差分析
    • 一、实战案例
    • 二、统计策略
    • 三、SPSS操作
      • 1、正态性检验
      • 2、单因素方差分析
      • Tips:事后比较
    • 四、结果解读
      • 第一、统计描述
      • 第二、方差齐性检验。
      • 第三、F检验结果
      • 第四、韦尔奇检验
      • 第五、多重均数比较结果。
    • 五、规范报告
      • 1、规范表格
      • 2、规范文字
    • 六、拓展阅读
      • 两独立样本T检验
      • 两样本方差分析
  • 划重点

学习目的

SPSS第七讲 | 单因素方差分析怎么做?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

单因素方差分析

前面我们学习过,两独立样本T检验主要用于两组连续型正态分布的数据比较。但如果需要比较多组(三组及以上)的连续型数据,T检验分析方法就不合适了。此时,必须要借助单因素方差分析(One Way ANOVA)。
方差分析用于检验三个或三个以上的样本均数是否存在差异,是统计大神Fisher发明的,为了纪念他,方差分析又称为“F检验”。
其假设检验如下:
H0: 各组均数相等,μ1=μ2……=μk;
H1:各组均数不全相等,μ1、μ2……μk不全相等
α=0.05。
统计F值=组间变异/组内变异。
根据统计量F值大小和对应p值作为判断的标准,若p≤0.05,拒绝H0,接受H1,即各样本的总体均数不全相等;反之,则接受H0,拒绝H1,各样本的总体均数全相等。

一、实战案例

为了探讨不同教学方法对铅球教学效果的影响,小白将条件基本相近的33名学员分为了3组,分别实施以A1、A2和A3三种不同教学方法,经过一学期的教学,测得成绩如下,试问不同的教学方法之间是否存在着差异?
读取数据:

GET FILE='E:\*************\小白爱上SPSS\小白数据\第七讲 单因素方差分析.sav'. 

在这里插入图片描述

二、统计策略

统计分析策略口诀“目的引导设计,变量确定方法”
针对上述案例,扪心七问。
Q1:本案例研究目的是什么?
A:比较差异。
Q2:比较的组数是多少呢?
A:比较三组,这三组相互独立。
Q3:本案例属于什么研究设计?
A:实验性研究。
Q4:有几个变量?
A:有两个变量。教法和铅球成绩两个变量。
Q5:变量类型是什么?
A:教法为分组(分类)变量,分成A1、A2和A3三种教法;
铅球成绩为连续型变量。
Q6:连续型变量服从正态分布么?
A:需要检验。若服从,采用方差分析;若不服从正态,采用多样本秩和检验。
Q7:两样本总体成绩的方差是否齐性?
A:需要检验(原假设:方差齐性检验符合)。如果不齐,看韦尔奇矫正结果。
在这里插入图片描述

三、SPSS操作

1、正态性检验

本案例需要对三组都进行正态性检验。原假设:数据符合正态分布。
命令行:

EXAMINE VARIABLES=推铅球成绩 BY 教法/PLOT HISTOGRAM NPPLOT /*若无此行,则不输出正态性检验表*//COMPARE GROUPS /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.

在这里插入图片描述
经S-W(夏皮洛-威尔克)检验,三组的铅球成绩的p值分别为0.461、0.108和0.263,均大于0.05,无统计学意义(接受原假设),可认为三组数据符合正态分布。

2、单因素方差分析

Step1:依次点击“分析——比较平均值——单因素ANOVA”。
Step2: “单因素方差分析”窗口中,将因变量“推铅球成绩”放入“因变量列表”选项框中,将处理因素“教法”放入“因子”选项框中。
Step3: “单因素方差分析”窗口中点击“事后比较”选项,出现“单因素ANOVA:事后多重比较”窗口,在“假定方差齐性”栏下勾选“邦弗伦尼”方法,在“未假定方差齐性”栏下勾选“塔姆黑尼”方法,然后点击“继续”。
在这里插入图片描述

Tips:事后比较

事后比较:英文为Post Hoc Comparison。所谓事后比较,俗称马后炮分析,指的是一个研究项目设计时未事先制定比较的组别和方法,而在统计分析阶段进行任意组别的均数两两比较。虽然在方差分析过程中,我们会选择一些检验方法。但在输出结果中,只有整体的F值,达到显著性水平,即p<0.05时,才会报告事后多重比较结果。
SPSS的事后比较方法分成假定等方差(方差齐性)和不假定等方差(方差不齐)两种方式,共18种检验,够狠的,让科研小白如何选择?在此,简单介绍下。
(1)方差齐性
LSD最灵敏的方法,相当于t检验,并没有控制假阳性错误。因此想要得到更多阳性结果,则采用此法;
Bonferroni(邦弗伦尼)是保守的方法,它的思想是调整检验水准,根据比较的次数重新设定检验水准,然后根据P值做出结论,是临床研究最流行的一种方法;
SNK法是先按多组均值大小排序,然后按一个有点类似于t检验的公式分别比较(不过误差计算不同)
Turkey(图基) 和Scheffe(雪费)法是比较折中方法。
如果比较的各组样本量相等,Tukey法效率较高,所以样本量相似的时候,可以采用Tukey方法;如果样本量不同,则推荐Scheffe。
(2)方差不齐
一般选择塔姆黑尼法即可。
Step4: “单因素方差分析”窗口中点击“选项”,出现“单因素ANOVA:选项”窗口,勾选“描述性”和“方差同质性检验”和“韦尔奇”,然后点击“继续”。
在这里插入图片描述
①描述:描述不同组的结局的均数、标准差、95%CI置信区间。
②方差齐性检验:对方差分析的条件之一“方差齐性”检验。
③韦尔奇:这是一种F检验替代,当方差不齐时进行使用。
Step5:点击“确定”后,就可呈现方差分析结果。
命令行:

ONEWAY 推铅球成绩 BY 教法 /STATISTICS DESCRIPTIVES HOMOGENEITY WELCH /MISSING ANALYSIS /POSTHOC=BONFERRONI T2 ALPHA(0.05).

四、结果解读

根据上述SPSS操作,F检验统计分析以下结果:

第一、统计描述

包括均数、标准差、95%CI置信区间、最小值和最大值等。
在这里插入图片描述

第二、方差齐性检验。

可选择第一行基于平均数结果。结果显示方差齐性检验p=0.252,大于0.05(无统计学意义,接受原假设:方差齐性检验符合),方差齐性,可采用F检验。
在这里插入图片描述

第三、F检验结果

结果显示F=6.006,p=0.006<0.05(具有统计学意义,不接受原假设:不存在显著性差异),说明多组总体均数存在显著性差异。
在这里插入图片描述
①F值,为本表中组间均方除以组内均方,F=5.047÷0.840=6.006。
②显著性,即p值。p=0.006<0.05(具有统计学意义,不接受原假设:不存在显著性差异)。

第四、韦尔奇检验

这是F检验的在方差不齐时的替代方法。本案例方差齐性,故不采用Welch 检验。当然, Welch检验结果显示,p=0.013,也表明多组存在着统计学差异。
在这里插入图片描述

第五、多重均数比较结果。

如果方差齐性,则看Bonferroni(邦弗伦尼)结果。如果方差不齐,则看塔姆黑尼的检验结果。
在这里插入图片描述
本案例方差齐性,故查看Bonferroni(邦弗伦尼)检验结果。原假设:成绩之间无显著性差异。各组两两之间是否有差异,主要依据显著性p值,如果P≤0.05,具有统计学意义,不接受原假设,表明存在显著性差异。
结果显示,A1与A2教法的铅球成绩存有显著性差异(p=0.048,具有统计学意义,不接受原假设), A1与A3教法的铅球成绩存有显著性差异(p=0.008),而A2和A3教法的铅球成绩之间无显著性差异(p=1.000,无统计学意义,接受原假设)。

五、规范报告

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范表格

表 不同教法对铅球成绩的影响
在这里插入图片描述

2、规范文字

方差分析结果显示,不同教法对铅球成绩有显著的不同影响,F=6.01,p=0.006。
Bonferroni多重均数比较结果显示,A1教法显著优于A2教法和A3教法,而A2和A3教法之间无显著性差异。

六、拓展阅读

1、多组均数比较为何不能用两两T检验比较?
小白学到似乎明白了,多组均数F检验只能说明多组之间总体均数不全相同,但不能说明任何两组之间存在着统计学差异。当存在显著性结果时,则采用多重比较的方法(俗称两两比较),以探索两组之间有没有统计学差异。
那为啥不能用之前学过的两独立样本T检验,进行两两多次比较呢?
答案是不能。多组数据两两比较用t检验会增加一类错误α,也就是假阳性错误。这意味着本来研究应该是阴性结果,但如果两两比较用t检验,其结果可能就是阳性。
一般情况下,一项研究的一类错误α值设定为0.05,因此, 当p≤0.05,有统计学意义的结论。但是这个结论存在一定的风险,或者说,该结论可能5%的可能性是错误的,是假的阳性结论。
5%的假阳性是公认的可以被接受的,但是如果一个项目多次两两比较,假阳性的概率可不是5%的概率了。
原理如下:当有k个均数需作两两比较时,同时比较的次数共有c= k(k-1)/2。设每次检验所用Ⅰ类错误的概率水准为α,累积Ⅰ类错误的概率为α’,则在对同一实验资料进行c次t检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积Ⅰ类错误概率α’与c有下列关系:α’=1-(1-α)c 。例如,本案例中设α=0.05,c就是组数,为3组,其累积Ⅰ类错误的概率为α’=1-(1-0.05)3=1-(0.95)3 = 0.143
本来假设检验假阳性错误是5%,现在有14.3%,,就容易把没有显著性结果说成了有显著性结果,把阴性结果说成阳性,这显然不合适的。
2、两组比较能用方差分析吗?
答案:能
两样本均数比较,也可以用F检验,而且两样本t检验和两样本F检验的结果是一致的。
比如,以第五讲的《两独立样本T检验》为例。
命令行:

GET FILE='E:\**********\小白爱上SPSS\小白数据\第五讲:两独立样本t 检验.sav'. 

两独立样本T检验

结果如下:
命令行:

T-TEST GROUPS=zb(1 2) /MISSING=ANALYSIS /VARIABLES=x /CRITERIA=CI(.95).

在这里插入图片描述

两样本方差分析

结果如下:
命令行:

ONEWAY x BY zb /STATISTICS DESCRIPTIVES HOMOGENEITY WELCH /MISSING ANALYSIS /POSTHOC=BONFERRONI T2 ALPHA(0.05).

在这里插入图片描述
可以看出,两个结果p=0.002,没有任何差别。而且我们还发现,两样本的F值是T值的平方。F值:11.127=T值:-3.336*T值:-3.336。因此,F值与T之间存有内在的逻辑性。
小白学到这里,渐入佳境,越来越爱上统计学了,而且善于思考了。
他想:三个独立样本不能用T检验,那么三个匹配样本,比如同一受试者在实验过程中重复测试三次,应该也不能用配对样本T检验。
是的,小白统计思维是正确的,下一讲将讲解:单因素重复测量方差分析。

划重点

1、单因素方差分析用于检验多个(一般三组及以上)独立样本均数是否存在差异。
2、单因素方差分析的统计策略是:分组变量分成独立三组或三组以上,结局变量要求满足连续性、正态性和方差齐性。
3、当方差分析结果达到显著性水平(p≦0.05),只能说明多组之间总体均数不全相同。若要明确哪两组均数之间有差异,则需要事后多重比较;如果方差结果不显著,则不需要事后多重检验。
4、当连续型变量不满足正态性,则采用多样本秩和检验;如果方差不齐,建议查看韦尔奇检验矫正结果。
5、两组均数比较可采用两独立样本T检验,也可采用单因素方差分析;三组及三组以上,则只能采用单因素方差分析。

这篇关于学习笔记|多样本单因素方差分析|事后比较|方差齐性|F检验|韦尔奇检验|两独立样本T检验|两样本方差分析|规范表达|《小白爱上SPSS》课程:SPSS第七讲 | 单因素方差分析怎么做?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/678331

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

百度/小米/滴滴/京东,中台架构比较

小米中台建设实践 01 小米的三大中台建设:业务+数据+技术 业务中台--从业务说起 在中台建设中,需要规范化的服务接口、一致整合化的数据、容器化的技术组件以及弹性的基础设施。并结合业务情况,判定是否真的需要中台。 小米参考了业界优秀的案例包括移动中台、数据中台、业务中台、技术中台等,再结合其业务发展历程及业务现状,整理了中台架构的核心方法论,一是企业如何共享服务,二是如何为业务提供便利。

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

MySQL高性能优化规范

前言:      笔者最近上班途中突然想丰富下自己的数据库优化技能。于是在查阅了多篇文章后,总结出了这篇! 数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 临时库表必须以tmp_为前缀并以日期为后缀,备份

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识