学习笔记|线性相关分析|绘制散点图|计算r系数|双变量线性相关性分析|规范表达|《小白爱上SPSS》课程:SPSS第十八讲:如何进行线性相关分析?

本文主要是介绍学习笔记|线性相关分析|绘制散点图|计算r系数|双变量线性相关性分析|规范表达|《小白爱上SPSS》课程:SPSS第十八讲:如何进行线性相关分析?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 线性相关分析
    • 0 引言
    • 1. 绘制散点图
    • 2.计算r系数
    • 一、实战案例
    • 二、统计策略
    • 统计分析步骤:
    • 三、SPSS操作
      • 1、正态性检验
      • 2、绘制散点图
      • 3、正式分析
    • 四、结果解读
    • 五、规范表达
      • 1、规范图表
      • 2、规范文字
    • 六、划重点

学习目的

SPSS第十八讲:如何进行线性相关分析?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

线性相关分析

0 引言

在统计学中,事物或现象之间的关系是通过变量间的关系反映出来的。变量间的关系分为确定性关系和非确定性关系两类。确定性关系即函数关系。然而在实际问题中,随机变量之间虽有某种关系,但这种关系却难以用精确的表示方法来描述(不像数学函数),那么这种非确定性关系即相关关系。
在科研中,经常需要分析两种现象或事物之间的关系,例如,百米跑成绩与跳远成绩间有无关系?如果有,其关系如何?百米跑成绩提高0.01s,跳远成绩将会受到何种影响?对于这类变量间关系的研究就属于相关与回归问题。
我们今天要学习的线性相关分析就是对两个变量之间有无和关系大小做出统计推断的方法。
分析两个变量之间有无关系我们常用两种方法:

1. 绘制散点图

考察相关性最简单而直观的方法就是在XOY直角坐标系上画出散点图,通过散点图可以看出两个变量间是否存在线性关系。通过散点图,我们可以绘制如下四种相关图形。
在这里插入图片描述
但是散点图只能大致描述两个变量之间是否存在关系,而不能够准确度量两个变量关系密切程度,因此我们我们会用数学上的方法去计算准确的相关关系。

2.计算r系数

对于两个连续型变量来说,描述两个变量之间直线关系的密切程度和相关方向的统计指标叫做相关系数,统计上也称为Pearson积矩相关系数。
样本线性相关系数一般用r表示、总体相关系数一般用p表示。相关系数没有单位,其取值范围为|r|≤1。
计算公式如下(不明白公式,可以感受一下,然后略过):
在这里插入图片描述
① 符号:如果为正号,则表示正相关,如果为负号,则表示负相关。
② 取值为0,这是极端,表示不相关。取值为1,表示完全正相关,取值为-1,表示完全负相关
③ 若变量间的直线关系越密切,则|r|越接近于1;当变量之间的直线关系越不密切,|r|越接近0
④ 根据样本资料计算出的相关系数r是一个样本计算量,存在抽样误差。因此必须对r进行显著性检验,以判断其是否来自总体相关系数p=0的一个样本。
所以相关系数r是表示两个随机变量之间呈直线相关的强度和方向的统计量。

一、实战案例

小白测得12名女大侠的体重和肺活量数据,如下表。问:体重和肺活量之间有无关系?
读数据:

GET FILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十八讲:线性相关分析.sav'. 

在这里插入图片描述

二、统计策略

统计分析策略口诀“目的引导设计,变量确定方法”。
针对上述案例,扪心七问。
Q1:本案例研究目的是什么?
A:关联分析。
Q2:分析的组数是多少呢?
A:两组数据。
Q3:本案例属于什么研究设计?
A:调查研究
Q4:有几个变量?
A:有两个变量。体重与肺活量。
Q5:变量类型是什么?
A:体重和肺活量都属于连续型变量。
Q6:组内两变量数据服从正态分布么?
A:需要检验。若服从,可以进一步检验双变量关系是否为线性关系;若不服从正态,采用秩相关分析。
Q7:组内双变量关系是否为线性关系?
A:需要检验。
概括而言,如果数据满足以下条件,则采用线性相关分析。
在这里插入图片描述

统计分析步骤:

第一,考察直线的可能性
第二,计算r值
第三,用样本推算总体,运用t检验。
第四,直线性关系的有无及大小

三、SPSS操作

1、正态性检验

本案例需要对体重和肺活量都进行正态性检验。
在这里插入图片描述
经S-W(夏皮洛-威尔克)检验,体重、肺活量数据的p值分别为0.490和0.465,均大于0.05,无统计学意义,支持原假设,可认为两组数据符合正态分布。

2、绘制散点图

操作方式:依次点击“图形——旧对话框——散点图/点图——简单散点图”。
在这里插入图片描述
命令行:

GRAPH /SCATTERPLOT(BIVAR)=体重 WITH 肺活量 /MISSING=LISTWISE.

在这里插入图片描述
初步分析:两变量间存在线性相关趋势,没有发现明显的异常值。

3、正式分析

Step1:操作方式:“分析——相关——双变量”
Step2:将【体重】【肺活量】放入【变量】窗口,同时选择【皮尔逊】相关系数。
在这里插入图片描述
命令行:

CORRELATIONS /VARIABLES=体重 肺活量 /PRINT=TWOTAIL NOSIG  /*显著性检验:双尾*//MISSING=PAIRWISE	 /*皮尔逊*/.

四、结果解读

在这里插入图片描述
可以看到,Pearson相关分析结果显示,r=0.828, p=0.01, 具有统计学意义,不接受原假设:数据无相关性有误,表示体重和肺活量存在正相关。

五、规范表达

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范图表

(1)如果只有两个变量之间相关,建议采用散点图呈现结果更直观。
在这里插入图片描述
(2)如果是多个变量之间关系,则可采用类似相关矩阵来描述。
在这里插入图片描述

2、规范文字

Person相关分析结果显示,体重与肺活量的相关系数r=0.828,p=0.001,表明体重与肺活量之间存在正相关。
小白学习完了线性相关分析课程,向主任汇报了自己分析成果。
主任看后说:“小白,如果不服从正态分布,你可知怎么办吗?”
小白说:“…”
主任说:“那你还是好好学习,天天向上吧!”
小白查查了下一讲内容:秩相关分析。

六、划重点

1、随机变量之间难以用精确的表示方法来描述(不像数学函数)的非确定性关系即相关关系。
2、线性相关分析就是对两个变量之间有无和关系大小做出统计推断的方法。
3、分析两个变量之间有无关系我们常用两种方法:绘制散点图和计算r系数。
4、线性相关分析要求两个连续型变量均服从正态性分布,若不服从正态分布,则采用秩相关。
5、相关系数r是表示两个随机变量之间呈直线相关的强度和方向的统计量。
6、计算完r后要检验r是否具有统计学意义。

这篇关于学习笔记|线性相关分析|绘制散点图|计算r系数|双变量线性相关性分析|规范表达|《小白爱上SPSS》课程:SPSS第十八讲:如何进行线性相关分析?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/340205

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

变量与命名

引言         在前两个课时中,我们已经了解了 Python 程序的基本结构,学习了如何正确地使用缩进来组织代码,并且知道了注释的重要性。现在我们将进一步深入到 Python 编程的核心——变量与命名。变量是我们存储数据的主要方式,而合理的命名则有助于提高代码的可读性和可维护性。 变量的概念与使用         在 Python 中,变量是一种用来存储数据值的标识符。创建变量很简单,

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

MySQL高性能优化规范

前言:      笔者最近上班途中突然想丰富下自己的数据库优化技能。于是在查阅了多篇文章后,总结出了这篇! 数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 临时库表必须以tmp_为前缀并以日期为后缀,备份

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss