统计学中不同相关系数的比较

2024-03-15 16:20

本文主要是介绍统计学中不同相关系数的比较,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

      • 相关系数的区别
        • 不同相关系数的比较
          • 1. Pearson 相关系数
          • 2. Kendall 秩相关系数
          • 3. Spearman 秩相关系数
        • 总结

相关系数的区别

不同相关系数的比较
1. Pearson 相关系数
  • 定义: 皮尔逊相关系数衡量的是两个变量之间的线性相关程度。其值介于-1和1之间,其中1表示完全正相关,-1表示完全负相关,0表示没有线性相关。
  • 使用场景: 当两个变量的关系接近线性,并且数据是连续且大致符合正态分布时,使用皮尔逊相关系数最为合适。
  • 公式:
    r = ∑ ( x i − x ˉ ) ( y i − y ˉ ) ∑ ( x i − x ˉ ) 2 ∑ ( y i − y ˉ ) 2 r=\frac{\sum (x_{i} - \bar{x}) (y_{i} - \bar{y}) }{\sqrt{\sum(x_{i}-\bar{x})^{2} \sum(y_{i}-\bar{y})^{2}}} r=(xixˉ)2(yiyˉ)2 (xixˉ)(yiyˉ)
2. Kendall 秩相关系数
  • 定义: 肯德尔秩相关系数(Kendall’s tau)是一种用于测量两个变量之间序数关联性的非参数统计方法。它基于两个变量的配对观测值之间的一致性和不一致性。

  • 使用场景: 当你的数据是序数的,或者数据含有许多重复值,或者样本量较小时,肯德尔秩相关系数是一个更好的选择。

  • 公式:
    τ = 2 n ( n − 1 ) ∑ sign ( x i − x j ) sign ( y i − y j ) \tau = \frac{2}{n(n-1)} \sum \text{sign}(x_i - x_j) \text{sign}(y_i - y_j) τ=n(n1)2sign(xixj)sign(yiyj)

    其中,sign函数是符号函数,n是数据点的数量。

3. Spearman 秩相关系数
  • 定义: 斯皮尔曼秩相关系数(Spearman’s rho)也是一种非参数的秩相关统计方法,它衡量的是两个变量的等级之间的单调关系。

  • 使用场景: 当数据不满足正态分布、存在异常值或者非线性关系时,斯皮尔曼秩相关系数是一个更合适的选择。

  • 公式:
    ρ = 1 − 6 ∑ d i 2 n ( n 2 − 1 ) \rho = 1 - \frac{6 \sum d_i^2}{n(n^2 - 1)} ρ=1n(n21)6di2

    其中, d i d_{i} di是两个变量的秩次之差, n n n是数据点的数量。

总结
  • Pearson 是对线性关系的度量,对于非线性关系和非正态分布的数据可能不是很敏感。
  • KendallSpearman 是非参数方法,它们对于非正态分布的数据和非线性关系更为稳健,但通常具有较低的统计效能。
  • Spearman 通常对异常值更为敏感,而 Kendall 在处理小样本数据或有许多重复值的数据时更为可靠。

这篇关于统计学中不同相关系数的比较的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/812548

相关文章

Python如何计算两个不同类型列表的相似度

《Python如何计算两个不同类型列表的相似度》在编程中,经常需要比较两个列表的相似度,尤其是当这两个列表包含不同类型的元素时,下面小编就来讲讲如何使用Python计算两个不同类型列表的相似度吧... 目录摘要引言数字类型相似度欧几里得距离曼哈顿距离字符串类型相似度Levenshtein距离Jaccard相

在不同系统间迁移Python程序的方法与教程

《在不同系统间迁移Python程序的方法与教程》本文介绍了几种将Windows上编写的Python程序迁移到Linux服务器上的方法,包括使用虚拟环境和依赖冻结、容器化技术(如Docker)、使用An... 目录使用虚拟环境和依赖冻结1. 创建虚拟环境2. 冻结依赖使用容器化技术(如 docker)1. 创

关于Spring @Bean 相同加载顺序不同结果不同的问题记录

《关于Spring@Bean相同加载顺序不同结果不同的问题记录》本文主要探讨了在Spring5.1.3.RELEASE版本下,当有两个全注解类定义相同类型的Bean时,由于加载顺序不同,最终生成的... 目录问题说明测试输出1测试输出2@Bean注解的BeanDefiChina编程nition加入时机总结问题说明

C#比较两个List集合内容是否相同的几种方法

《C#比较两个List集合内容是否相同的几种方法》本文详细介绍了在C#中比较两个List集合内容是否相同的方法,包括非自定义类和自定义类的元素比较,对于非自定义类,可以使用SequenceEqual、... 目录 一、非自定义类的元素比较1. 使用 SequenceEqual 方法(顺序和内容都相等)2.

java中不同版本JSONObject区别小结

《java中不同版本JSONObject区别小结》本文主要介绍了java中不同版本JSONObject区别小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录1. FastjsON2. Jackson3. Gson4. org.json6. 总结在Jav

Python中连接不同数据库的方法总结

《Python中连接不同数据库的方法总结》在数据驱动的现代应用开发中,Python凭借其丰富的库和强大的生态系统,成为连接各种数据库的理想编程语言,下面我们就来看看如何使用Python实现连接常用的几... 目录一、连接mysql数据库二、连接PostgreSQL数据库三、连接SQLite数据库四、连接Mo

对postgresql日期和时间的比较

《对postgresql日期和时间的比较》文章介绍了在数据库中处理日期和时间类型时的一些注意事项,包括如何将字符串转换为日期或时间类型,以及在比较时自动转换的情况,作者建议在使用数据库时,根据具体情况... 目录PostgreSQL日期和时间比较DB里保存到时分秒,需要和年月日比较db里存储date或者ti

java脚本使用不同版本jdk的说明介绍

《java脚本使用不同版本jdk的说明介绍》本文介绍了在Java中执行JavaScript脚本的几种方式,包括使用ScriptEngine、Nashorn和GraalVM,ScriptEngine适用... 目录Java脚本使用不同版本jdk的说明1.使用ScriptEngine执行javascript2.

百度/小米/滴滴/京东,中台架构比较

小米中台建设实践 01 小米的三大中台建设:业务+数据+技术 业务中台--从业务说起 在中台建设中,需要规范化的服务接口、一致整合化的数据、容器化的技术组件以及弹性的基础设施。并结合业务情况,判定是否真的需要中台。 小米参考了业界优秀的案例包括移动中台、数据中台、业务中台、技术中台等,再结合其业务发展历程及业务现状,整理了中台架构的核心方法论,一是企业如何共享服务,二是如何为业务提供便利。

2. c#从不同cs的文件调用函数

1.文件目录如下: 2. Program.cs文件的主函数如下 using System;using System.Collections.Generic;using System.Linq;using System.Threading.Tasks;using System.Windows.Forms;namespace datasAnalysis{internal static