Python 中实现 CDF 累积分布图的两种方法

2024-03-07 21:36

本文主要是介绍Python 中实现 CDF 累积分布图的两种方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

什么是累积分布

累积分布函数,又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写“CDF”(Cumulative Distribution Function)标记。
《百度百科》

累积分布函数,又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写“CDF”(CumulativeDistributionFunction)标记。累积分布图(distribution diagram)是在一组依大小顺序排列的测量值中,当按一定的组即分组时出现测量值小于某个数值的频数或额率对组限的分布图。

简单理解:就是所有 x 左边的值都会落在对应 y 值的概率里。

第一种方法

使用 seaborn 的 ecdfplot 方法, 代码如下:

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np# 假设你有一些数据
data1 = np.random.normal(size=1000)  # 生成1000个正态分布的随机数
data2 = np.random.normal(size=1000)  # 生成1000个正态分布的随机数
df = pd.DataFrame({'data1': data1, 'data2': data2})
# 使用sns.distplot()来计算并绘制CDF
sns.ecdfplot(data=df, legend=True)
plt.grid()
# 显示图形
plt.show()  

得到的 CDF 图形:

CDF by sns

第二种方法

使用 scipy 的 mquantiles 计算

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.stats.mstats import mquantiles
from matplotlib.ticker import PercentFormatterdef cdf_by_data(df, mark, title):fig, ax = plt.subplots()y = np.arange(0, 1, 0.01)x = mquantiles(df, y)ax.plot(x, y)ax.set_title(title + " - CDF")ax.axvline(x=mark, color='r', linestyle='--', label=str(mark))ax.yaxis.set_major_formatter(PercentFormatter(1))ax.set_xlabel(title)ax.set_ylabel('probability')index = np.abs(x - mark).argmin()plt.plot(mark, y[index], 'o', color='g')ax.text(mark + 1, y[index], "({}, {}%)".format(mark, round(y[index] * 100)), color='r')plt.grid(True)# 假设你有一些数据
data1 = np.random.normal(size=1000)  # 生成1000个正态分布的随机数
data2 = np.random.normal(size=1000)  # 生成1000个正态分布的随机数
df = pd.DataFrame({'data1': data1, 'data2': data2})
cdf_by_data(df=df, mark=0, title='cdf of data')
plt.grid()
# 显示图形
plt.show()  

得到的图形如下:
CDF by scipy

这篇关于Python 中实现 CDF 累积分布图的两种方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/784900

相关文章

Docker镜像修改hosts及dockerfile修改hosts文件的实现方式

《Docker镜像修改hosts及dockerfile修改hosts文件的实现方式》:本文主要介绍Docker镜像修改hosts及dockerfile修改hosts文件的实现方式,具有很好的参考价... 目录docker镜像修改hosts及dockerfile修改hosts文件准备 dockerfile 文

C/C++错误信息处理的常见方法及函数

《C/C++错误信息处理的常见方法及函数》C/C++是两种广泛使用的编程语言,特别是在系统编程、嵌入式开发以及高性能计算领域,:本文主要介绍C/C++错误信息处理的常见方法及函数,文中通过代码介绍... 目录前言1. errno 和 perror()示例:2. strerror()示例:3. perror(

CSS去除a标签的下划线的几种方法

《CSS去除a标签的下划线的几种方法》本文给大家分享在CSS中,去除a标签(超链接)的下划线的几种方法,本文给大家介绍的非常详细,感兴趣的朋友一起看看吧... 在 css 中,去除a标签(超链接)的下划线主要有以下几种方法:使用text-decoration属性通用选择器设置:使用a标签选择器,将tex

Python基础文件操作方法超详细讲解(详解版)

《Python基础文件操作方法超详细讲解(详解版)》文件就是操作系统为用户或应用程序提供的一个读写硬盘的虚拟单位,文件的核心操作就是读和写,:本文主要介绍Python基础文件操作方法超详细讲解的相... 目录一、文件操作1. 文件打开与关闭1.1 打开文件1.2 关闭文件2. 访问模式及说明二、文件读写1.

C++变换迭代器使用方法小结

《C++变换迭代器使用方法小结》本文主要介绍了C++变换迭代器使用方法小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1、源码2、代码解析代码解析:transform_iterator1. transform_iterat

基于SpringBoot+Mybatis实现Mysql分表

《基于SpringBoot+Mybatis实现Mysql分表》这篇文章主要为大家详细介绍了基于SpringBoot+Mybatis实现Mysql分表的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录基本思路定义注解创建ThreadLocal创建拦截器业务处理基本思路1.根据创建时间字段按年进

Win11安装PostgreSQL数据库的两种方式详细步骤

《Win11安装PostgreSQL数据库的两种方式详细步骤》PostgreSQL是备受业界青睐的关系型数据库,尤其是在地理空间和移动领域,:本文主要介绍Win11安装PostgreSQL数据库的... 目录一、exe文件安装 (推荐)下载安装包1. 选择操作系统2. 跳转到EDB(PostgreSQL 的

C++中std::distance使用方法示例

《C++中std::distance使用方法示例》std::distance是C++标准库中的一个函数,用于计算两个迭代器之间的距离,本文主要介绍了C++中std::distance使用方法示例,具... 目录语法使用方式解释示例输出:其他说明:总结std::distance&n编程bsp;是 C++ 标准

Python将博客内容html导出为Markdown格式

《Python将博客内容html导出为Markdown格式》Python将博客内容html导出为Markdown格式,通过博客url地址抓取文章,分析并提取出文章标题和内容,将内容构建成html,再转... 目录一、为什么要搞?二、准备如何搞?三、说搞咱就搞!抓取文章提取内容构建html转存markdown

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,