Matplotlib详解 - PlotType : Pairwise data

2024-09-06 12:44

本文主要是介绍Matplotlib详解 - PlotType : Pairwise data,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 前言

Pairwise data(成对数据)指的是在数据集中,数据点是以成对的形式出现的,通常用于分析两者之间的关系比较。在成对数据中,数据点通常是以两个变量的组合出现的,代表两个实体、两个属性或两个观测值之间的关系。

本篇文章讲解成对数据的可视化形式

2. plot()折线图

用途:最常见的折线图绘制函数,用于绘制连续数据的趋势

适用场景:绘制简单的线性或非线性关系,比如函数曲线,时间序列函数等

1. 趋势分析:展示数据的上升,下降,周期性等变化趋势

2. 平滑曲线:连接离散的点,将数学函数可视化

x = np.linspace(-10,10,100)
y = x**2
plt.plot(x,y)

3. scatter()散点图

用于显示数据之间的关系或分布情况,特别是两个变量之间的关联性。

x = np.random.rand(10) #0-1之间的随机数
y = np.random.rand(10)
plt.scatter(x,y)

 

可以通过设置每个点不同的大小,颜色清晰的看出数据属性的不同。

import matplotlib.pyplot as plt
import numpy as npplt.style.use('_mpl-gallery')# make the data
np.random.seed(3)
x = 4 + np.random.normal(0, 2, 24)
y = 4 + np.random.normal(0, 2, len(x))
# size and color:
sizes = np.random.uniform(15, 80, len(x))
colors = np.random.uniform(15, 80, len(x))# plot
fig, ax = plt.subplots()ax.scatter(x, y, s=sizes, c=colors, vmin=0, vmax=100)ax.set(xlim=(0, 8), xticks=np.arange(1, 8),ylim=(0, 8), yticks=np.arange(1, 8))plt.show()

使用场景:

1. 数据分布分析:当需要展示一组数据点的分布,特别是当数据之间没有连续性时,用scatter进行可视化最合适。

2. 相关性分析:用于展示两个变量之间的关系,判断它们是否存在相关性或趋势

3. 分类数据:在数据中,有时候你需要通过颜色或形状区分不同的类别,可以由此绘制不同的颜色或形状的散点

4. 异常点检测:通过观察散点分布,识别数据中的异常点或离群值

4. bar()柱状图

绘制条形图,通常用于对比不同类别的值。适用于类别型数据的可视化,特别是对比不同组之间的数值。

categories = ['A','B','C','D']
values = [3,7,10,9]
plt.bar(categories,values)

使用场景:

分类数据:展示离散类别及其对应的数值,不同商品的销量,不同地区人口,不同项目的完成

数据比较:柱状图适合展示不同类别之间的差异,清晰对比各类数据的大小,频率

5. stem()脉冲图

5.1 stem()使用方法

适用于展示离散的、间断的数据,强调每个数据点的独立性和具体位置

import numpy as np
import matplotlib.pyplot as plt# 数据
x = np.linspace(0, 2 * np.pi, 10)
y = np.sin(x)# 绘制脉冲图
plt.stem(x, y)
plt.title('Simple Stem Plot')
plt.show()

 

 

# 自定义脉冲图
plt.stem(x, y, linefmt='g--', markerfmt='ro', basefmt='k-', bottom=-1)
plt.title('Custom Stem Plot')
plt.show()

将bottom的初始位置进行修改,以y轴为基准进行修改 

相关参数修改:

参数描述
yy轴的数据点,每个脉冲高度np.sin(x)
linefmt脉冲线的格式(颜色,线型等)

'b-'(蓝色实线)

'g--'(绿色虚线

markerfmt数据点的格式

'ro'(红色圆点);

‘bs’(蓝色方块);

basefmtx轴线的格式

'k-'(黑色实线),

‘b--'(蓝色虚线)

bottom脉冲线的起始位置,默认为0bottom=-1
label为图例添加标签’My Data‘

5.2 应用场景

1. 数据采样

在数据采样和数值分析中,stem可以用于展示离散采样点,帮助分析在特定时间点或位置上采集到的数据。eg:展示某物理量随时间的离散采样;显示实验中采集到的离散数据

2. 离散概率分布

绘制离散概率分布,帮助展示某个离散随机变量的概率或频率分布。

3. 序列数据可视化

当处理离散的序列数据时,可以帮助直观展示每个数据点的数值,尤其是当序列具有突出的局部极值时。

• 展示某些特征随序列变化的情况 • 强调时间序列的离散变化

6. fill_between()填充

6.1 fill_between()方法

fill_between常用于绘制填充区域,通常用于在两条曲线之间或曲线与 x 轴之间填充颜色。它可以帮助突出显示特定区域,例如数据的范围、置信区间或正负区域

import numpy as np
import matplotlib.pyplot as plt# 创建数据
x = np.linspace(0, 10, 100)
y = np.sin(x)# 填充曲线与x轴之间的区域
plt.plot(x, y, color="blue") #绘制曲线
plt.fill_between(x, y, color="skyblue", alpha=0.4) #填充区域plt.title('Fill Between Curve and X-axis')
plt.show()

有条件性的填充

在fill_between函数中添加where属性

# 创建数据
x = np.linspace(0, 10, 100)
y = np.sin(x)# 只填充 y > 0 的区域
plt.plot(x, y, color="blue")
plt.fill_between(x, y, where=(y > 0), color="green", alpha=0.3)
plt.fill_between(x, y, where=(y < 0), color="red", alpha=0.3)plt.title('Conditional Fill Based on y Value')
plt.show()

6.2 使用场景

1. 显示数据范围或不确定性区域

通常用于填充某个变量的最大值和最小值之间的区域,或者展示某个数据的置信区间,强调数据的不确定性。例如测量值的上下限,用于可视化模型预测中的置信区间。

2. 强调正负区域

当某个函数的值在某些区间为正,某些区间为负时,可以填充这些不同的区域,突出正负的变化。例如经济学中的盈亏点,强调时间序列数据的正负变化。

3. 表示差异或变化范围

用来填充它们之间的差异,表示它们之间的变化范围或差异大小。

例如展示实际值和预测值之间的差异,比较两种方法或模型的结果

4. 绘制累计变化

显示总资产的增长或减少,表示不同来源的收入变化

fill_between()特别适合那些需要突出显示不同区间的数据

7. stackplot()堆叠面积图

7.1 stackplot()方法

堆叠面积图能够显示随时间变化的多个数据系列的累积值,直观地展示组成部分的相对变化以及它们对整体的贡献。通过不同颜色的堆叠区域,可以直观地看到每个数据系列的变化及其对总值的贡献。

import matplotlib.pyplot as plt
import numpy as np# 数据准备
days = np.array([1, 2, 3, 4, 5])
apples = np.array([3, 4, 2, 5, 6])
bananas = np.array([1, 2, 3, 1, 2])
cherries = np.array([4, 3, 2, 4, 5])# 绘制堆叠面积图
plt.stackplot(days, apples, bananas, cherries, labels=['Apples', 'Bananas', 'Cherries'], colors=['#ff9999','#66b3ff','#99ff99'])#labels表示数据系列的标签,如果需要添加图例,一定要有label# 添加图例
plt.legend(loc='upper left')
plt.title('Fruit Sales Over Time')
plt.show()

7.2 使用场景

展示随时间或其他连续变量变化的组成部分和累积值

1. 展示随时间变化的组成部分变化

例如,在一个公司中,销售额可以分为不同产品线的销售额,可以清晰展示各个产品线的变化趋势以及它们对总销售额的贡献。不同部门的销售趋势,公司各产品的开支变化。

2. 能源或资源消耗的分解

展示能源或资源消耗的分解。例如,不同能源(如煤、电、水力、风能)的消耗情况以及它们在总消耗中的占比。

3. 金融数据的组成部分变化

展示不同投资项目的收益变化、不同资产类别在总投资组合中的比例变化。

不同资产类别(如股票、债券、房地产)随时间的投资收益变化。

不同收入来源对总收入的贡献。

4. 人口统计数据

人口统计学中的变化趋势,例如不同年龄段的人口随时间的变化。通过堆叠图,可以清晰地看到每个年龄段在总人口中的变化情况。

5. 项目进展的累积展示

堆叠图可以用来展示多个任务或项目的完成进度,以及它们对整体进度的贡献。

展示多个项目的进展情况 & 任务时间分配的变化

8. stairs()阶梯图

8.1 stairs()方法

阶梯图通常用于表示数据随时间或特定区间的分段恒定变化,某个数据在某个区间内保持恒定,之后突然跳到另一个值。显示数据的逐步变化。

value = [3,9,10,5,7]
edges = [0,1,2,3,4,5]
plt.stairs(value, edges) #在前面的为y值,后面的为x轴;edges列表比value列表值多一项
#两点连成一条线
plt.show()

8.2 使用场景

1. 分段恒定数据

当数据在某个区间内保持恒定值,然后在下一个区间内突然跳变,阶梯图可以直观展示每个区间的值变化。例如,某项指标或信号在一段时间内保持固定值,接着发生跳变。

2. 分段函数

阶梯图非常适合用来绘制分段恒定函数,例如阶跃函数或Piecewise常数函数,这些函数在每个区间内都有固定的输出值。

3. 直方图的分段表示

阶梯图可以用来替代直方图,展示频率分布时更加清晰,特别是当数据密集时,阶梯图可以减少过度的视觉杂乱。

4. 信号处理中的阶跃变化

阶梯图在信号处理中很常见,尤其是在表示离散信号或数字信号的情况下,信号的数值可能在不同的时刻发生突然变化。

5. 财务和市场分析

在一些财务分析和市场研究中,阶梯图用于展示某些指标(如库存水平、资金流动)在特定时间内保持不变,并在特定时间点发生跳变。

9. 参考资料

《matplotlib》

这篇关于Matplotlib详解 - PlotType : Pairwise data的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1142040

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

OpenHarmony鸿蒙开发( Beta5.0)无感配网详解

1、简介 无感配网是指在设备联网过程中无需输入热点相关账号信息,即可快速实现设备配网,是一种兼顾高效性、可靠性和安全性的配网方式。 2、配网原理 2.1 通信原理 手机和智能设备之间的信息传递,利用特有的NAN协议实现。利用手机和智能设备之间的WiFi 感知订阅、发布能力,实现了数字管家应用和设备之间的发现。在完成设备间的认证和响应后,即可发送相关配网数据。同时还支持与常规Sof

6.1.数据结构-c/c++堆详解下篇(堆排序,TopK问题)

上篇:6.1.数据结构-c/c++模拟实现堆上篇(向下,上调整算法,建堆,增删数据)-CSDN博客 本章重点 1.使用堆来完成堆排序 2.使用堆解决TopK问题 目录 一.堆排序 1.1 思路 1.2 代码 1.3 简单测试 二.TopK问题 2.1 思路(求最小): 2.2 C语言代码(手写堆) 2.3 C++代码(使用优先级队列 priority_queue)

K8S(Kubernetes)开源的容器编排平台安装步骤详解

K8S(Kubernetes)是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。以下是K8S容器编排平台的安装步骤、使用方式及特点的概述: 安装步骤: 安装Docker:K8S需要基于Docker来运行容器化应用程序。首先要在所有节点上安装Docker引擎。 安装Kubernetes Master:在集群中选择一台主机作为Master节点,安装K8S的控制平面组件,如AP

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

嵌入式Openharmony系统构建与启动详解

大家好,今天主要给大家分享一下,如何构建Openharmony子系统以及系统的启动过程分解。 第一:OpenHarmony系统构建      首先熟悉一下,构建系统是一种自动化处理工具的集合,通过将源代码文件进行一系列处理,最终生成和用户可以使用的目标文件。这里的目标文件包括静态链接库文件、动态链接库文件、可执行文件、脚本文件、配置文件等。      我们在编写hellowor

LabVIEW FIFO详解

在LabVIEW的FPGA开发中,FIFO(先入先出队列)是常用的数据传输机制。通过配置FIFO的属性,工程师可以在FPGA和主机之间,或不同FPGA VIs之间进行高效的数据传输。根据具体需求,FIFO有多种类型与实现方式,包括目标范围内FIFO(Target-Scoped)、DMA FIFO以及点对点流(Peer-to-Peer)。 FIFO类型 **目标范围FIFO(Target-Sc

019、JOptionPane类的常用静态方法详解

目录 JOptionPane类的常用静态方法详解 1. showInputDialog()方法 1.1基本用法 1.2带有默认值的输入框 1.3带有选项的输入对话框 1.4自定义图标的输入对话框 2. showConfirmDialog()方法 2.1基本用法 2.2自定义按钮和图标 2.3带有自定义组件的确认对话框 3. showMessageDialog()方法 3.1

脏页的标记方式详解

脏页的标记方式 一、引言 在数据库系统中,脏页是指那些被修改过但还未写入磁盘的数据页。为了有效地管理这些脏页并确保数据的一致性,数据库需要对脏页进行标记。了解脏页的标记方式对于理解数据库的内部工作机制和优化性能至关重要。 二、脏页产生的过程 当数据库中的数据被修改时,这些修改首先会在内存中的缓冲池(Buffer Pool)中进行。例如,执行一条 UPDATE 语句修改了某一行数据,对应的缓

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super