Numpy和Pandas数据维度的理解————切莫简单问题复杂化

2023-12-19 14:18

本文主要是介绍Numpy和Pandas数据维度的理解————切莫简单问题复杂化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

几句话说明白的事情就不要整长篇大论甚至加上数学公式了,不是所有人都心情瞎扯。扯完还有人夸“简洁明了”,有没有搞错?

axis意为轴,在本文的语境中指Numpy和Pandas包中的维度。

1. 二维数组 / 数据框:

axis=0,即0轴,为数组或数据框的“行”;
axis=1,即1轴,为数组或数据框的“列”。

abc
0a1b1c1
1a2b2c2
2a3b3c3
>>>df.iloc[2]
df1.iloc[2]
a    a3
b    b3
c    c3
Name: 2, dtype: object>>>df.iloc[2,1]
'b3'

iloc和loc以及其他定位操作,先行(0轴)后列(1轴)

2. 三维数组

我有如下两表:

abc
0αa1αb1αc1
1αa2αb2αc2
2αa3αb3αc3
abc
0βa1βb1βc1
1βa2βb2βc2
2βa3βb3βc3

两个表可以放进一个np.array里:(用代号表示数字用于示例,别愚蠢地问我为什么这些字符串在下文还能做算术,我用数字大家看得明白吗?)

array1 = [[["αa1","αb1","αc1"],["αa2","αb2","αc2"],["αa3","αb3","αc3"]],[["βa1","βb1","βc1"],["βa2","βb2","βc2"],["βa3","βb3","βc3"]]]

显然现在有3个轴,也许你记为XYZ,但请按Python的编程世界理解为0轴,1轴和2轴(对于R语言来说从1开始计数)。
这3条轴中,
有1条 = [0, 1] 记录着表的序号 == “第几张表”
有1条 = [a, b, c] 记录着每个表的列名(列序号) == “每张表的哪一列”
有1条 = [0,1,2] 记录着每个表的行名(行序号) == “每张表的哪一行

若执行array1.sum(axis=0),则结果为 array([αa1+βa1, αb1+βb1, αc1+βc1],
---------------------------------------[αa2+βa2, αb2+βb2, αc2+βc2],
---------------------------------------[αa3+βa3, αb3+βb3, αc3+βc3] )

可以看出①三维数组对某个维度求和,即将所有“在其他维度上坐标相同但在此维度上坐标不同”的元素相加;②0轴即表的序号,“第几张表”。

若执行array1.sum(axis=1),则结果为 array([αa1+αa2+αa3, αb1+αb2+αb3, αc1+αc2+αc3],
---------------------------------------[βa1+βa2+βa3, βb1+βb2+βb3, βc1+βc2+βc3])

可以看出①所有表序号相同(在同一张表内),列名相同(列序号)(同一列),但行序号不同(不在同一行)的元素被相加;②1轴即每个表的行名(行序号),“每张表的哪一行”。

若执行array1.sum(axis=2),则结果为 array([αa1+αb1+αc1, αa2+αb2+αc2, αa3+αb3+αc3],
---------------------------------------[βa1+βb1+βc1, βa2+βb2+βc2, βa3+βb3+βc3])

可以看出①所有表序号相同(在同一张表内),行序号相同(同一行),但列序号不同(不在同一列)的元素被相加;②2轴即每个表的列名(列序号),“每张表的哪一列”。

3. 总结

(1)二维表里维度就是行与列;
(2)三维表里维度的顺序(表名→行名→列名)。逻辑也非常好懂,先确定哪张表,再在表内按照二维表的方法排列;
(3)更高维度的表(array里的中括号嵌套更多)中逻辑相似,阶梯降维(4th→3rd→2nd→1st)。具体请用类似我的方法实践证明。比如4维表里的元素应该有4个用于识别的字符构成,例如“Aαa1”,以此类推。

这篇关于Numpy和Pandas数据维度的理解————切莫简单问题复杂化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/512512

相关文章

mybatis和mybatis-plus设置值为null不起作用问题及解决

《mybatis和mybatis-plus设置值为null不起作用问题及解决》Mybatis-Plus的FieldStrategy主要用于控制新增、更新和查询时对空值的处理策略,通过配置不同的策略类型... 目录MyBATis-plusFieldStrategy作用FieldStrategy类型每种策略的作

C++初始化数组的几种常见方法(简单易懂)

《C++初始化数组的几种常见方法(简单易懂)》本文介绍了C++中数组的初始化方法,包括一维数组和二维数组的初始化,以及用new动态初始化数组,在C++11及以上版本中,还提供了使用std::array... 目录1、初始化一维数组1.1、使用列表初始化(推荐方式)1.2、初始化部分列表1.3、使用std::

linux下多个硬盘划分到同一挂载点问题

《linux下多个硬盘划分到同一挂载点问题》在Linux系统中,将多个硬盘划分到同一挂载点需要通过逻辑卷管理(LVM)来实现,首先,需要将物理存储设备(如硬盘分区)创建为物理卷,然后,将这些物理卷组成... 目录linux下多个硬盘划分到同一挂载点需要明确的几个概念硬盘插上默认的是非lvm总结Linux下多

Python Jupyter Notebook导包报错问题及解决

《PythonJupyterNotebook导包报错问题及解决》在conda环境中安装包后,JupyterNotebook导入时出现ImportError,可能是由于包版本不对应或版本太高,解决方... 目录问题解决方法重新安装Jupyter NoteBook 更改Kernel总结问题在conda上安装了

pip install jupyterlab失败的原因问题及探索

《pipinstalljupyterlab失败的原因问题及探索》在学习Yolo模型时,尝试安装JupyterLab但遇到错误,错误提示缺少Rust和Cargo编译环境,因为pywinpty包需要它... 目录背景问题解决方案总结背景最近在学习Yolo模型,然后其中要下载jupyter(有点LSVmu像一个

redis群集简单部署过程

《redis群集简单部署过程》文章介绍了Redis,一个高性能的键值存储系统,其支持多种数据结构和命令,它还讨论了Redis的服务器端架构、数据存储和获取、协议和命令、高可用性方案、缓存机制以及监控和... 目录Redis介绍1. 基本概念2. 服务器端3. 存储和获取数据4. 协议和命令5. 高可用性6.

解决jupyterLab打开后出现Config option `template_path`not recognized by `ExporterCollapsibleHeadings`问题

《解决jupyterLab打开后出现Configoption`template_path`notrecognizedby`ExporterCollapsibleHeadings`问题》在Ju... 目录jupyterLab打开后出现“templandroidate_path”相关问题这是 tensorflo

如何解决Pycharm编辑内容时有光标的问题

《如何解决Pycharm编辑内容时有光标的问题》文章介绍了如何在PyCharm中配置VimEmulator插件,包括检查插件是否已安装、下载插件以及安装IdeaVim插件的步骤... 目录Pycharm编辑内容时有光标1.如果Vim Emulator前面有对勾2.www.chinasem.cn如果tools工

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

最长公共子序列问题的深度分析与Java实现方式

《最长公共子序列问题的深度分析与Java实现方式》本文详细介绍了最长公共子序列(LCS)问题,包括其概念、暴力解法、动态规划解法,并提供了Java代码实现,暴力解法虽然简单,但在大数据处理中效率较低,... 目录最长公共子序列问题概述问题理解与示例分析暴力解法思路与示例代码动态规划解法DP 表的构建与意义动