左手Python右手Excel,玩转数据透视表哪家强?

2023-10-15 05:20

本文主要是介绍左手Python右手Excel,玩转数据透视表哪家强?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据透视表

什么是数据透视表?对于大多数才开始使用Excel组件的用户来说,可能只是听说过数据透视表,至于数据透视表具体用来做什么,以及它会给实际工作带来什么便利,估计就有很多人不是很清楚了。

数据透视表是一种可以快速汇总、分析和处理大量数据的交互式工具。

简单来说,数据透视表可以从不同角度对相同的数据进行处理和分析,以查看不同层面的数据结果,从而得到想要的数据信息。

形象点来说, 数据透视表就像一个万花筒,通过旋转这个特别的万花筒,可以从中获得不断变化的事物细节,但是事物的本身其实并未发生变化,数据透视表这个特别的万花筒只是一个工具,只不过通过该工具可以获得普通事物的独特视图。

适用场景:

  1. 表格中数据量较大时

  2. 表格中的数据结构不断变化时

  3. 当需要源数据与分析结果的更新保持一致时

数据透视表我们给大家区分了一下段位(青铜、黄金、钻石、王者),本次从小白到青铜段位。先来一波效果图

黄金段位:

钻石段位:

王者段位:

透视表术语介绍

  1. 数据源

指的是用来创建数据透视表的原始数据内容,原始数据既可以来自现有工作表,也可以从外部数据库中获取。

比如下图就是一部分数据源(也有称作:源数据):

  1. 字段

在上图中每一列的第一个单元格内容都为该列的数据分类,在生成数据透视表后,这些数据就是我们所说的字段

  1. 字段列表和字段设置区域

在插入了一个数据透视表后,工作表的右侧会同时出现一个名为“数据透视表字段”的任务窗格。(没有安装office,此处以wps为例介绍)

Excel的数据透视表使用

我们将上面的数据在Excel表格中创建一个透视表具体使用步骤如下:

接下来会打开一张表格:

比如我们要得到的最终结果是:

 则需要在数据透视表的设置区域进行如下操作:

接下来是年份的设置,大家可以看到最终的结果图是将年份内容设置到了列上。

最终效果:

Python操作这些数据最大的亮点是:数据量非常多的时候更有优势。

Python操作数据实现透视表功能

数据透视表的制作我们使用Pandas中的pivot_table完成,具体语法如下:

pivot_table(data,    # DataFramevalues=None,    # 值index=None,    # 分类汇总依据columns=None,    # 列aggfunc='mean',    # 聚合函数fill_value=None,    # 对缺失值的填充margins=False,    # 是否启用总计行/列dropna=True,    # 删除缺失margins_name='All'   # 总计行/列的名称)

首先读取数据:

import os
import numpy as np
import pandas as pddf = pd.read_excel('excel玩家等级.xlsx', sheet_name='原始表格' )
df

结果:

通过pivot_table来制作透视表:

# 透视数据
df_p = df.pivot_table(index=['学院','学科'],    # 透视的行,分组依据columns='年份', # 设置列为年份values='报名人数',    # 值aggfunc='sum'    # 聚合函数)
df_p

添加总计列:

df_p.columns=['2006','2007','2008']
df_p['总计'] = df_p.sum(axis=1)
df_p

结果:

最后追加一行总计数据行

result = df_p.sum(axis=0) # 此时是一个Series对象
result['学院'] = '总计'  # 添加数据
result['学科'] =''
# 对result进行转置
df_1 = pd.DataFrame(data=result)
df2 = df_1.T
df2.set_index(['学院','学科'],inplace=True)
# 在df_p上添加一行
df_p = df_p.append(df2)

这样我们就得到了同样的效果。

扫码添加请备注:python,进群与宋老师面对面交流:517745409

 

这篇关于左手Python右手Excel,玩转数据透视表哪家强?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/215582

相关文章

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

Python包管理工具pip的升级指南

《Python包管理工具pip的升级指南》本文全面探讨Python包管理工具pip的升级策略,从基础升级方法到高级技巧,涵盖不同操作系统环境下的最佳实践,我们将深入分析pip的工作原理,介绍多种升级方... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

Python中将嵌套列表扁平化的多种实现方法

《Python中将嵌套列表扁平化的多种实现方法》在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋... 目录python中将嵌套列表扁平化的方法技术背景实现步骤1. 使用嵌套列表推导式2. 使用itert

使用Docker构建Python Flask程序的详细教程

《使用Docker构建PythonFlask程序的详细教程》在当今的软件开发领域,容器化技术正变得越来越流行,而Docker无疑是其中的佼佼者,本文我们就来聊聊如何使用Docker构建一个简单的Py... 目录引言一、准备工作二、创建 Flask 应用程序三、创建 dockerfile四、构建 Docker

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v