03 -描述统计学- Lesson5 电子表格3_分析数据

2023-11-06 06:20

本文主要是介绍03 -描述统计学- Lesson5 电子表格3_分析数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

03 描述统计学 Lesson5 电子表格3:分析数据

文章目录

  • 03 描述统计学 Lesson5 电子表格3:分析数据
    • 2.聚合函数
    • 4.逻辑函数:IF 函数
    • 6.逻辑函数:AND、OR、NOT
    • 7.练习:逻辑函数
    • 8.条件聚合函数
    • 9.练习:COUNTIF、SUMIF 函数
    • 10.数据透视表
    • 11.练习:数据透视表
    • 12.命名区域
    • 14.Lookup函数
    • 15.练习:VLOOKUP函数

2.聚合函数

聚合,就是把大量的数据特征用一个值来表达(Aggregation Fuction: Function that operates across a group of data resulting in a single value),有以下5个值:

  • SUM 求和
  • AVERAGE 平均数
  • MAX 最大值
  • MIN 最小值
  • MEDIAN 中值(把数据从小到大排序,排在中间的那个值)
  • STDEV 标准差(衡量每个值和平均值差异,差异越大,标准差越大)

其中 SUM 已经在前面使用过了,其他的用法和 SUM 一样。除了聚合函数,课程 1:50 开始还介绍了怎么快速建立条形图(Bar Chart):

  • 选中数据
  • ‘Insert’-‘Bar Chart’ 生成条形图
  • ‘Design’ 可以修改默认样式

4.逻辑函数:IF 函数

在这里插入图片描述

IF 是编程中通用的条件判断关键字。代表如果达到条件执行一件事,如果达不到条件则执行另一件事。参照上面的语法:

  • condition 是判断的条件
  • value if TRUE 如果判断为真(通过判断)就执行这里的语句
  • [value if FALSE] 如果判断为假(没通过判断)就执行这里的语句,注意用[ ]扩起来的意思是说,这个部分可以不写,则在判断为假的时候不执行任何操作。需要注意的是,如果省略了但条件判断为假,则会输出 False。

课程中的例子也是这样:
在这里插入图片描述

课程中的实操的例子中使用了 > 大于号作为比较运算符(Comparison Operator: Compare the relative size of equality of two values with these operators - Result is a logical value either TRUE of FALSE)。需要注意一点,比较运算符的输出为 TRUE 或 FALSE,共有以下几种:

  • Greater than 大于

  • < Less than 小于
  • = Equal 等于
  • = Greater thatn or equal 大于等于

  • <= Less than or equal 小于等于
  • <> Not equal 不等于

6.逻辑函数:AND、OR、NOT

AND 和 IF 一样是函数(函数的参数在小括弧中,Excel 中看到小括弧就是函数),是把多个条件的真假一起考虑,全部为真则输出真,否则就输出假:

` =AND(condition1,condition2,...) `

三种逻辑函数的总结:

  • AND: true if all conditions are true
  • OR: true if any condition is true
  • NOT: reverses true and false

当然,逻辑函数最常见的是和IF一起使用:

在这里插入图片描述

7.练习:逻辑函数

对于3个条件,我们来进行拆解:

  • 如果一个订单中任意一种水果的最大数量超过 10 件,A1:D1>10
  • 或订单中的总水果量超过 20 件,E1>10(注意这两个条件要用OR() 包裹起来
  • 则将其标记为 “Special Order”,否则,则标记为 “No”。用IF嵌套AND表达。

PS:出错的怎么办:

  • 公式出错的话会在单元格中出现#VALUE!
  • 同时左边出现小三角可以帮助定位错误,点击后会有提示:

在这里插入图片描述

  • 可以在其他单元格将公式进行拆分,一步一步定位错误

    • 比如所我开始写了OR(A1:A4>10)报错
    • 其实原因是不支持A1:A4这种范围的比较
    • 需要每个都比较,再用逗号分隔(测试了3次,搞定):
      在这里插入图片描述
  • 注意IF判断之后要显示的文字要用双引号扩起来

  • 当出错的时候,点击fx打开公式生成器一点一点排错很有帮助(可以看到嵌套中的结果):

在这里插入图片描述

8.条件聚合函数

将条件和聚合函数嵌套,就得到了条件聚合函数(Conditional Aggregation Function: Function that operates across a group of data with logical conditions)。

课程中的 COUNTIF 和 SUMIF 的区别是,前者是数有几个,后者是求和,扩展链接:
COUNTIF 函数
SUMIF 函数

9.练习:COUNTIF、SUMIF 函数

这节请注意 SUMIF 有3个参数:判断范围、判断条件、求和范围。另外,如果是在 MAC Office 上,所有涉及公式累的编辑和存储,建议完成后存储为 xlsx 格式,否则csv会丢失公式信息。

10.数据透视表

数据透视表是 Excel 非常强大的功能,一次输入数据,可以根据选择进行各种筛选和展示。(有点像Tableau这种敏捷BI程序,这个后续专门课程会讲)。MAC 打开数据透视表的方式是:

在这里插入图片描述

11.练习:数据透视表

数据透视表有些复杂,练习请一定要完成,练习中的计算salary的提示如下:

在这里插入图片描述

12.命名区域

MAC 和 Windows 的‘命名区域’位置相同:

在这里插入图片描述

14.Lookup函数

Lookup 是可以使用关键字在表格中查询其他信息的函数,包括LOOKUP(按行查找 Horizontal)和 VLOOKUP(按列查找 Vertical)(Lookup Function: Function that uses a keyword and index to “Look up” a value in a table.)

LOOKUP 函数

15.练习:VLOOKUP函数

练习按照 check list 分解做就可以了。注意要先创建2个‘命名区域’,再做VLOOKUP,在选择VLOOKUP的第二个参数时,就可以看到创建的 airline_lookupairport_lookup 两个参数(MAC):

在这里插入图片描述

问题提示:
Q1 伦敦:

  • 在完成 VLOOKUP 之后,使用 COUNTIF ,注意检查判断条件,题目中的 London Heathrow 的拼写和数据中是否一致。

Q2 唯一的航空公司:

  • 方法1:使用数据透视表 + COUNTA
    • 使用数据透视表可以将每个航空公司出现的次数计算出来(可以看出来那家航空公司的飞行的次数比较多):
      在这里插入图片描述
    • 对输出结果用 COUNTA 函数计算值的数量
  • 方法2:高级过滤 + COUNTA
    • 使用‘高级过滤’将独特的数据过滤出来到新的位置(图中的例子是数不同的目的地机场,请同学们理解后自己完成不同航空公司的问题):
      在这里插入图片描述
    • 对输出结果用 COUNTA 函数计算值的数量
    • 这种方式的区别是所有非独特值都依次有输出,可以copy文字道别的地方使用(比如word的报告中)

Q3 航线第二多的航空公司:

  • 在Q2的生成的数据透视表中,进行排序。MAC的操作提示如下:
    在这里插入图片描述

这篇关于03 -描述统计学- Lesson5 电子表格3_分析数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/354927

相关文章

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

Spring事务中@Transactional注解不生效的原因分析与解决

《Spring事务中@Transactional注解不生效的原因分析与解决》在Spring框架中,@Transactional注解是管理数据库事务的核心方式,本文将深入分析事务自调用的底层原理,解释为... 目录1. 引言2. 事务自调用问题重现2.1 示例代码2.2 问题现象3. 为什么事务自调用会失效3

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

找不到Anaconda prompt终端的原因分析及解决方案

《找不到Anacondaprompt终端的原因分析及解决方案》因为anaconda还没有初始化,在安装anaconda的过程中,有一行是否要添加anaconda到菜单目录中,由于没有勾选,导致没有菜... 目录问题原因问http://www.chinasem.cn题解决安装了 Anaconda 却找不到 An

Spring定时任务只执行一次的原因分析与解决方案

《Spring定时任务只执行一次的原因分析与解决方案》在使用Spring的@Scheduled定时任务时,你是否遇到过任务只执行一次,后续不再触发的情况?这种情况可能由多种原因导致,如未启用调度、线程... 目录1. 问题背景2. Spring定时任务的基本用法3. 为什么定时任务只执行一次?3.1 未启用

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密