《SQL必知必会——第9、10、11课:汇总数据、分组数据、使用子查询》

2024-08-28 13:58

本文主要是介绍《SQL必知必会——第9、10、11课:汇总数据、分组数据、使用子查询》,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

       第9课 汇总数据
       用过excel的对这个知识点理解起来就毫不费力了,excel里面有很多统计类的汇总函数,同样sql里面也有,也就是对某些行运行聚集函数,计算并返回一个值。sql主要有以下聚集函数:avg(),count(),max(),min(),sum(),看到函数名,基本也就知道是做什么的了,比如:select avg(price) as avg_price from products; 这就是返回products表中所有产品的平均价格。而count()函数是统计表中行的数目,这里面有一个需要注意的点,那就是count(*)统计范围比较广,即使表中某一行包含空值,也会被统计,而count(column_name)统计指定列行数时,会忽略为空的行。而我们实际工作中还有一种形式用的较多,那就是count(1),很多资料说count(1)比count(*)效率高,但是实际我没有具体对比过,不同的dbms估计也会有一些差异,在mysql下,我一般用count(1)比较多些。后面的几个聚集函数不做过多赘述了,实在比较简单,使用时注意一下min()/max()/sum()是都忽略空行数据的。如果想聚集不同的值,则需要使用distinct关键字去重。这里面在提一下,以前说过sql中不写复杂业务逻辑,可以使用简单的聚集函数,因为如果把数据查出来,自己在客户端汇总、计算,比如取平均,实际效率远没有sql的avg()函数高。

       第10课 分组数据
       分组主要使用group by子句,使用分组可以将数据分为多个逻辑组,对每个组进行聚集计算。比如:select vend_id, count(*) from products group by vend_id;执行该sql,就会先将所有数据按照vend_id分组,然后计算每个组行数。分组功能很强大,一条语句可以简化非常多的业务代码逻辑,但是使用分组时还是有很多条条框框需要注意:
       (1)除聚集计算语句外,select中的每一列都必须在group by子句中给出。这句话信息量比较大,首先group by分组时,后面可以跟任意数目列,也就是group by a,b,c,d 都行,由于多个列组合分组,那么分出的组将会非常多,也会更细致。其次,查询出来的列,也就是select后面跟的列,除了聚集函数外,实际是固定的,也就是group by a, b,那么select a, b, c, count(1),多出一个c字段将导致sql语句报错,无法编译。简言之,select什么,就要group by什么,除了聚集函数,其他字段一一对应。
       (2)如果分组中包含null值的行,则将null值作为一个分组返回,也就是该列中所有null值将被分到一组。
       (3)group by子句必须出现在where子句之后,order by子句之前。这里对该子句位置做了限定,位置不对,同样无法编译通过。
       过滤分组:
       如果分组后,组数很多,数据量仍然很大,想要过滤一些数据怎么办?可以使用having子句,这里不得不提where,这两个子句都是过滤数据,where是行级过滤,而having是分组过滤。也就是说where所处理的对象是行,在数据分组前就已经起作用了,已经把数据过滤了,having所处理的对象是分组,需要数据分组后才能起相应的作用。
比如:select vend_id, count(1) from products where price>=4 group by vend_id having count(1)>=2; 很明显,where子句先筛选出所有price大于等于4的行,然后按照vend_id分组数据,最后在筛选出所有组内数目大于等于2的数据,这样对where和having的用法和区别就比较清晰了。

       分组和排序:
       用group by分组的数据是以分组顺序输出的,但未必是你所需要的排序顺序,可以结合order by子句,对分组结果进行排序输出。前面已经说了这两个子句的位置,order by位于最后。比如:select order_num, count(1) as items from OrderItems group by order_num having count(1) >=3 order by items, order_num desc; 比较简单,就是分组、过滤、排序,很好理解。很多时候就是一开始觉得难理解,看几次、混个脸熟、再看几次,就简单了。

       第11课 使用子查询
       子查询可以理解为查询中的查询,一般使用场景是用于where子句的in操作符,为什么这么说呢,因为子查询的select语句只能查询单个列,查询出来的单个列可以做上一级查询in操作符的过滤条件。比如:select cust_id from orders where order_num in (select order_num from OrderItems where prod_id='A001');执行时,将从内向外执行,也就是子查询先执行,返回查询结果,然后父查询在接着执行,最后输出结果。但不得不说包含子查询的sql语句阅读和调试比较复杂,性能也不高,工作中还是尽量少用。

这篇关于《SQL必知必会——第9、10、11课:汇总数据、分组数据、使用子查询》的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1114958

相关文章

如何使用 Python 读取 Excel 数据

《如何使用Python读取Excel数据》:本文主要介绍使用Python读取Excel数据的详细教程,通过pandas和openpyxl,你可以轻松读取Excel文件,并进行各种数据处理操... 目录使用 python 读取 Excel 数据的详细教程1. 安装必要的依赖2. 读取 Excel 文件3. 读

Go语言开发实现查询IP信息的MCP服务器

《Go语言开发实现查询IP信息的MCP服务器》随着MCP的快速普及和广泛应用,MCP服务器也层出不穷,本文将详细介绍如何在Go语言中使用go-mcp库来开发一个查询IP信息的MCP... 目录前言mcp-ip-geo 服务器目录结构说明查询 IP 信息功能实现工具实现工具管理查询单个 IP 信息工具的实现服

解决Maven项目idea找不到本地仓库jar包问题以及使用mvn install:install-file

《解决Maven项目idea找不到本地仓库jar包问题以及使用mvninstall:install-file》:本文主要介绍解决Maven项目idea找不到本地仓库jar包问题以及使用mvnin... 目录Maven项目idea找不到本地仓库jar包以及使用mvn install:install-file基

Windows 上如果忘记了 MySQL 密码 重置密码的两种方法

《Windows上如果忘记了MySQL密码重置密码的两种方法》:本文主要介绍Windows上如果忘记了MySQL密码重置密码的两种方法,本文通过两种方法结合实例代码给大家介绍的非常详细,感... 目录方法 1:以跳过权限验证模式启动 mysql 并重置密码方法 2:使用 my.ini 文件的临时配置在 Wi

MySQL重复数据处理的七种高效方法

《MySQL重复数据处理的七种高效方法》你是不是也曾遇到过这样的烦恼:明明系统测试时一切正常,上线后却频频出现重复数据,大批量导数据时,总有那么几条不听话的记录导致整个事务莫名回滚,今天,我就跟大家分... 目录1. 重复数据插入问题分析1.1 问题本质1.2 常见场景图2. 基础解决方案:使用异常捕获3.

Spring 请求之传递 JSON 数据的操作方法

《Spring请求之传递JSON数据的操作方法》JSON就是一种数据格式,有自己的格式和语法,使用文本表示一个对象或数组的信息,因此JSON本质是字符串,主要负责在不同的语言中数据传递和交换,这... 目录jsON 概念JSON 语法JSON 的语法JSON 的两种结构JSON 字符串和 Java 对象互转

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数?getopt模块基础实际应用示例与其他参数处理方式的比较常见问http

SQL中redo log 刷⼊磁盘的常见方法

《SQL中redolog刷⼊磁盘的常见方法》本文主要介绍了SQL中redolog刷⼊磁盘的常见方法,将redolog刷入磁盘的方法确保了数据的持久性和一致性,下面就来具体介绍一下,感兴趣的可以了解... 目录Redo Log 刷入磁盘的方法Redo Log 刷入磁盘的过程代码示例(伪代码)在数据库系统中,r

C 语言中enum枚举的定义和使用小结

《C语言中enum枚举的定义和使用小结》在C语言里,enum(枚举)是一种用户自定义的数据类型,它能够让你创建一组具名的整数常量,下面我会从定义、使用、特性等方面详细介绍enum,感兴趣的朋友一起看... 目录1、引言2、基本定义3、定义枚举变量4、自定义枚举常量的值5、枚举与switch语句结合使用6、枚

mysql中的group by高级用法

《mysql中的groupby高级用法》MySQL中的GROUPBY是数据聚合分析的核心功能,主要用于将结果集按指定列分组,并结合聚合函数进行统计计算,下面给大家介绍mysql中的groupby用法... 目录一、基本语法与核心功能二、基础用法示例1. 单列分组统计2. 多列组合分组3. 与WHERE结合使