MySQL使用窗口函数ROW_NUMBER()、DENSE_RANK()查询每组第一名或每组前几名,窗口函数使用详解

本文主要是介绍MySQL使用窗口函数ROW_NUMBER()、DENSE_RANK()查询每组第一名或每组前几名,窗口函数使用详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

MySQL数据表结构

创建 tbl_class_info 表,表中有四个字段 id、username、score、group_name

使用 ROW_NUMBER()、DENSE_RANK() 查询每组前三名

-- 查询每组前3名
SELECT username, score, group_name  
FROM (  SELECT username, score, group_name,  ROW_NUMBER() OVER (PARTITION BY group_name ORDER BY score DESC) AS test_rank,DENSE_RANK() OVER (PARTITION BY group_name ORDER BY score DESC) AS test_dense_rank  FROM tbl_class_info 
) AS ranked_scores  
WHERE test_rank <= 3 OR test_dense_rank <= 3

查询结果:

使用 ROW_NUMBER()、DENSE_RANK() 查询第二名

-- 查询每组第2名
SELECT username, score, group_name  
FROM (  SELECT username, score, group_name,  ROW_NUMBER() OVER (PARTITION BY group_name ORDER BY score DESC) AS test_rank FROM tbl_class_info 
) AS ranked_scores  
WHERE test_rank = 2

查询结果:

使用 ROW_NUMBER()、DENSE_RANK() 查询结果是不同的,

ROW_NUMBER()和DENSE_RANK()是常见的窗口函数,它们可以用于对结果集中的行进行排序和编号,它们的主要区别在于 使用DENSE_RANK()函数为每个组(group_name)中的记录根据成绩(score)降序排列,并为每组中的行分配一个唯一的序号(rank

与ROW_NUMBER()不同,如果存在相同的成绩,DENSE_RANK()会为它们分配连续的序号,而不会跳过任何数字。下面是实例说明:

ROW_NUMBER()、DENSE_RANK() 区别详解

使用ROW_NUMBER()查询数据:

SELECTusername,score,group_name,ROW_NUMBER() OVER (PARTITION BY group_name
ORDER BYscore DESC) AS rank_number
FROMtbl_class_info;

执行结果可以看到,即使成绩(score)相同,rank_number 序号也是不同的

使用 DENSE_RANK() 查询数据:

SELECTusername,score,group_name,DENSE_RANK() OVER (PARTITION BY group_name
ORDER BYscore DESC) AS rank_number
FROMtbl_class_info;

执行结果可以看到,即使成绩(score)相同,rank_number 序号也是相同的

所以总的来说,ROW_NUMBER() 和 DENSE_RANK() 都是非常有用的窗口函数,它们可以用于各种数据分析任务。但是,它们之间的区别意味着它们适用于不同的场景。如果您需要为每个行分配唯一的数字,即使在有重复值的情况下也是如此,那么 ROW_NUMBER() 是更好的选择。如果您需要为每个行分配唯一的数字,但如果有重复值,则需要跳过重复值,那么 DENSE_RANK() 是更好的选择。

MySQL窗口函数的使用语法

SELECT <窗口函数> OVER ([PARTITION BY <表达式>][ORDER BY <表达式>][ROWS BETWEEN <表达式> AND <表达式>]
)
FROM <表名>

 其中: 

  • <窗口函数>  是窗口函数的名称。 
  • PARTITION BY <表达式>  是分区表达式。分区表达式用于将表中的行分成多个分区。 
  • ORDER BY <表达式>  是排序表达式。排序表达式用于对分区中的行进行排序。 
  • ROWS BETWEEN <表达式> AND <表达式>  是行范围表达式。行范围表达式用于指定窗口函数计算的行的范围。
SELECTgroup_name,AVG(score) OVER (PARTITION BY group_name
ORDER BYscore DESC ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS avg_sales
FROMtbl_class_info;

执行结果:

注:在窗口函数中,ROWS BETWEEN <表达式> AND <表达式> 用于指定窗口的边界范围。这个范围是根据指定的表达式来确定的。通常,第一个表达式指定了窗口的起始行,第二个表达式指定了窗口的结束行。

在计算窗口函数之前,数据库会先确定窗口的范围。然后,根据指定的窗口范围,对范围内的行进行运算。通常,窗口函数会对窗口内的每一行执行计算,并返回一个与窗口范围相对应的结果。
 

MySQL中常见的窗口函数有哪些

  SUM()函数:计算指定列的总和。

SELECT column1, SUM(column2) OVER (PARTITION BY column1) AS total_sum  
FROM table;

  AVG()函数:计算指定列的平均值。

SELECT column1, AVG(column2) OVER (PARTITION BY column1) AS average_value  
FROM table;

  MIN()函数:返回指定列的最小值。

SELECT column1, MIN(column2) OVER (PARTITION BY column1) AS minimum_value  
FROM table;

  MAX()函数:返回指定列的最大值。

SELECT column1, MAX(column2) OVER (PARTITION BY column1) AS maximum_value  
FROM table;

  COUNT()函数:计算指定列的非空值的数量。

SELECT column1, COUNT(column2) OVER (PARTITION BY column1) AS count_value  
FROM table;

  RANK()函数:返回一组行的排名。

SELECT column1, RANK() OVER (ORDER BY column2 DESC) AS rank_value  
FROM table;

  DENSE_RANK()函数:返回一组行的不间断排名。

SELECT column1, DENSE_RANK() OVER (ORDER BY column2 DESC) AS dense_rank_value  
FROM table;

  ROW_NUMBER()函数:为一组行分配一个唯一的数字。

SELECT column1, ROW_NUMBER() OVER (PARTITION BY column1 ORDER BY column2 DESC) AS row_number_value  
FROM table;

MySQL窗口函数和聚合函数的区别

窗口函数和聚合函数都是在数据库中对数据进行计算的函数。但是,它们之间有一些关键区别。 

  • 窗口函数返回一个单个值,该值是基于一组行计算的。这组行称为窗口。窗口函数可以使用窗口中的所有行,也可以使用窗口中的部分行。 
  • 聚合函数返回一个单个值,该值是基于整个表中的数据计算的。聚合函数不能使用窗口,因为它们需要访问整个表的数据才能计算结果。 
SELECT SUM(sales) FROM orders;SELECT SUM(sales) OVER (PARTITION BY product_id ORDER BY order_date);

第一个查询使用聚合函数 SUM 计算整个表中所有订单的总销售额。
第二个查询使用窗口函数 SUM 计算每个产品的总销售额。窗口函数 SUM 使用 ORDER BY 子句对订单按日期排序,然后计算每个产品的总销售额。 
窗口函数和聚合函数都是在数据库中对数据进行计算的强大工具。但是,它们之间有一些关键区别,因此在选择使用哪种函数时需要考虑这些区别。

这篇关于MySQL使用窗口函数ROW_NUMBER()、DENSE_RANK()查询每组第一名或每组前几名,窗口函数使用详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/485819

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传