【SQL经典题目】连续日期判断、同时在线人数、会话划分、间隔日期连续、日期交叉

本文主要是介绍【SQL经典题目】连续日期判断、同时在线人数、会话划分、间隔日期连续、日期交叉,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【1.查询至少连续3天下单的用户】

思路1(使用lead):

  1. distinct user_id,create_date去重,确保每个用户每天只有一条访问记录
  2. lead(create_date,2,‘9999-12-31’) over(partition by user_id order by create_date)根据用户分区,订单日期排序,取后2行的订单日期(取不到则返回’9999-12-31’)
  3. 用datediff计算【订单日期】与【后2行订单日期】的差值,如果等于2则说明存在连续3天下单
    在这里插入图片描述
  4. 筛选出datediff等于2的记录,distinct user_id即可

思路2(使用row_number):

  1. distinct user_id,create_date去重,确保每个用户每天只有一条访问记录
  2. row_number() over(partition by user_id order by create_date)按用户分区,按访问日期排序,添加序号
  3. 每个日期与序号相减获得一个新的日期
    在这里插入图片描述
  4. group by user_id,diff对用户和新的日期进行分组,然后count()统计日期,判断count() >=3
    在这里插入图片描述

【2. 用户登录日志表user_id,visit_date 用sql查询出近30天连续访问7天以上的用户数量】
思路:

  1. 筛选近30天每个用户的访问记录,并去重确保同一个用户当天只有一条记录
  2. 对用户分组按访问日期排序,添加序号
  3. 每条记录的访问日期与对应的序号相减,获得一个新的日期字段
  4. group by用户,新的日期字段,统计个数,having筛选大于等于7
select user_id,diff,count(*) as cnt
from
(select user_id,visit_date,date_sub(visit_date,row_number() over(partition by user_id order by visit_date)) as difffrom (select distinct user_id,visit_date from table where visit_date >= date_sub(current_date,30)) t1
) t2
group by user_id,diff
having cnt >= 7

【3. 计算某段时间内同时在线人数最大值】
核心思路:

按时间排序,逐条处理(从上到下累加),获取每个时刻在线人数,取最大值

具体实现:

  1. 筛选出每个人的登陆记录并加一个字段1(id,登陆时间,1) union all 每个人的登出记录并加一个字段-1(id,登出时间,-1)
  2. 按照登陆/登出时间升序排序
  3. sum()并开窗,窗口范围首行到当前行,即计算累加值(此时数据表示了每一个时刻的在线总人数)
  4. max()计算累加值中的最大值(即同时在线人数最大值)

【4. 同一个用户相邻两次访问记录小于60s,则认为属于一个会话。现需对同一会话的访问记录增加会话id字段 】(会话划分问题)
核心思路:

按每个用户的会话时间排序,找到每个用户会话的起点并加标签1,不是起点则加标签0,同一用户对标签进行累加,每个用户不同会话则会有不同的标签

思路:

  1. 对每个用户开窗并按访问时间排序,用lag()取上一次访问时间,取不到上一条则默认为0
    在这里插入图片描述

  2. 每条访问记录减去上一次访问时间,差值>60则赋值1,否则赋值0(用1表示每个会话的起点)
    在这里插入图片描述

  3. 对每个用户开窗,窗口范围首行到当前行,用sum()进行累加
    在这里插入图片描述

  4. 用user_id拼接上累加值,表示每个会话
    在这里插入图片描述

【5. 用户登陆记录表(user_id,login_datetime),每行表达一个用户何时登陆,求各用户最长的连续登陆天数(间断1天也算连续)】(间断连续日期判断问题)
核心思路1:

用explode()将中间空1天的记录补充上,转化成连续日期的判断问题
(比如2条记录2021-12-03、2021-12-05 变成3条记录 2021-12-03、2021-12-04、2021-12-05)

思路1:

  1. 每个用户按照登陆日期去重
  2. 每个用户按登陆日期升序排列,用lead()取该用户下一次的登陆时间
    在这里插入图片描述
  3. 如果下次登陆日期和本次登陆日期相差为2,则用array()创建数组,包含本次登录日期、本次登录日期+1
    在这里插入图片描述
  4. 用explode()函数进行炸裂,此时就补充上了空缺日期
    在这里插入图片描述
  5. 按照【题目1】进行连续日期判断即可

核心思路2:

找到每次连续区间的起始日期,赋1,其它日期赋0,将问题转化为会话划分问题,取每个会话中的max日期-min日期,即为连续天数

思路2:

  1. 每个用户按照登陆日期去重
  2. 每个用户按登陆日期升序排列,用lag()取该用户上一次的登陆时间
    在这里插入图片描述
  3. 本次登录日期 减去 上次登录日期 >2的话则赋1,否则赋0
    在这里插入图片描述
  4. 对每个用户开窗,窗口范围首行到当前行,用sum()进行累加
    在这里插入图片描述
  5. 对每个用户、会话标签进行分组,取每个会话中max(login_date) - min(login_date) + 1即为最长连续天数。

【6.】(日期交叉问题)
核心思路:

思路1:

  1. 每个用户按照登陆日期去重

思路2:

这篇关于【SQL经典题目】连续日期判断、同时在线人数、会话划分、间隔日期连续、日期交叉的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/538047

相关文章

MySQL 日期时间格式化函数 DATE_FORMAT() 的使用示例详解

《MySQL日期时间格式化函数DATE_FORMAT()的使用示例详解》`DATE_FORMAT()`是MySQL中用于格式化日期时间的函数,本文详细介绍了其语法、格式化字符串的含义以及常见日期... 目录一、DATE_FORMAT()语法二、格式化字符串详解三、常见日期时间格式组合四、业务场景五、总结一、

mysql线上查询之前要性能调优的技巧及示例

《mysql线上查询之前要性能调优的技巧及示例》文章介绍了查询优化的几种方法,包括使用索引、避免不必要的列和行、有效的JOIN策略、子查询和派生表的优化、查询提示和优化器提示等,这些方法可以帮助提高数... 目录避免不必要的列和行使用有效的JOIN策略使用子查询和派生表时要小心使用查询提示和优化器提示其他常

C++实现回文串判断的两种高效方法

《C++实现回文串判断的两种高效方法》文章介绍了两种判断回文串的方法:解法一通过创建新字符串来处理,解法二在原字符串上直接筛选判断,两种方法都使用了双指针法,文中通过代码示例讲解的非常详细,需要的朋友... 目录一、问题描述示例二、解法一:将字母数字连接到新的 string思路代码实现代码解释复杂度分析三、

grom设置全局日志实现执行并打印sql语句

《grom设置全局日志实现执行并打印sql语句》本文主要介绍了grom设置全局日志实现执行并打印sql语句,包括设置日志级别、实现自定义Logger接口以及如何使用GORM的默认logger,通过这些... 目录gorm中的自定义日志gorm中日志的其他操作日志级别Debug自定义 Loggergorm中的

MySQL InnoDB引擎ibdata文件损坏/删除后使用frm和ibd文件恢复数据

《MySQLInnoDB引擎ibdata文件损坏/删除后使用frm和ibd文件恢复数据》mysql的ibdata文件被误删、被恶意修改,没有从库和备份数据的情况下的数据恢复,不能保证数据库所有表数据... 参考:mysql Innodb表空间卸载、迁移、装载的使用方法注意!此方法只适用于innodb_fi

mysql通过frm和ibd文件恢复表_mysql5.7根据.frm和.ibd文件恢复表结构和数据

《mysql通过frm和ibd文件恢复表_mysql5.7根据.frm和.ibd文件恢复表结构和数据》文章主要介绍了如何从.frm和.ibd文件恢复MySQLInnoDB表结构和数据,需要的朋友可以参... 目录一、恢复表结构二、恢复表数据补充方法一、恢复表结构(从 .frm 文件)方法 1:使用 mysq

mysql8.0无备份通过idb文件恢复数据的方法、idb文件修复和tablespace id不一致处理

《mysql8.0无备份通过idb文件恢复数据的方法、idb文件修复和tablespaceid不一致处理》文章描述了公司服务器断电后数据库故障的过程,作者通过查看错误日志、重新初始化数据目录、恢复备... 周末突然接到一位一年多没联系的妹妹打来电话,“刘哥,快来救救我”,我脑海瞬间冒出妙瓦底,电信火苲马扁.

MySQL进阶之路索引失效的11种情况详析

《MySQL进阶之路索引失效的11种情况详析》:本文主要介绍MySQL查询优化中的11种常见情况,包括索引的使用和优化策略,通过这些策略,开发者可以显著提升查询性能,需要的朋友可以参考下... 目录前言图示1. 使用不等式操作符(!=, <, >)2. 使用 OR 连接多个条件3. 对索引字段进行计算操作4

MySQL表锁、页面锁和行锁的作用及其优缺点对比分析

《MySQL表锁、页面锁和行锁的作用及其优缺点对比分析》MySQL中的表锁、页面锁和行锁各有特点,适用于不同的场景,表锁锁定整个表,适用于批量操作和MyISAM存储引擎,页面锁锁定数据页,适用于旧版本... 目录1. 表锁(Table Lock)2. 页面锁(Page Lock)3. 行锁(Row Lock

MySQL zip安装包配置教程

《MySQLzip安装包配置教程》这篇文章详细介绍了如何使用zip安装包在Windows11上安装MySQL8.0,包括下载、解压、配置环境变量、初始化数据库、安装服务以及更改密码等步骤,感兴趣的朋... 目录mysql zip安装包配置教程1、下载zip安装包:2、安装2.1 解压zip包到安装目录2.2