SQL技巧笔记(一):连续3人的连号问题—— LeetCode601.体育馆的人流量

本文主要是介绍SQL技巧笔记(一):连续3人的连号问题—— LeetCode601.体育馆的人流量,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

SQL 技巧笔记

前言:我发现大数据招聘岗位上的应聘流程都是需要先进行笔试,其中占比很大的部分是SQL题目,经过一段时间的学习之后,今天开了一个力扣年会员,我觉得我很有必要去多练习笔试题目,这些题目是有技巧性的,很贴近生活!

Tips:我很享受独自做出题目的感觉,也很喜欢和大家分享自己的思路!我会继续努力,遇到有趣的题目,独特的思路会和大家多多交流!

文章目录

  • SQL 技巧笔记
    • 一、连续 3 人的连号问题
      • 1. 题目来源
      • 2. 题目描述
      • 3. 题目理解
      • 4. 思路顺序
        • (1) 筛选每行的人数大于或等于 `100`
        • (2) 找出 id,前一个 id,后一个 id
        • (3) 找出三个id之间的关系
        • (4) 找出五个id之间的关系
      • 5. 提交答案

一、连续 3 人的连号问题

1. 题目来源

  • LeetCode 601.体育馆的人流量
  • 困难型题目
  • 网易公司的笔试题

2. 题目描述

表:Stadium

+---------------+---------+
| Column Name   | Type    |
+---------------+---------+
| id            | int     |
| visit_date    | date    |
| people        | int     |
+---------------+---------+
visit_date 是该表中具有唯一值的列。
每日人流量信息被记录在这三列信息中:序号 (id)、日期 (visit_date)、 人流量 (people)
每天只有一行记录,日期随着 id 的增加而增加

编写解决方案找出每行的人数大于或等于 100id 连续的三行或更多行记录。

返回按 visit_date 升序排列 的结果表。

查询结果格式如下所示。

示例 1:

输入:
Stadium 表:
+------+------------+-----------+
| id   | visit_date | people    |
+------+------------+-----------+
| 1    | 2017-01-01 | 10        |
| 2    | 2017-01-02 | 109       |
| 3    | 2017-01-03 | 150       |
| 4    | 2017-01-04 | 99        |
| 5    | 2017-01-05 | 145       |
| 6    | 2017-01-06 | 1455      |
| 7    | 2017-01-07 | 199       |
| 8    | 2017-01-09 | 188       |
+------+------------+-----------+
输出:
+------+------------+-----------+
| id   | visit_date | people    |
+------+------------+-----------+
| 5    | 2017-01-05 | 145       |
| 6    | 2017-01-06 | 1455      |
| 7    | 2017-01-07 | 199       |
| 8    | 2017-01-09 | 188       |
+------+------------+-----------+
解释:
id 为 5、6、7、8 的四行 id 连续,并且每行都有 >= 100 的人数记录。
请注意,即使第 7 行和第 8 行的 visit_date 不是连续的,输出也应当包含第 8 行,因为我们只需要考虑 id 连续的记录。
不输出 id 为 2 和 3 的行,因为至少需要三条 id 连续的记录。

数据源:

Create table If Not Exists Stadium (id int, visit_date DATE NULL, people int);
Truncate table Stadium;
insert into Stadium (id, visit_date, people) values ('1', '2017-01-01', '10');
insert into Stadium (id, visit_date, people) values ('2', '2017-01-02', '109');
insert into Stadium (id, visit_date, people) values ('3', '2017-01-03', '150');
insert into Stadium (id, visit_date, people) values ('4', '2017-01-04', '99');
insert into Stadium (id, visit_date, people) values ('5', '2017-01-05', '145');
insert into Stadium (id, visit_date, people) values ('6', '2017-01-06', '1455');
insert into Stadium (id, visit_date, people) values ('7', '2017-01-07', '199');
insert into Stadium (id, visit_date, people) values ('8', '2017-01-09', '188');

3. 题目理解

  • 需求一:编写解决方案找出每行的人数大于或等于 100

  • 需求二:且 id 连续的三行或更多行记录。

  • 需求三:返回按 visit_date 升序排列 的结果表。


4. 思路顺序

(1) 筛选每行的人数大于或等于 100

代码:

SELECT*
FROM Stadium WHERE people >=100

效果:发现 id 为 5, 6, 7, 8 满足至少连 3 号

在这里插入图片描述


(2) 找出 id,前一个 id,后一个 id

代码:

SELECTid,LAG(id,1) OVER(ORDER BY id) as pre_id, # 前一个idLEAD(id,1) OVER(ORDER BY id) as next_id, # 后一个idvisit_date,peopleFROM Stadium WHERE people >=100

效果:发现最前面的id 的前一个id为null,最后一个id的后一个id为null

在这里插入图片描述


(3) 找出三个id之间的关系

代码:

with t1 as(SELECTid,LAG(id,1) OVER(ORDER BY id) as pre_id, # 前一个idLEAD(id,1) OVER(ORDER BY id) as next_id, # 后一个idvisit_date,peopleFROM Stadium WHERE people >=100
)
select id,visit_date,people from t1
where
(id = pre_id + 1 and id = next_id - 1) OR # 当前 id 是连续序列的中间部分
(next_id = id + 1 and pre_id is null ) OR # 当前 id 是连续序列的最开始部分
(pre_id = id - 1 and next_id is null)    # 当前 id 是连续序列的最结束部分
order by id;

效果:发现原本需要的 5 居然不见了,明显找三者关系条件远远不够

在这里插入图片描述


(4) 找出五个id之间的关系

代码:

with t1 as(SELECTid,LAG(id,1) OVER(ORDER BY id) as pre_id, # 前一个idLAG(id,2) OVER (ORDER BY id) as pre_2_id, # 前两个idLEAD(id,1) OVER(ORDER BY id) as next_id, # 后一个idLEAD(id,2) OVER(ORDER BY id) as next_2_id, # 后两个idvisit_date,peopleFROM Stadium WHERE people >=100
)
select id,visit_date,people from t1
where
(id = pre_id + 1 and id = next_id - 1) OR # 当前 id 是连续序列的中间部分
(pre_id is null and next_id = id + 1 and next_2_id = id + 2 ) OR # 当前 id 是连续序列的最开始部分
(next_id = id + 1 and next_2_id = id + 2 ) OR # 当前 id 是连续序列的最开始部分
(id = pre_id + 1 and next_id is NULL and pre_2_id = id - 2) OR  # 当前 id 是连续序列的最结束部分
(pre_id = id - 1 and pre_2_id = id - 2)    # 当前 id 是连续序列的最结束部分
order by id;

效果:答案正确,3 个id的联系需要考虑极端情况,所以一共需要 5个 条件!


5. 提交答案

效果展示:经过20分钟思考,解题结果提交通过!

对比官方:官方的答案很简略,不过我觉得自己想出来的思路很有趣哦!

# 官方答案select distinct t1.*
from stadium t1, stadium t2, stadium t3
where t1.people >= 100 and t2.people >= 100 and t3.people >= 100
and
((t1.id - t2.id = 1 and t1.id - t3.id = 2 and t2.id - t3.id =1)  -- t1, t2, t3or(t2.id - t1.id = 1 and t2.id - t3.id = 2 and t1.id - t3.id =1) -- t2, t1, t3or(t3.id - t2.id = 1 and t2.id - t1.id =1 and t3.id - t1.id = 2) -- t3, t2, t1
)
order by t1.id;

这篇关于SQL技巧笔记(一):连续3人的连号问题—— LeetCode601.体育馆的人流量的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/779878

相关文章

MybatisGenerator文件生成不出对应文件的问题

《MybatisGenerator文件生成不出对应文件的问题》本文介绍了使用MybatisGenerator生成文件时遇到的问题及解决方法,主要步骤包括检查目标表是否存在、是否能连接到数据库、配置生成... 目录MyBATisGenerator 文件生成不出对应文件先在项目结构里引入“targetProje

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

numpy求解线性代数相关问题

《numpy求解线性代数相关问题》本文主要介绍了numpy求解线性代数相关问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 在numpy中有numpy.array类型和numpy.mat类型,前者是数组类型,后者是矩阵类型。数组

解决systemctl reload nginx重启Nginx服务报错:Job for nginx.service invalid问题

《解决systemctlreloadnginx重启Nginx服务报错:Jobfornginx.serviceinvalid问题》文章描述了通过`systemctlstatusnginx.se... 目录systemctl reload nginx重启Nginx服务报错:Job for nginx.javas

怎么关闭Ubuntu无人值守升级? Ubuntu禁止自动更新的技巧

《怎么关闭Ubuntu无人值守升级?Ubuntu禁止自动更新的技巧》UbuntuLinux系统禁止自动更新的时候,提示“无人值守升级在关机期间,请不要关闭计算机进程”,该怎么解决这个问题?详细请看... 本教程教你如何处理无人值守的升级,即 Ubuntu linux 的自动系统更新。来源:https://

Redis缓存问题与缓存更新机制详解

《Redis缓存问题与缓存更新机制详解》本文主要介绍了缓存问题及其解决方案,包括缓存穿透、缓存击穿、缓存雪崩等问题的成因以及相应的预防和解决方法,同时,还详细探讨了缓存更新机制,包括不同情况下的缓存更... 目录一、缓存问题1.1 缓存穿透1.1.1 问题来源1.1.2 解决方案1.2 缓存击穿1.2.1