【SQL】按字段分组查询符合条件记录的方法

2024-02-29 22:48

本文主要是介绍【SQL】按字段分组查询符合条件记录的方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


     SQL查询中经常会碰到这样一种情形:先按若干字段GROUP BY分组后,再以分组数据为基础,查询返回符合条件的记录。对于这种需求,简单情况下可以直接采用MAX/MIN函数配搭GROUP BY实现(方法一);但复杂一点的情况,则可以考虑SUBSTRING_INDEX(用法参考个人译文:http://blog.csdn.net/sweeper_freedoman/article/details/52716963)嵌套GROUP_CONCAT(用法参考个人译文:http://blog.csdn.net/sweeper_freedoman/article/details/52717263)的方法实现,即先聚合再截取(方法二)。


     如示例表“visitor_province_day”数据所示,记录游客在每个省驻留的天数。

select * from visitor_province_day;

 
+---------+-----------+-----+
| visitor | province  | day |
+---------+-----------+-----+
|       1 | 陕西省    |   5 |
|       1 | 河北省    |   2 |
|       1 | 浙江省    |   9 |
|      11 | 浙江省    |   7 |
|      11 | 江苏省    |   3 |
|      11 | 湖南省    |   1 |
|      11 | 福建省    |   4 |
|      11 | 陕西省    |   1 |
|      11 | 浙江省    |   5 |
|      11 | 广东省    |   9 |
|      11 | 陕西省    |  11 |
+---------+-----------+-----+


     如果想知道每个游客驻留天数的极大值,可以简单地采用方法一。

SELECT vpd.visitor, MAX(vpd.`day`)
FROM visitor_province_day AS vpd
GROUP BY vpd.visitor;


+---------+----------------+
| visitor | MAX(vpd.`day`) |
+---------+----------------+
|       1 |              9 |
|      11 |             11 |
+---------+----------------+


     方法一是最常见的查询需要,而且已经满足绝大多数情况下的查询需求。但是如果想知道每个游客(对于一张比较大的表)在哪两个省驻留时间最长,即分组后返回的结果多余1个(当然等于1也可以只是直接用方法一就可以了)就需要先按游客(visitor)分组,然后返回两个极大天数(day)所对应的省份(province)。首先GROUP_CONCAT聚合,结果返回游客和按照天数降序排序的省份集合。

SELECT vpd.visitor, GROUP_CONCAT(vpd.province ORDER BY vpd.day DESC)
FROM visitor_province_day AS vpd
GROUP BY vpd.visitor;


+---------+---------------------------------------------------------------------------------+
| visitor | GROUP_CONCAT(vpd.province ORDER BY vpd.day DESC)                                |
+---------+---------------------------------------------------------------------------------+
|       1 | 浙江省,陕西省,河北省                                                            |
|      11 | 陕西省,广东省,浙江省,浙江省,福建省,江苏省,陕西省,湖南省                         |
+---------+---------------------------------------------------------------------------------+

     然后通过SUBSTRING_INDEX截取省份集合里面的前两个子集就实现查询需求了。

SELECT vpd.visitor, SUBSTRING_INDEX(GROUP_CONCAT(vpd.province ORDER BY vpd.day DESC), ',', 2)
FROM visitor_province_day AS vpd
GROUP BY vpd.visitor;



+---------+---------------------------------------------------------------------------+
| visitor | SUBSTRING_INDEX(GROUP_CONCAT(vpd.province ORDER BY vpd.day DESC), ',', 2) |
+---------+---------------------------------------------------------------------------+
|       1 | 浙江省,陕西省                                                             |
|      11 | 陕西省,广东省                                                             |
+---------+---------------------------------------------------------------------------+

     实际操作中的查询需要千变万化,按具体情况修改一下查询即可。当然其实在上面的例子中也可以直接按照默认(升序)排序然后截取最后两个子集(SUBSTRING_INDEX的最后一个参数替换为“-2”),即写法是多种多样的。这里推荐按返回需要降序排列的写法:GROUP_CONCAT操作超过MySQL系统变量group_concat_max_len”以及“ max_allowed_packet的设置会发生截断的情况,所以默认(升序)排序处理可能出现隐性的查询ERROR!

SELECT vpd.visitor, SUBSTRING_INDEX(GROUP_CONCAT(vpd.province ORDER BY vpd.day), ',', -2)
FROM visitor_province_day AS vpd
GROUP BY vpd.visitor;



+---------+-----------------------------------------------------------------------+
| visitor | SUBSTRING_INDEX(GROUP_CONCAT(vpd.province ORDER BY vpd.day), ',', -2) |
+---------+-----------------------------------------------------------------------+
|       1 | 浙江省,陕西省                                                         |
|      11 | 陕西省,广东省                                                         |
+---------+-----------------------------------------------------------------------+





这篇关于【SQL】按字段分组查询符合条件记录的方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/760360

相关文章

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来

浅谈主机加固,六种有效的主机加固方法

在数字化时代,数据的价值不言而喻,但随之而来的安全威胁也日益严峻。从勒索病毒到内部泄露,企业的数据安全面临着前所未有的挑战。为了应对这些挑战,一种全新的主机加固解决方案应运而生。 MCK主机加固解决方案,采用先进的安全容器中间件技术,构建起一套内核级的纵深立体防护体系。这一体系突破了传统安全防护的局限,即使在管理员权限被恶意利用的情况下,也能确保服务器的安全稳定运行。 普适主机加固措施:

webm怎么转换成mp4?这几种方法超多人在用!

webm怎么转换成mp4?WebM作为一种新兴的视频编码格式,近年来逐渐进入大众视野,其背后承载着诸多优势,但同时也伴随着不容忽视的局限性,首要挑战在于其兼容性边界,尽管WebM已广泛适应于众多网站与软件平台,但在特定应用环境或老旧设备上,其兼容难题依旧凸显,为用户体验带来不便,再者,WebM格式的非普适性也体现在编辑流程上,由于它并非行业内的通用标准,编辑过程中可能会遭遇格式不兼容的障碍,导致操