【SQL】一条查询中统计同一字段不同记录值数量(频数统计)的写法

本文主要是介绍【SQL】一条查询中统计同一字段不同记录值数量(频数统计)的写法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

更新一:

有一些参考者反馈文中“COUNT写法”的可用性问题,这里就在文首提前聊一个概念性问题。众所周知,关系型数据库思想和SQL规范都源自IBM。然后基于(并非完全遵守)关系型数据库的理论思想和SQL标准,很多商业版或社区开源版的关系型数据库软件产品出现了。其中商业版比较知名的有IBM的DB2、Oracle的Oracle以及Microsoft的SQL Server;开源免费版比较流行的有MySQL(现在也属于Oracle公司)/MariaDB(MySQL被Oracle化后的新分支)、PostgreSQL、SQLite。虽然这些RDBMS产品都是关系型,并且支持SQL,但是每种产品的实现都是不同的,对SQL标准的支持也是不一样的。即便是同一个数据库产品,当进行过一些比较大的版本更新后,其设计和实现也可能会焕然一新。所以,也就是要有——数据库与数据库之间以及数据库版本与版本之间差异性——的概念。下文内容整理自第三版《高性能MySQL》,主要基于MySQL5.5而写,而个人举的游客数据示例查询,印象中是在MySQL5.6和5.7版本都测试过的。所以如果使用其他数据库产品、甚至是示例用MySQL但是其他比较旧的或者久远的将来很新的版本,当查询出现不适用的情况时,要将其看作是一件再正常不过的事情。


     SQL查询中经常会碰到需要在一条语句中统计某字段中不同记录值的数量,即频数统计。在看《高性能MySQL》(https://book.douban.com/subject/23008813/)这本“葵花宝典”时看到里面总结了两种方法,我在这里再整理记录一下:一种是“SUM”法;另一种是“COUNT”法。

 

     如示例表“visitor_province_day”数据所示,记录游客在每个省驻留的天数。现在想知道若干省份(如“陕西省”和“浙江省”)被游客游览的次数,就可以直接计数它们的记录数来进行统计。

mysql> select * from visitor_province_day;
+---------+-----------+-----+
| visitor | province  | day |
+---------+-----------+-----+
|       1 | 陕西省    |   5 |
|       1 | 河北省    |   2 |
|       1 | 浙江省    |   9 |
|      11 | 浙江省    |   7 |
|      11 | 江苏省    |   3 |
|      11 | 湖南省    |   1 |
|      11 | 福建省    |   4 |
|      11 | 陕西省    |   1 |
|      11 | 浙江省    |   5 |
|      11 | 广东省    |   9 |
|      11 | 陕西省    |  11 |
+---------+-----------+-----+

     “SUM”写法。

SELECT SUM(IF(vpd.province = '陕西省', 1, 0)) AS cnt_sx, SUM(IF(vpd.province = '浙江省', 1, 0)) AS cnt_zj
FROM visitor_province_day AS vpd;

 

+--------+--------+
| cnt_sx | cnt_zj |
+--------+--------+
|      3 |      3 |
+--------+--------+

     “COUNT”写法。

SELECT COUNT(vpd.province = '陕西省' OR NULL) AS cnt_sx, COUNT(vpd.province = '浙江省' OR NULL) AS cnt_zj
FROM visitor_province_day AS vpd;

 

+--------+--------+
| cnt_sx | cnt_zj |
+--------+--------+
|      3 |      3 |
+--------+--------+

     由结果可以看出样本中两个省份的频次是一样的,都是3次。如果要进行多个匹配,把“=”改成“IN”列表的形式就可以了,如IN('陕西省', '浙江省')。更甚,也可以把等号替换成“LIKE”或者“REGEXP”模糊匹配噢!

这篇关于【SQL】一条查询中统计同一字段不同记录值数量(频数统计)的写法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/760361

相关文章

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

2. c#从不同cs的文件调用函数

1.文件目录如下: 2. Program.cs文件的主函数如下 using System;using System.Collections.Generic;using System.Linq;using System.Threading.Tasks;using System.Windows.Forms;namespace datasAnalysis{internal static

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来

总有一条路,我们很迷茫

十年前,我家还处于一个贫穷落后的小山村,周围的人会根据我父母的收入来对待我,而十年后的今天,我家的那座小山村医成为重点开发的地区,一夜之间我家成了所谓的土豪,周围的人依然根据我家的收入对待我。现实,什么是现实?这就是现实。从那一刻,我开始明白要想得到别人的尊重,首先你得有别人尊重的实力。 所以,这么多年来不管自己过得多累,走得多艰辛,我都会一直坚持。在人生前进的道路,我们总会经历风雨,难免感到迷