我说 SELECT COUNT(*) 会造成全表扫描，面试官让我回去等通知！

本文主要是介绍我说 SELECT COUNT(*) 会造成全表扫描，面试官让我回去等通知！，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

文章来源于码海，作者码海

前言

有人提到使用以下 sql 会导致慢查询

SELECT COUNT(*) FROM SomeTable
SELECT COUNT(1) FROM SomeTable

原因是会造成全表扫描，有位读者说这种说法是有问题的，实际上针对无 where_clause 的 COUNT()*，MySQL 是有优化的，优化器会选择成本最小的辅助索引查询计数，其实反而性能最高，这位读者的说法对不对呢

针对这个疑问，我首先去生产上找了一个千万级别的表使用 EXPLAIN 来查询了一下执行计划

EXPLAIN SELECT COUNT(*) FROM SomeTable

结果如下

image.png

如图所示: 发现确实此条语句在此例中用到的并不是主键索引，而是辅助索引，实际上在此例中我试验了，不管是 COUNT(1)，还是 COUNT()，MySQL 都会用成本最小的辅助索引查询方式来计数，也就是使用 COUNT() 由于 MySQL 的优化已经保证了它的查询性能是最好的！随带提一句，COUNT()是 SQL92 定义的标准统计行数的语法，并且效率高，所以请直接使用COUNT()查询表的行数！

所以这位读者的说法确实是对的。但有个前提，在 MySQL 5.6 之后的版本中才有这种优化。

那么这个成本最小该怎么定义呢，有时候在 WHERE 中指定了多个条件，为啥最终 MySQL 执行的时候却选择了另一个索引，甚至不选索引？

本文将会给你答案，本文将会从以下两方面来分析

SQL 选用索引的执行成本如何计算
实例说明

SQL 选用索引的执行成本如何计算

就如前文所述，在有多个索引的情况下，在查询数据前，MySQL 会选择成本最小原则来选择使用对应的索引，这里的成本主要包含两个方面。

IO 成本: 即从磁盘把数据加载到内存的成本，默认情况下，读取数据页的 IO 成本是 1，MySQL 是以页的形式读取数据的，即当用到某个数据时，并不会只读取这个数据，而会把这个数据相邻的数据也一起读到内存中，这就是有名的程序局部性原理，所以 MySQL 每次会读取一整页，一页的成本就是 1。所以 IO 的成本主要和页的大小有关
CPU 成本：将数据读入内存后，还要检测数据是否满足条件和排序等 CPU 操作的成本，显然它与行数有关，默认情况下，检测记录的成本是 0.2。

实例说明

为了根据以上两个成本来算出使用索引的最终成本，我们先准备一个表（以下操作基于 MySQL 5.7.18）

CREATE TABLE `person` (`id` bigint(20) NOT NULL AUTO_INCREMENT,`name` varchar(255) NOT NULL,`score` int(11) NOT NULL,`create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,PRIMARY KEY (`id`),KEY `name_score` (`name`(191),`score`),KEY `create_time` (`create_time`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

这个表除了主键索引之外，还有另外两个索引, name_score 及 create_time。然后我们在此表中插入 10 w 行数据，只要写一个存储过程调用即可，如下:

CREATE PROCEDURE insert_person()
begindeclare c_id integer default 1;while c_id<=100000 doinsert into person values(c_id, concat('name',c_id), c_id+100, date_sub(NOW(), interval c_id second));set c_id=c_id+1;end while;
end

插入之后我们现在使用 EXPLAIN 来计算下统计总行数到底使用的是哪个索引

EXPLAIN SELECT COUNT(*) FROM person

image

从结果上看它选择了 create_time 辅助索引，显然 MySQL 认为使用此索引进行查询成本最小，这也是符合我们的预期，使用辅助索引来查询确实是性能最高的！

我们再来看以下 SQL 会使用哪个索引

SELECT * FROM person WHERE NAME >'name84059' AND create_time>'2020-05-23 14:39:18'

image

用了全表扫描！理论上应该用 name_score 或者 create_time 索引才对，从 WHERE 的查询条件来看确实都能命中索引，那是否是使用 **SELECT *** 造成的回表代价太大所致呢，我们改成覆盖索引的形式试一下

SELECT create_time FROM person WHERE NAME >'name84059' AND create_time > '2020-05-23 14:39:18'

结果 MySQL 依然选择了全表扫描！这就比较有意思了，理论上采用了覆盖索引的方式进行查找性能肯定是比全表扫描更好的，为啥 MySQL 选择了全表扫描呢，既然它认为全表扫描比使用覆盖索引的形式性能更好，那我们分别用这两者执行来比较下查询时间吧

-- 全表扫描执行时间: 4.0 ms
SELECT create_time FROM person WHERE NAME >'name84059' AND create_time>'2020-05-23 14:39:18'

查看全文

http://www.taodudu.cc/news/show-8351413.html

mysql全表扫描会涉及到io吗_我说 SELECT COUNT(*) 会造成全表扫描，面试官让我回去等通知...

【PB】使用任务栏通知区域

reviewboard-腾讯企业邮箱邮件通知配置

APNS推送通知的流程

Android开发实现透明通知栏

JN516X 如何遥控一盏灯

记一次支付宝接口收不到异步通知自查方案-支付宝接口常见错误系列

1.4 微信Native支付 - 内网穿透与通知、查询用户订单

TBBUTTON 获取通知数据的易错点

Android 通知栏 PendingIntent.getActivity(context, requestCode, intent, flags)的第二个参数requestCode不能写一样

软件测试人员到底需不需要通过培训来提升技术能力 ?

TSDK：淘宝开放平台或淘宝登录爬取

郁闷的周末

social-app-django第三方登录qq 微信微博集成解决方案

iOS开发-ShareSDk社会化分享到微信微博QQ等功能

优秀员工都用的-IDEA规范编码风格和质量检测插件SonarLint

华为OD机试 - 优秀学员统计（Java JS Python）

老板喜欢这样的员工成为优秀员工必读的89篇文章.pdf

清华大学大数据软件团队2022年度先进个人风采展示

select 机制 - 访问方式（三）

7 年 700 篇技术文章，收获的 7 个心得

这篇关于我说 SELECT COUNT(*) 会造成全表扫描，面试官让我回去等通知！的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

我说 SELECT COUNT(*) 会造成全表扫描，面试官让我回去等通知！

前言

SQL 选用索引的执行成本如何计算

实例说明

相关文章：

相关文章

Go中select多路复用的实现示例

Go语言使用select监听多个channel的示例详解

Go语言并发之通知退出机制的实现

MySQL count()聚合函数详解

如何关闭Mac的Safari通知? 3招教你关闭Safari浏览器网站通知的技巧

Java 的 Condition 接口与等待通知机制详解

嵌入式Linux驱动中的异步通知机制详解

Go 语言中的select语句详解及工作原理

Vue 调用摄像头扫描条码功能实现代码

HTML5中下拉框＜select＞标签的属性和样式详解