明明白白告诉你MySQL索引效率分析和使用原则

本文主要是介绍明明白白告诉你MySQL索引效率分析和使用原则,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

MySQL索引分析语句和使用

explain分析语句

EXPLAIN语句的基本语法如下:

EXPLAIN [EXTENDED] SELECT select_options

使用EXTENED关键字,EXPLAIN语句将产生附加信息。select_options 是SELECT语句的查询选项,包括FROM WHERE子句等。

执行该语句,可以分析EXPLAIN后面的SELECT语句的执行情况,并且能够分析出所查 询的表的一些特征。

使用EXPLAIN语句来分析1个查询语句,执行如下语句:

下面我们对查询结果进行解释:

字段描述
idselect识别符。这是select的查询序列号,id的值越大优先级别越高,越先被执行,如果id相同,执行顺序右上至下
select_typeselect_type表示select语句的类型。
tabletype表示这一行的数据是关于哪张表的。
partitions
typetype表示的是表的连接类型。
possible_keyspossible_keys列支出mysql能使用哪个索引在该表中找到行。如果这列是null,则没有相关的索引。在这种情况下,可以通过检查where子句查看它是否引用某些列或者适合索引的列来提高查询性能。如果是这样,可以创建适合的索引来提高查询的性能
keykey表示查询实际应用到的索引,如果没有选择索引,该列的值是null。想要强制使mysql使用或者忽视possible_type列中的索引,在查询中使用force index,use index 或者 ignore index。
key_lenkey_len表示mysql选择的索引字段按字节计算的长度,如果键是null,则长度为null,注意通过key_len值可以确定mysql将实际使用一个多列索引中的几个字段
refref表示使用哪个列或常数与索引一起来查询记录
rowsrows显示mysql表中进行查询时必须检查的行数
filtered通过查询条件获取的最终记录行数 占 通过type字段指明的搜索方式搜索出来的记录行数的百分比
Extraextra显示mysql在处理查询时的详细信息。

性能判定依据主要字段信息不同值的解释:

select_type

(1) SIMPLE

SIMPLE表示简单查询,其中不包括连接查询和子查询。

(2) PRIMARY与SUBQUERY

PRIMARY表示主查询或者最外层的查询语句。SUBQUERY : 子查询

 (3) DERIVED: 衍生查询-在select出一批自定义列的数据,概念上相当于一张表

(4) UNION 与 UNION RESULT

UNION :联合查询,union 后面的那张表就会表示成它

UNION RESULT:  联合结果

type

对表访问方式,表示MySQL在表中找到所需行的方式,又称“访问类型”。

常用的类型有: ALL、index、range、 ref、eq_ref、const、system、NULL(从左到右,性能从差到好)

ALL:Full Table Scan, MySQL将遍历全表以找到匹配的行

index: Full Index Scan,index与ALL区别为index类型只遍历索引树

range:只检索给定范围的行,使用一个索引来选择行

ref: 表示上述表的连接匹配条件,即哪些列或常量被用于查找索引列上的值

eq_ref: 类似ref,区别就在使用的索引是唯一索引,对于每个索引键值,表中只有一条记录匹配,简单来说,就是多表连接中使用primary key或者 unique key作为关联条件

const、system: 当MySQL对查询某部分进行优化,并转换为一个常量时,使用这些类型访问。如将主键置于where列表中,MySQL就能将该查询转换为一个常量,system是const类型的特例,当查询的表只有一行的情况下,使用system

NULL: MySQL在优化过程中分解语句,执行时甚至不用访问表或索引,例如从一个索引列里选取最小值可以通过单独索引查找完成。

Extar

Extra列是用来说明一些额外信息的,我们可以通过这些额外信息来更准确的理解MySQL到底将如何执行给定的查询语句。MySQL提供的额外信息有好几十个,就不一个一个介绍了,在这只介绍常见的一些额外信息说明 .

1, Using filesort: 如果根据索引列进行排序(order by 索引列)是可以用到索引的,SQL查询引擎会先根据索引列进行排序,然后获取对应记录的主键id执行回表操作,如果排序字段用不到索引则只能在内存中或磁盘中进行排序操作,MySQL把这种在内存或者磁盘上进行排序的方式统称为文件排序(英文名:filesort),如果某个查询需要使用文件排序的方式执行查询,就会在执行计划的Extra列中显示Using filesort

2, Using temporary: 许多查询的执行过程中,MySQL会借助临时表来完成一些功能,比如去重、排序之类的,比如我们在执行许多包含distinct、group by、union等子句的查询过程中,如果不能有效利用索引来完成查询,MySQL很有可能寻求通过建立内部的临时表来执行查询。如果查询中使用到了内部的临时表,在执行计划的Extra列将会显示Using temporary提示.

3, USING index: 表示相应的select操作中使用了覆盖索引(Covering Index),避免回表操作,效率不错!

如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有同时出现using where,表名索引用来读取数据而非执行查找动作。

4, Using where: 使用了where过滤

5, using join buffer: 在连接查询执行过程中,当被驱动表不能有效的利用索引加快访问速度,MySQL一般会为其分配一块名叫join buffer的内存块来加快查询速度

6, impossible where: where子句的值总是false,不能用来获取任何元组

7, select tables optimized away: 在没有GROUPBY子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。

8, distinct: 优化distinct,在找到第一匹配的元组后即停止找同样值的工作

9, Using index condition:查找使用了索引,但是需要回表查询数据

MySQL索引效率分析

查询效率大概的顺序为:

USING index 查询效率最高

Using where;USING index; 次于覆盖索引,使用了where过滤和索引查询

Using where 使用了where过滤

Using index condition; 使用了索引,但是要回表查询数据

Using filesort | Using temporary (两个差不多同级,效率都不高)

关于 Using where 和 Using where;USING index 的效率比较:

我网上看到有人说Using where 比 Using where;USING index 效率要高,我不能理解,但作为求真精神,所以我自己进行压测。

sql语句

SELECT a.id,a.`host` FROM (select id,`host` FROM eju_static_url WHERE id >= 6053) a WHERE a.`host`='sh.zhilaowang.com';

压测语句

mysqlslap --no-defaults -h 127.0.0.1 -u root -p123456 -c 10 -i 1 --create-schema test -q "SELECT a.id,a.`host` FROM (select id,`host` FROM eju_static_url WHERE id >= 6053) a WHERE a.`host`='sh.zhilaowang.com'" -e innodb --number-of-queries=100

Using where

在没有给host字段添加索引的时候,explain的extra就是 Using where

压测结果

Using where;USING index

给host添加索引后,explain的extra就是 Using where; Using index

 压测结果

关于 Using where 和 Using index condition 的效率比较:

 Using index condition是需要进行回表查询的,那么与不需要回表的Using where对比,是不是性能更差呢?网上说是,自己写代码验证一下

sql语句

SELECT action FROM eju_static_url WHERE `host`='sh.zhilaowang.com' AND id >= 2000;

压测语句

mysqlslap --no-defaults -h 127.0.0.1 -u root -p123456 -c 10 -i 1 --create-schema test -q "SELECT action FROM eju_static_url WHERE `host`='sh.zhilaowang.com' AND id >= 2000" -e innodb --number-of-queries=100

Using where

在没有给host字段添加索引的时候,explain的extra就是 Using where

压测结果

 Using index condition

给host添加索引后,explain的extra就是Using index condition

压测结果

 也就是说,索引不是随随便便都可以加的,如果没有加正确或者使用正确,可能数据库查询的效率会更慢。同时也得出结论:索引回表查询(相当于查询了两次)比直接表查询(只查询一次)更慢。

正确的操作是:把等式搜索的条件字段和搜索结果尽可能都制作成联合索引

索引使用原则

索引最左原则

查询语句执行时的最左原则

where > group by > order by

where条件最左原则

查询语句的where左右先后顺序会影响查询效率的高低,MySQL会优先查询where最左边的内容后筛选右边的内容,排序从两方面综合判定:

索引顺序:主键>唯一主键>普通主键>无索引

范围顺序:等号>in>范围(大于小于,between,like)

 实践

测试sql语句

SELECT action FROM eju_static_url WHERE version >= 2000 AND `host`='sh.zhilaowang.com';

SELECT action FROM eju_static_url WHERE `host`='sh.zhilaowang.com' and version >= 2000;

压测结果

我们可以看到,在都无索引的情况下,是等式的条件排在最左边的时候,比排在右边时效率更高

like模糊查询最左原则

模糊查询时,能不能确定左边的内容,也会影响查询的效率,如果能确定左边的内容,其实是可以使用到索引的。

 可以看到同一个搜索语句在搜索结果差不多的情况下,最左确定的情况下效率更高一些

联合索引生成时的最左原则

创建联合索引为【a,b,c,d】,那么查询where可以被联合索引匹配的字段的组合方式有【a】【a,b】【a,b,c】【a,b,c,d】,其他的如【a,c】【a,c,d】等非从左顺序组合的查询,都不会使用到索引,具体逻辑看检索索引btree顺序的最左原则

检索索引btree顺序的最左原则

在MySQL建立联合索引时会遵守最左前缀匹配原则,即最左优先,在检索数据时从联合索引的最左边开始匹配

如:创建一个(a,b)的联合索引,那么它的索引树就是下图的样子。

 可以看到a的值是有顺序的,1,1,2,2,3,3,而b的值是没有顺序的1,2,1,4,1,2。但是我们又可发现a在等值的情况下,b值又是按顺序排列的,但是这种顺序是相对的。这是因为MySQL创建联合索引的规则是首先会对联合索引的最左边第一个字段排序,在第一个字段的排序基础上,然后在对第二个字段进行排序。所以b=2这种查询条件没有办法利用索引。

规范使用原则

1. 唯一字段可以建立单索引,如手机号码、身份证号,非唯一字段可以考虑建立联合索引【索引字段的选择:一般会选择推荐重复比较少的字段 ,如果是项目需求,(可以考虑联合索引)】;

2. 索引的个数与包含的字段,最佳是不超出6个,勉强可以是10个,如果超过的话,就建议水平分表(减少索引字段)或垂直分表(减少数据量);

3. 索引的使用遵循最左匹配原则其次就是覆盖索引

4. 索引的选择字段尽量要小一些 int varchar(10) char(5) es 存储文本路径

5. 避免 like between 等范围查询

6. 尽量多使用explain进行分析

7. 优先考虑建立联合索引,索引的字段不要包含null 或者是 '';

 

 

 

 

这篇关于明明白白告诉你MySQL索引效率分析和使用原则的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/820460

相关文章

使用Python实现快速搭建本地HTTP服务器

《使用Python实现快速搭建本地HTTP服务器》:本文主要介绍如何使用Python快速搭建本地HTTP服务器,轻松实现一键HTTP文件共享,同时结合二维码技术,让访问更简单,感兴趣的小伙伴可以了... 目录1. 概述2. 快速搭建 HTTP 文件共享服务2.1 核心思路2.2 代码实现2.3 代码解读3.

Elasticsearch 在 Java 中的使用教程

《Elasticsearch在Java中的使用教程》Elasticsearch是一个分布式搜索和分析引擎,基于ApacheLucene构建,能够实现实时数据的存储、搜索、和分析,它广泛应用于全文... 目录1. Elasticsearch 简介2. 环境准备2.1 安装 Elasticsearch2.2 J

使用C#代码在PDF文档中添加、删除和替换图片

《使用C#代码在PDF文档中添加、删除和替换图片》在当今数字化文档处理场景中,动态操作PDF文档中的图像已成为企业级应用开发的核心需求之一,本文将介绍如何在.NET平台使用C#代码在PDF文档中添加、... 目录引言用C#添加图片到PDF文档用C#删除PDF文档中的图片用C#替换PDF文档中的图片引言在当

Java中List的contains()方法的使用小结

《Java中List的contains()方法的使用小结》List的contains()方法用于检查列表中是否包含指定的元素,借助equals()方法进行判断,下面就来介绍Java中List的c... 目录详细展开1. 方法签名2. 工作原理3. 使用示例4. 注意事项总结结论:List 的 contain

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面

Android中Dialog的使用详解

《Android中Dialog的使用详解》Dialog(对话框)是Android中常用的UI组件,用于临时显示重要信息或获取用户输入,本文给大家介绍Android中Dialog的使用,感兴趣的朋友一起... 目录android中Dialog的使用详解1. 基本Dialog类型1.1 AlertDialog(

MySQL双主搭建+keepalived高可用的实现

《MySQL双主搭建+keepalived高可用的实现》本文主要介绍了MySQL双主搭建+keepalived高可用的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、测试环境准备二、主从搭建1.创建复制用户2.创建复制关系3.开启复制,确认复制是否成功4.同

Python使用自带的base64库进行base64编码和解码

《Python使用自带的base64库进行base64编码和解码》在Python中,处理数据的编码和解码是数据传输和存储中非常普遍的需求,其中,Base64是一种常用的编码方案,本文我将详细介绍如何使... 目录引言使用python的base64库进行编码和解码编码函数解码函数Base64编码的应用场景注意

MyBatis 动态 SQL 优化之标签的实战与技巧(常见用法)

《MyBatis动态SQL优化之标签的实战与技巧(常见用法)》本文通过详细的示例和实际应用场景,介绍了如何有效利用这些标签来优化MyBatis配置,提升开发效率,确保SQL的高效执行和安全性,感... 目录动态SQL详解一、动态SQL的核心概念1.1 什么是动态SQL?1.2 动态SQL的优点1.3 动态S

使用Sentinel自定义返回和实现区分来源方式

《使用Sentinel自定义返回和实现区分来源方式》:本文主要介绍使用Sentinel自定义返回和实现区分来源方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Sentinel自定义返回和实现区分来源1. 自定义错误返回2. 实现区分来源总结Sentinel自定