【MySQL】之联合索引与最左匹配原则

2023-12-10 06:52

本文主要是介绍【MySQL】之联合索引与最左匹配原则,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:


最左匹配原则在我们 MySQL 开发过程中和面试过程中经常遇到,为了加深印象和理解,我在这里把 MySQL 的最左匹配原则详细的讲解一下,包括它的原理以及是否导致索引失效的场景。

在讲解 MySQL 的最左匹配原则之前,我们需要了解一下 MySQL 的联合索引也称复合索引),因为最左匹配原则是在联合索引的基础上产生的,没有联合索引就没有最左匹配原则这个概念。


一、联合索引


1、什么是联合索引

我们知道,单值索引指的是只使用一个字段作为索引字段的索引,而联合索引就是使用多个字段来共同构建成一个索引:

KEY idx_abc (a, b, c);

2、为什么要使用联合索引

2-1、减少开销

建一个联合索引 (a, b, c),实际相当于建了 (a)、(a, b)、(a, b, c) 三个索引。这样我们就不需要创建 (a)、(b)、(c) 三个单值索引了。我们知道,每多一个索引,都会增加数据库写操作的开销和磁盘空间的开销,对于大量数据的表,使用联合索引会大大的减少开销!

2-2、覆盖索引

对联合索引 (a, b, c),如果有如下的 sql: select a, b, c from test where a=1 and b=2。那么 MySQL 可以直接通过遍历索引取得数据,而无需回表,从而减少了很多的随机 IO 操作。而减少 IO 操作,特别的随机 IO 是 DBA 主要的优化策略,在真正的实际应用中,覆盖索引是主要的提升性能的优化手段之一。

2-3、提高效率

联合索引的字段越多,通过索引筛选出的数据越少。假如有 1000W 条数据的表,有如下 sql: select * from table where a=1 and b=2 and c=3,假设每个条件可以筛选出 10% 的数据,如果只有单值索引,那么通过该索引能筛选出 1000W * 10% = 100w 条数据,然后再回表从 100w 条数据中找到符合 b=2 and c=3 的数据,然后再排序,再分页。

但如果是联合索引,则通过索引直接筛选出的数据为:1000w * 10% * 10% * 10% = 1w,这效率的提升可想而知!


二、最左匹配原则


1、最左匹配原则的规则

在联合索引当中,索引匹配时:最左字段优先,以最左边的字段为起点任何连续的字段索引都能匹配上,如果遇到范围查询 (>、<、between、like) 时就会停止匹配

2、索引是否生效的场景

是否满足最左匹配原则是衡量联合索引命中与否的依据。存在场景比较多,假设我们创建了以 a, b, c 三个字段的联合索引 idx_abc(a, b, c),下面我们分别展开讨论索引是否失效的场景。

2-1、全字段全值匹配

索引的全部字段都在查找条件当中,并且都是使用 = 进行全值匹配的情况下,索引是命中生效的:

select * from table_name where a = '1' and b = '2' and c = '3'
select * from table_name where b = '2' and a = '1' and c = '3'
select * from table_name where c = '3' and b = '2' and a = '1'
......

虽然 where 子句几个搜索条件顺序调换了,但不影响查询结果,这是由于 MySQL 的查询优化器会自动调整 where 子句的条件顺序以使用适合的索引,所以 MySQL 不存在 where 子句的顺序问题而造成索引失效。

2-2、从左到右按顺序匹配

select * from table_name where a = '1'
select * from table_name where a = '1' and b = '2'
select * from table_name where a = '1' and b = '2' and c = '3'

只要是按照联合索引创建的字段从左到右的顺序依次使用,不管使用其中多少个字段,都会命中索引。

2-3、缺失最左边的字段

select * from table_name where  b = '2' 
select * from table_name where  c = '3'
select * from table_name where  b = '1' and c = '3' 

这种缺失了最左边 a 字段的情况就是违背最左匹配原则的典型例子,结果就是没有用到索引(索引失效)。

因为缺失了最左边的字段,导致索引数据结构 B+ 树不知道第一步该查哪个节点,从而需要去全表扫描了。在建立搜索树的时候 a 就是第一个比较因子,必须要先根据 a 来搜索,进而才能往后继续查询 b 和 c。

2-4、缺失中间的字段

假如去掉中间的字段,保留最左边和右边的字段(就是我们说的索引字段不连续):

select * from table_name where a = '1' and c = '3' 

结果就只用到了 a 列的索引,而 b 列和 c 列都没有用到。

因为在这种情况下进行数据检索时,B+ 树可以用 a 来指定第一步的搜索方向,但由于下一个字段 b 的缺失,所以只能先把 a = 1 的数据主键 ID 都找出来,然后通过查到的主键 ID 回表查询相关行,再去匹配 c 值的数据了。当然,这至少把 a = 1 的数据筛选出来了,总比直接全表扫描好多了

2-5、匹配范围值

出现匹配范围值的情况可能比较复杂或难以理解,但我们只需要牢记最左匹配原则的规则:遇到范围查询 (>、<、between、like) 时就会停止匹配

比如下面这种情况:

select * from table_name where  a = 1 and b > 3 and c = 'mm';

这种情况下,由于 a 是等值匹配,所以 B+ 树走完 a 索引之后 b 还是有序的,但走完 b 索引之后,由于 b 是范围匹配,所以此时 c 已经是无序的了,最终只使用了 (a, b) 两个索引(由于此时 c 就没法走索引,所以优化器只能根据 a, b 得到数据的主键 ID 回表查询,最终影响了执行效率)。

再比如下面的情况:

select * from table_name where  a > 1 and b > 1
select * from table_name where  a > 1 and a < 3 and b > 1;

当多个列同时进行范围查找时,只有对索引最左边的那个列进行范围查找才用到 B+ 树索引,也就是只有 a 用到索引,在 a > 11 < a < 3 的范围内 b 是无序的,所以 b 不能用索引,找到 a 的记录后,只能根据条件 b > 1 继续逐条过滤。

2-6、like 语句匹配问题

当索引列是字符型,并且使用了 like 语句进行模糊查询时,如果通配符 % 不出现在开头,则可以用到索引,否则将会违背了最左匹配原则,而不会使用索引,走的是全表扫描:

select * from table_name where a like 'As%';  //走索引查询
select * from table_name where  a like '%As'  //全表查询
select * from table_name where  a like '%As%' //全表查询

我们先了解一下字符型字段的比较规则:当列是字符型的话,它的比较规则是先比较字符串的第一个字符,第一个字符小的那个字符串就比较小,如果两个字符串第一个字符相通,那就再比较第二个字符,第二个字符比较小的那个字符串就比较小,依次类推,比较字符串。

所以,如果通配符 % 出现在开头,B+ 树则无法进行比较匹配,进而导致索引失效。

3、解决文件排序的问题

当我们对查询的数据进行 order by 排序时,一般情况下,我们是先把数据记录加载到内存中,再用一些排序算法,比如快速排序,归并排序等在内存中对这些记录进行排序。但有时候查询的结果集太大不能在内存中进行排序时,需要暂时借助磁盘空间存放中间结果,排序操作完成后再把排好序的结果返回客户端。Mysql 把这种在磁盘上进行排序的方式称为文件排序(Filesort)。

文件排序是非常慢非常耗性能的,但如果 order by 子句用到了索引列,就有可能避免文件排序的问题:

select * from table_name order by a, b, c limit 10;

因为 B+ 树索引本身就是按照上述规则排序的,准确来说就是:索引是有序的,所以得到的结果集已经排好序了,不用再进行额外的排序操作。

注意:order by 的子句后面的字段顺序也必须按照索引字段的顺序给出,不能颠倒顺序(MySQL 不会自动调整排序字段的顺序)。

下面这种就是因为颠倒顺序而没有使用索引的情况:

select * from table_name order by b, c, a limit 10;

下面这种是用到部分索引的情况:

select * from table_name order by a limit 10;
select * from table_name order by a, b limit 10;

下面这种情况,由于联合索引左边列为常量,后边的列排序可以用到索引:

select * from table_name where a =1 order by b, c limit 10;

这篇关于【MySQL】之联合索引与最左匹配原则的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/476340

相关文章

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

MySQL高性能优化规范

前言:      笔者最近上班途中突然想丰富下自己的数据库优化技能。于是在查阅了多篇文章后,总结出了这篇! 数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 临时库表必须以tmp_为前缀并以日期为后缀,备份

[MySQL表的增删改查-进阶]

🌈个人主页:努力学编程’ ⛅个人推荐: c语言从初阶到进阶 JavaEE详解 数据结构 ⚡学好数据结构,刷题刻不容缓:点击一起刷题 🌙心灵鸡汤:总有人要赢,为什么不能是我呢 💻💻💻数据库约束 🔭🔭🔭约束类型 not null: 指示某列不能存储 NULL 值unique: 保证某列的每行必须有唯一的值default: 规定没有给列赋值时的默认值.primary key:

MySQL-CRUD入门1

文章目录 认识配置文件client节点mysql节点mysqld节点 数据的添加(Create)添加一行数据添加多行数据两种添加数据的效率对比 数据的查询(Retrieve)全列查询指定列查询查询中带有表达式关于字面量关于as重命名 临时表引入distinct去重order by 排序关于NULL 认识配置文件 在我们的MySQL服务安装好了之后, 会有一个配置文件, 也就

Java 连接Sql sever 2008

Java 连接Sql sever 2008 /Sql sever 2008 R2 import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.Statement; public class TestJDBC

Java 后端接口入参 - 联合前端VUE 使用AES完成入参出参加密解密

加密效果: 解密后的数据就是正常数据: 后端:使用的是spring-cloud框架,在gateway模块进行操作 <dependency><groupId>com.google.guava</groupId><artifactId>guava</artifactId><version>30.0-jre</version></dependency> 编写一个AES加密