MySQL索引最左匹配原则

2023-10-10 11:59

本文主要是介绍MySQL索引最左匹配原则,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

问题引出

在以往的面试当中,经常会遇到类似的问题,如果我们设置联合索引的顺序是(a, b, c), 那么如果我们在查询时的顺序却是(a, c, b) 会走索引吗?这个问题被问到的频率之高,令人乍舌,在这篇文章中,我们就深入讨论一下,应该如何回答这一类问题,并且探寻他背后的原理,那就是最左匹配原则。

 

索引B+树

在MySQL中,索引是以B+树的形式存在的,它是B树的变体,其定义基本与B树相同,下图就是B+树的数据结构,图中非叶子节点,蓝色部分代表索引,黄色部分代表指向下一个节点的指针,叶子节点则代表实际保存的数据。

图1   mysql索引结构

B+树与B树主要存在以下区别:

 

  • 非叶子节点的子树指针与关键字个数相同

  • 非叶子节点的子树指针P[i],指向关键字值[K[i], K[i+1])的子树

  • 非叶子节点仅用来索引,数据都保存在叶子节点中。

  • 所有叶子节点具有一个链指针指向下一个叶子节点

  • 所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素,上图就是在子节点元素中最小,这个与我们具体定义的规则有关。

 

最左匹配原则  

  

我们在前面了解了MySQL的索引结构,下面我们就来分析如果是联合索引,在MySQL中是如何存储的呢?

 

当我们建立联合索引时,联合索引当然还是一颗B+树,比如我们建立一个联合索引(a, b),那么它的索引结构应该是这样的。

 

a索引:1,1,2,2,3,3

b索引:1,2,1,4,1,2

 

通过观察我们可以发现,在联合索引中,对于a索引来说,索引是有序排列的,对于b索引显然是无序排列的。同时我们还可以发现对于a值相等的情况下,b值也是有序的。

 

这种有序是相对的,a>1 and b=4;遇到这种范围查询,就不会再去走索引,这种情况下a值可以走索引,而b值在这个范围内是无序的,所以最终也不会走索引。

 

那么我们就基本可以得出最左匹配原则的定义:最左优先,以最左边的为起点任何连续的索引都能匹配上。同时遇到范围查询(>、<、between、like)就会停止匹配

 

实战分析

首先我们来创建一个数据表tb_score,设置score和age字段组合成一个联合索引,索引的名称是“score_age_index”,在mysql中,int类型占4个字节,所以这个索引的长度是8个字节,这里计算索引的长度是为了判断sql语句是否走了索引

1CREATE TABLE tb_student (
2 `stu_id` int NOT NULL PRIMARY KEY AUTO_INCREMENT COMMENT '主键id',
3 `name` VARCHAR(100) NOT NULL COMMENT '姓名',
4 `score` int NOT NULL COMMENT '成绩',
5 `age` int NOT NULL COMMENT '年龄',
6  INDEX score_age_index (`score`, `age`)
7)ENGINE=InnoDB DEFAULT CHARSET=utf8;

插入一些测试数据

1insert into tb_student(name, score, age) value('张三', 40, 21);
2insert into tb_student(name, score, age) value('王五', 20, 23);
3insert into tb_student(name, score, age) value('李四', 90, 26);
4insert into tb_student(name, score, age) value('赵六', 60, 19);

 

我们在分析查询语句是否走索引可以用到mysql提供的一个命令explain,如下图我们做了一个查询,根据分数查询学生的姓名,可以得出结论,查询走了我们定义的索引,并没有进行全表扫描,下面我们就根据各种情况进行分析。

 

a.全值匹配

 

1mysql> explain select name from tb_student where age=20 and score=90;

 

根据结果可以得知,key_len 为8 ,type为ref,本次查询用到了索引,虽然我们定义索引的顺序是(score, age),mysql可以进行优化,自动帮我们改变顺序。

 

b.匹配左边的列

  

上面这两条sql语句,都是走索引的,因为他们都是从最左也就是score开始,连续匹配的。

 

1mysql> explain select name from tb_student where age=20 and score=90;
2mysql> explain select name from tb_student where score=90;

 

而下面这条sql语句显然是不会走索引的,因为它并没有从最左连续匹配,这里走的是全表扫描,根据执行结果我们也可以看出,type是ALL代表全表扫描,没有使用到索引。

 

1 mysql> explain select name from tb_student where age=19;

 

    

c.匹配列前缀

如果列是字符型的话它的比较规则是先比较字符串的第一个字符,第一个字符小的哪个字符串就比较小,如果两个字符串第一个字符相同,那就再比较第二个字符,第二个字符比较小的那个字符串就比较小,依次类推,比较字符串。

如果score是字符类型,那么前缀匹配用的是索引,后缀和中缀只能全表扫描了。

 

1mysql>select * from tb_student  where a like 'As%'; //前缀都是排好序的,走索引查询
2mysql>select * from tb_student  where  a like '%As'//全表查询
3mysql>select * from tb_student  where  a like '%As%'//全表查询

 

d.匹配范围值

        可以对最左边的列进行范围查询,结果是一定会走索引的。

 

1mysql> explain select name from tb_student where score > 60 and score < 90;

 

多个列同时进行范围查找时,只有对索引最左边的那个列进行范围查找才用到B+树索引,可以看到key_len为4,也就是只有score用到了索引,在90>score>60的情况下,age是无序的,不能用索引,找到90>score>60的记录后,只能根据条件 age>20 继续逐条过滤.

 

1mysql> explain select name from tb_student where score > 60 and score < 90 and age >20;

 

e.精确匹配某一列并范围匹配另一列

如果左边的列是精确查找的,右边的列可以进行范围查找,如果score=90,age是有序的,并且我们可看到key_len是8,说明走的是联合索引。

1 mysql> explain select name from tb_student where score = 90 and age > 20;

 

f.排序

     因为b+树索引本身就是按照上述规则排序的,order by的子句后面的顺序也必须按照索引列的顺序给出,就会走索引。

1mysql> explain select name from tb_student order by score,age;

 

这里和我们预想的结果 不太一致,经过一番查证,如果数据库中的数据量过小的时候,mysql数据库会自动为我们做优化,它会认为全表扫描要比索引更快,所以就采用全表扫描方式。

如果我们颠倒顺序去排序,那么肯定不会走索引。

1mysql> explain select name from tb_student order by age,score;

 

如果最左边列的值是定值,则对其他列顺序排序是可以用到索引的。

1mysql> explain select name from tb_student where score = 60 order by age;

 https://mp.weixin.qq.com/s?src=11&timestamp=1582811700&ver=2184&signature=ICD1p*Za8FdhqfCwWU3jiHx9dFe9aCnaWMP2*JgbFGv7EMsJcskD0KSduj72ImTGKC66xviuRd-npYv-vlve4eaJ8t3BTu57GRZSCpY*jXeoFJBzy*oHkJ-rQXGIePD7&new=1

这篇关于MySQL索引最左匹配原则的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/180275

相关文章

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

MySQL高性能优化规范

前言:      笔者最近上班途中突然想丰富下自己的数据库优化技能。于是在查阅了多篇文章后,总结出了这篇! 数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 临时库表必须以tmp_为前缀并以日期为后缀,备份

[MySQL表的增删改查-进阶]

🌈个人主页:努力学编程’ ⛅个人推荐: c语言从初阶到进阶 JavaEE详解 数据结构 ⚡学好数据结构,刷题刻不容缓:点击一起刷题 🌙心灵鸡汤:总有人要赢,为什么不能是我呢 💻💻💻数据库约束 🔭🔭🔭约束类型 not null: 指示某列不能存储 NULL 值unique: 保证某列的每行必须有唯一的值default: 规定没有给列赋值时的默认值.primary key:

MySQL-CRUD入门1

文章目录 认识配置文件client节点mysql节点mysqld节点 数据的添加(Create)添加一行数据添加多行数据两种添加数据的效率对比 数据的查询(Retrieve)全列查询指定列查询查询中带有表达式关于字面量关于as重命名 临时表引入distinct去重order by 排序关于NULL 认识配置文件 在我们的MySQL服务安装好了之后, 会有一个配置文件, 也就

Java 连接Sql sever 2008

Java 连接Sql sever 2008 /Sql sever 2008 R2 import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.Statement; public class TestJDBC

Mysql BLOB类型介绍

BLOB类型的字段用于存储二进制数据 在MySQL中,BLOB类型,包括:TinyBlob、Blob、MediumBlob、LongBlob,这几个类型之间的唯一区别是在存储的大小不同。 TinyBlob 最大 255 Blob 最大 65K MediumBlob 最大 16M LongBlob 最大 4G