Mysql索引下推、Order by优化和Using filesort文件排序原理

2024-02-29 08:18

本文主要是介绍Mysql索引下推、Order by优化和Using filesort文件排序原理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

1、like 'KK%' 和索引下推

2、Order by 和 Group by 优化

3、Using filesort文件排序原理


// 以下建表结构和数据同《Mysql explain 索引优化案例》

1、like 'KK%' 和索引下推

like 'KK%' 一般情况都会走索引,原因是like 'KK%' 用到了索引下推优化

EXPLAIN SELECT * FROM employees WHERE name like 'LiLei%' AND age = 22 AND position ='manager';

什么是索引下推?

对于辅助的联合索引(name,age,position),正常情况按照最左前缀原则:WHERE name like 'LiLei%' AND age = 22 AND position ='manager'; 这种情况只会走name字段索引,因为根据name字段过滤完,得到的索引行里的age和position是无序的,无法很好的利用索引。

在MySQL5.6之前的版本,这个查询只能在联合索引里匹配到名字是 'LiLei' 开头的索引,然后拿这些索引对应的主键逐个回表,到主键索引上找出相应的记录,再比对age和position这两个字段的值是否符合。

MySQL 5.6引入了索引下推优化,可以在索引遍历过程中,对索引中包含的所有字段先做判断,过滤掉不符合条件的记录之后再回表,可以有效的减少回表次数。使用了索引下推优化后,上面那个查询在联合索引里匹配到名字是 'LiLei' 开头的索引之后,同时还会在索引里过滤age和position这两个字段,拿着过滤完剩下的索引对应的主键id再回表查整行数据。

索引下推会减少回表次数,对于innodb引擎的表索引下推只能用于二级索引,innodb的主键索引(聚簇索引)树叶子节点上保存的是全行数据,所以这个时候索引下推并不会起到减少查询全行数据的效果。

2、Order by 和 Group by 优化

案例一

EXPLAIN SELECT * FROM employees WHERE name like 'LiLei%' AND position ='dev' order by age;

分析: 利用最左前缀法则:中间字段不能断,因此查询用到了name索引,从key_len=74也能看出,age索引列用在排序过程中,因为Extra字段里没有using filesort

案例二

EXPLAIN SELECT * FROM employees WHERE name like 'LiLei%' order by position;

分析: 从explain的执行结果来看,key_len=74,查询使用了name索引,由于用了position进行排序,跳过了 age,出现了Using filesort

案例三

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' order by age, position;

分析:查找只用到索引name,age和position用于排序,无Using filesort

案例四

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' order by position, age;

分析: 和案例三中explain的执行结果一样,但是出现了Using filesort,因为索引的创建顺序为

name,age,position,但是排序的时候age和position颠倒位置了。

案例五

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' and age = 18 order by position, age;

分析: 与案例四对比,在Extra中并未出现Using filesort,因为age为常量(已经被锁定),在排序中被优化,所以索引未颠倒,不会出现Using filesort。//实际上age没有参与排序

案例六

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' order by age asc, position desc;

分析: 虽然排序的字段列与索引顺序一样,且order by默认升序,这里position desc变成了降序,导致与索引的排序方式不同,从而产生Using filesort。Mysql8以上版本有降序索引可以支持该种查询方式。

案例七

EXPLAIN SELECT * FROM employees WHERE name in ('LiLei','XiaoHong') order by age, position;

分析: 对于排序来说,多个相等条件也是范围查询,通过name范围查询的结果,age和position不是有序的,因此排序一定会出现Using filesort

案例八

EXPLAIN SELECT * FROM employees WHERE name > 'a' order by name;

应该走索引的sql为什么最终全表扫描呢?select * 的字段最终会导致回表,所以Mysql优化分析的结果是,走索引效率上并不一定比全表扫描高。

使用覆盖索引进行优化

EXPLAIN SELECT name, age, position FROM employees WHERE name > 'a' order by name;

优化总结:

(1)MySQL支持两种方式的排序 filesort 和 index,Using index是指MySQL扫描索引本身完成排序。index 效率高,filesort效率低(内存排序/磁盘排序)。

(2)order by满足两种情况会使用Using index。

  1. order by语句使用索引最左前列
  2. 使用where子句与order by子句条件列组合满足索引最左前列

(3)尽量在索引列上完成排序,遵循索引建立(索引创建的顺序)时的最左前缀法则,如果order by的条件不在索引列上,就会产生Using filesort

(4)能用覆盖索引尽量用覆盖索引

(5)group by与order by很类似,其实质是先排序后分组遵照索引创建顺序的最左前缀法则。对于group by的优化如果不需要排序的可以加上order by null 禁止排序。注意,where高于having,能写在where中的限定条件就不要去having限定了。

3、Using filesort文件排序原理

filesort 文件排序方式

(1)单路排序:是一次性取出满足条件行的所有字段,然后在sort buffer中进行排序

用trace工具可以看到sort_mode信息里显示:< sort_key, additional_fields >或者< sort_key,packed_additional_fields >

(2)双路排序(又叫回表排序模式): 是首先根据相应的条件取出相应的排序字段和可以直接定位行数据的行 ID,然后在 sort buffer 中 进行排序,排序完后需要再次取回其它需要的字段;

用trace工具可以看到sort_mode信息里显示:< sort_key, rowid >

MySQL 通过比较系统变量 max_length_for_sort_data (默认1024字节) 的大小和需要查询的字段总大小来判断使用哪种排序模式。

  • 如果字段的总长度小于max_length_for_sort_data ,那么使用 单路排序模式;
  • 如果字段的总长度大于max_length_for_sort_data ,那么使用 双路排序模式。

对比两个排序模式:

单路排序会把所有需要查询的字段都放到 sort buffer 中,而双路排序只会把主键和需要排序的字段放到 sort buffer 中进行排序,然后再通过主键回到原表查询需要的字段。

  • 如果 MySQL 排序内存 sort_buffer 配置的比较小,可以适当把 max_length_for_sort_data 配置小点,让优化器选择使用双路排序算法,可以在sort_buffer 中一次排序更多的行,只是需要再根据主键回到原表取数据。
  • 如果 MySQL 排序内存配置比较大,可以适当增大 max_length_for_sort_data 的值,让优化器优先选择全字段排序(单路排序),把需要的字段放到 sort_buffer 中,这样排序后就会直接从内存里返回查询结果了。

所以,MySQL通过 max_length_for_sort_data 这个参数来控制排序,在不同场景使用不同的排序模式,从而提升排序效率。

注意,如果全部使用sort_buffer内存排序一般情况下效率会高于磁盘文件排序,但不能因为这个就随便增大sort_buffer(默认1M),mysql很多参数设置都做过优化,不要轻易调整。

这篇关于Mysql索引下推、Order by优化和Using filesort文件排序原理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/758109

相关文章

oracle数据库索引失效的问题及解决

《oracle数据库索引失效的问题及解决》本文总结了在Oracle数据库中索引失效的一些常见场景,包括使用isnull、isnotnull、!=、、、函数处理、like前置%查询以及范围索引和等值索引... 目录oracle数据库索引失效问题场景环境索引失效情况及验证结论一结论二结论三结论四结论五总结ora

Mysql 中的多表连接和连接类型详解

《Mysql中的多表连接和连接类型详解》这篇文章详细介绍了MySQL中的多表连接及其各种类型,包括内连接、左连接、右连接、全外连接、自连接和交叉连接,通过这些连接方式,可以将分散在不同表中的相关数据... 目录什么是多表连接?1. 内连接(INNER JOIN)2. 左连接(LEFT JOIN 或 LEFT

关于Java内存访问重排序的研究

《关于Java内存访问重排序的研究》文章主要介绍了重排序现象及其在多线程编程中的影响,包括内存可见性问题和Java内存模型中对重排序的规则... 目录什么是重排序重排序图解重排序实验as-if-serial语义内存访问重排序与内存可见性内存访问重排序与Java内存模型重排序示意表内存屏障内存屏障示意表Int

Redis主从复制实现原理分析

《Redis主从复制实现原理分析》Redis主从复制通过Sync和CommandPropagate阶段实现数据同步,2.8版本后引入Psync指令,根据复制偏移量进行全量或部分同步,优化了数据传输效率... 目录Redis主DodMIK从复制实现原理实现原理Psync: 2.8版本后总结Redis主从复制实

mysql重置root密码的完整步骤(适用于5.7和8.0)

《mysql重置root密码的完整步骤(适用于5.7和8.0)》:本文主要介绍mysql重置root密码的完整步骤,文中描述了如何停止MySQL服务、以管理员身份打开命令行、替换配置文件路径、修改... 目录第一步:先停止mysql服务,一定要停止!方式一:通过命令行关闭mysql服务方式二:通过服务项关闭

SQL Server数据库磁盘满了的解决办法

《SQLServer数据库磁盘满了的解决办法》系统再正常运行,我还在操作中,突然发现接口报错,后续所有接口都报错了,一查日志发现说是数据库磁盘满了,所以本文记录了SQLServer数据库磁盘满了的解... 目录问题解决方法删除数据库日志设置数据库日志大小问题今http://www.chinasem.cn天发

mysql主从及遇到的问题解决

《mysql主从及遇到的问题解决》本文详细介绍了如何使用Docker配置MySQL主从复制,首先创建了两个文件夹并分别配置了`my.cnf`文件,通过执行脚本启动容器并配置好主从关系,文中还提到了一些... 目录mysql主从及遇到问题解决遇到的问题说明总结mysql主从及遇到问题解决1.基于mysql

Python中列表的高级索引技巧分享

《Python中列表的高级索引技巧分享》列表是Python中最常用的数据结构之一,它允许你存储多个元素,并且可以通过索引来访问这些元素,本文将带你深入了解Python列表的高级索引技巧,希望对... 目录1.基本索引2.切片3.负数索引切片4.步长5.多维列表6.列表解析7.切片赋值8.删除元素9.反转列表

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6

MySQL的索引失效的原因实例及解决方案

《MySQL的索引失效的原因实例及解决方案》这篇文章主要讨论了MySQL索引失效的常见原因及其解决方案,它涵盖了数据类型不匹配、隐式转换、函数或表达式、范围查询、LIKE查询、OR条件、全表扫描、索引... 目录1. 数据类型不匹配2. 隐式转换3. 函数或表达式4. 范围查询之后的列5. like 查询6