一次mysql联表 join 后 order by desc 慢的排查

2024-02-02 21:10

本文主要是介绍一次mysql联表 join 后 order by desc 慢的排查,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、前言

因为项目需要进行数据量测试,查看项目相关指标在预期数量中是否正常,所以,其中一项就是数据库的数据量测试,发现项目在查询的时候非常的慢。

二、问题概述

1、一张用户表 sys_user_info,和问题相关的字段,主要有以下数据,因为用户表很少,目前为8条,所以,暂时未加索引。

字段说明
id主键
dept_id所属部门

在这里插入图片描述

2、一张工单表 work_order,和问题相关的字段和索引,主要有以下数据 ,其中数据为 290万条数据

字段说明
id主键
create_user_id工单创建人id,就是用户id
create_time创建时间
索引说明
idx_create_user_id主键
idx_create_time工单创建人id,就是用户id

在这里插入图片描述

3、现在的需求是不同用户只能看指定部门下人员的工单,而且前端在查询的时候,是有用户名称之类的查询条件的,所以,初步sql 如下

WITH sui AS ( SELECT id, dept_id, `name` FROM sys_user_info WHERE dept_id IN ( 用户可以看那些部门的id ) ) SELECTwo.*,( SELECT `name` FROM sys_user_info sui_1 WHERE sui_1.id = wo.create_user_id ) AS createUserName,sui.`name` AS dealUserName 
FROMwork_order woINNER JOIN sui ON wo.deal_user_id = sui.id 
ORDER BYwo.create_time DESC WHERE ......条件LIMIT 0,20

三、问题

1、我们执行以下一个简单的查询,在数据量少的时候,发现没有什么问题,但是在工单表290万数据之后就出现问题了,查询耗时近9秒,实在是离谱。

WITH sui AS ( SELECT id, dept_id, `name` FROM sys_user_info WHERE dept_id IN ( ( 3 ), ( 6 ), ( 7 ) ) ) SELECTwo.*,( SELECT `name` FROM sys_user_info sui_1 WHERE sui_1.id = wo.create_user_id ) AS createUserName,sui.`name` AS dealUserName 
FROMwork_order woINNER JOIN sui ON wo.deal_user_id = sui.id 
ORDER BYwo.create_time DESC LIMIT 0,20

在这里插入图片描述

2、经过我慢慢排查发现,就是一旦我们不使用时间排序,就会发现快的起飞(当然这也是我在关键字段上加上索引的缘故,后面我会统一说
在这里插入图片描述

四、方案

4.1、处理

1、第一步使用 explain show profiles 来查看自己的sql有没有问题,看看是不是自己预期的情况,是不是 innodb_buffer_pool_size大小的问题。可以看下这个 一次mysql order by desc 慢的排查,个人觉得是比较好的。但是,我这边这个值已经是 1G了,但是效果还是很不理想,所以我暂时排除了这个方案。
在这里插入图片描述

2、我使用 explain命令查看后,可以看到我们在使用时间字段排序的时候,rows是293万行?这就是很离谱了,这就说明为什么那么慢了,而且看到最后一行 filesort就知道,我们该优化这个Sql了。

这个为什么是293万,为什么会比工单表290万还大,那是因为我们使用join关联表,形成了笛卡儿积。所以,我们最好能把先过滤的表的数据形成一张子表后,再关联。

在这里插入图片描述

3、我们在注释时间排序后,发现只有50万左右的数据了,一下少了近 1/4。
在这里插入图片描述
4、所以我们得出,我们必须先让时间索引生效,在这里网上有一些不同的方式,如下

  • 使用关键字 straight_join 修改驱动表和被驱动表的位置 ,可以参考 MySQL中驱动表和被驱动表的解读,但是我个人是不建议改的,而且改完MySQL就不能根据实际情况更改了。
  • 使用 FORCE INDEX(索引名称) 来强制使用索引。

5、我这里就已第二种方式来处理,可以看到使用的日期索引,并且个数是19(从0开始)
在这里插入图片描述
6、再看下查询速度,还是很快的。
在这里插入图片描述

4.2、问题的原因

1、所以总结在使用 ORDER BY wo.create_time DESC 慢的原因

  • 如果我们不使用字段排序,那么使用inner join后 只需要获取第0页20条数据即可,也就是在189514条数据中找前面20条即可,所以会快很多。
  • 但如果我们使用时间字段排序,这个时候我们需要对inner join的结果进行排序,而排序字段索引又没有生效(使用的是filesort),所以就很慢了。
  • 至于排序字段的索引为什么不生效,我们先看下 为什么MySQL会使用 filesort,官方解释如下:

Using filesort:
MySQL must do an extra pass to find out how to retrieve the rows in sorted order. The sort is done by going through all rows according to the join type and storing the sort key and pointer to the row for all rows that match the WHERE clause.
Mysql需要额外的一次传递,以找出如何按排序顺序检索行,通过根据联接类型浏览所有行并为所有匹配where子句的行保存排序关键字和行的指针来完成排序,然后关键字被排序,并按排序顺序检索行。

这句话直接翻译过来有点难以理解,简单说就是由于索引不满足你的sql,mysql需要对数据行进行一次额外的排序操作,这个排序操作既费空间又费时间。当数据量较少的时候并不会对应用产生多大影响,但数据量一多,就会出现非常可怕的后果,轻则服务响应变慢,重则拖垮服务,甚至引发雪崩效应导致应用宕机。

再回来看看我的sql,查询列和搜索条件应该都没有问题,那么应该order by影响了。通过搜索发现,order by 使用不当确实会导致索引失效。

五、使用 order by后查询速度很慢的可能原因。

  • 由于数据库两张表的字段编码不一致导致的。
  • 由于Using filesort排序导致的。
  • 由于没有走索引导致的。
  • 使用组合索引排序时,使用的顺序不对,需要保证顺序。

这里说一点,我们在联表查询的时候,最好相关外键都加上索引,这样会快很多。

这篇关于一次mysql联表 join 后 order by desc 慢的排查的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/671955

相关文章

Mysql 中的多表连接和连接类型详解

《Mysql中的多表连接和连接类型详解》这篇文章详细介绍了MySQL中的多表连接及其各种类型,包括内连接、左连接、右连接、全外连接、自连接和交叉连接,通过这些连接方式,可以将分散在不同表中的相关数据... 目录什么是多表连接?1. 内连接(INNER JOIN)2. 左连接(LEFT JOIN 或 LEFT

mysql重置root密码的完整步骤(适用于5.7和8.0)

《mysql重置root密码的完整步骤(适用于5.7和8.0)》:本文主要介绍mysql重置root密码的完整步骤,文中描述了如何停止MySQL服务、以管理员身份打开命令行、替换配置文件路径、修改... 目录第一步:先停止mysql服务,一定要停止!方式一:通过命令行关闭mysql服务方式二:通过服务项关闭

SQL Server数据库磁盘满了的解决办法

《SQLServer数据库磁盘满了的解决办法》系统再正常运行,我还在操作中,突然发现接口报错,后续所有接口都报错了,一查日志发现说是数据库磁盘满了,所以本文记录了SQLServer数据库磁盘满了的解... 目录问题解决方法删除数据库日志设置数据库日志大小问题今http://www.chinasem.cn天发

mysql主从及遇到的问题解决

《mysql主从及遇到的问题解决》本文详细介绍了如何使用Docker配置MySQL主从复制,首先创建了两个文件夹并分别配置了`my.cnf`文件,通过执行脚本启动容器并配置好主从关系,文中还提到了一些... 目录mysql主从及遇到问题解决遇到的问题说明总结mysql主从及遇到问题解决1.基于mysql

电脑多久清理一次灰尘合? 合理清理电脑上灰尘的科普文

《电脑多久清理一次灰尘合?合理清理电脑上灰尘的科普文》聊起电脑清理灰尘这个话题,我可有不少话要说,你知道吗,电脑就像个勤劳的工人,每天不停地为我们服务,但时间一长,它也会“出汗”——也就是积累灰尘,... 灰尘的堆积几乎是所有电脑用户面临的问题。无论你的房间有多干净,或者你的电脑是否安装了灰尘过滤器,灰尘都

MySQL的索引失效的原因实例及解决方案

《MySQL的索引失效的原因实例及解决方案》这篇文章主要讨论了MySQL索引失效的常见原因及其解决方案,它涵盖了数据类型不匹配、隐式转换、函数或表达式、范围查询、LIKE查询、OR条件、全表扫描、索引... 目录1. 数据类型不匹配2. 隐式转换3. 函数或表达式4. 范围查询之后的列5. like 查询6

Linux下MySQL8.0.26安装教程

《Linux下MySQL8.0.26安装教程》文章详细介绍了如何在Linux系统上安装和配置MySQL,包括下载、解压、安装依赖、启动服务、获取默认密码、设置密码、支持远程登录以及创建表,感兴趣的朋友... 目录1.找到官网下载位置1.访问mysql存档2.下载社区版3.百度网盘中2.linux安装配置1.

PostgreSQL如何用psql运行SQL文件

《PostgreSQL如何用psql运行SQL文件》文章介绍了两种运行预写好的SQL文件的方式:首先连接数据库后执行,或者直接通过psql命令执行,需要注意的是,文件路径在Linux系统中应使用斜杠/... 目录PostgreSQ编程L用psql运行SQL文件方式一方式二总结PostgreSQL用psql运

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M