mysql 优化大师执行计划_阿里云数据库挑战赛quot;SQL优化大师quot;获奖案例

本文主要是介绍mysql 优化大师执行计划_阿里云数据库挑战赛quot;SQL优化大师quot;获奖案例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、前言

2017/07在阿里云举办的第一届“阿里云数据库挑战赛第一季“慢SQL性能优化赛”期间,我得到知数堂叶老师的鼎力相助,成功突破重围,过关斩将,获得“SQL优化大师”荣誉称号!

阿里云数据库挑战赛

第一季“SQL优化大师”

通过这次挑战赛的实践,加上中间叶老师的指导,让我增进了对SQL优化的认识。

在此,分享下我的SQL优化过程,希望能给各位提供一些SQL优化方面的思路,大家共同交流进步。

二、优化过程

1、优化前

原始SQL

select a.seller_id,a.seller_name,b.user_name,c.state

from a,b,c

where a.seller_name=b.seller_name and

b.user_id=c.user_id and

c.user_id=17 and

a.gmt_create BETWEEN DATE_ADD(NOW(), INTERVAL - 600 MINUTE)

AND DATE_ADD(NOW(), INTERVAL 600 MINUTE)

order by a.gmt_create

原始表结构

create table a(

id int auto_increment,

seller_id bigint,

seller_name varchar(100) collate utf8_bin ,

gmt_create varchar(30),

primary key(id)) character set utf8;

create table b (

id int auto_increment,

seller_name varchar(100),

user_id varchar(50),

user_name varchar(100),

sales bigint,

gmt_create varchar(30),

primary key(id)) character set utf8;

create table c (

id int auto_increment,

user_id varchar(50),

order_id varchar(100),

state bigint,

gmt_create varchar(30),

primary key(id)) character set utf8;

2、优化前的SQL执行计划

explain select a.seller_id,a.seller_name,b.user_name,c.state from a,b,c

where a.seller_name=b.seller_name and b.user_id=c.user_id

and c.user_id=17 and

a.gmt_create BETWEEN DATE_ADD(NOW(),

INTERVAL - 600 MINUTE) AND DATE_ADD(NOW(), INTERVAL 600 MINUTE)

order by a.gmt_create

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: a

partitions: NULL

type: ALL

possible_keys: NULL

key: NULL

key_len: NULL

ref: NULL

rows: 16109

filtered: 11.11

Extra: Using where; Using temporary; Using filesort

*************************** 2. row ***************************

id: 1

select_type: SIMPLE

table: b

partitions: NULL

type: ALL

possible_keys: NULL

key: NULL

key_len: NULL

ref: NULL

rows: 16174

filtered: 100.00

Extra: Using where; Using join buffer (Block Nested Loop)

*************************** 3. row ***************************

id: 1

select_type: SIMPLE

table: c

partitions: NULL

type: ALL

possible_keys: NULL

key: NULL

key_len: NULL

ref: NULL

rows: 359382

filtered: 1.00

Extra: Using where; Using join buffer (Block Nested Loop)

3、优化后

先看下经过优化后的终版SQL执行计划

mysql> explain select a.seller_id, a.seller_name,b.user_name,

c.state from a left join b

on (a.seller_name=b.seller_name)

left join c on (b.user_id=c.user_id)

where c.user_id='17'

and a.gmt_create BETWEEN DATE_ADD(NOW(), INTERVAL - 600 MINUTE)

AND DATE_ADD(NOW(), INTERVAL 600 MINUTE);

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: b

partitions: NULL

type: ref

possible_keys: i_seller_name,i_user_id

key: i_user_id

key_len: 3

ref: const

rows: 1

filtered: 100.00

Extra: Using where

*************************** 2. row ***************************

id: 1

select_type: SIMPLE

table: c

partitions: NULL

type: ref

possible_keys: i_user_id

key: i_user_id

key_len: 3

ref: const

rows: 1

filtered: 100.00

Extra: Using index condition

*************************** 3. row ***************************

id: 1

select_type: SIMPLE

table: a

partitions: NULL

type: ref

possible_keys: i_seller_name

key: i_seller_name

key_len: 25

ref: test1.b.seller_name

rows: 1

filtered: 11.11

Extra: Using where

优化完后这个SQL毫秒级出结果(看下方profiling截图)

ecf47c429bd0350545f6bd9292408d33.png

4、优化思路

硬件&系统环境

硬盘:SSD(pcie)

内存:16G

CPU:8核

操作系统:选择Centos7系统,xfs文件系统

内核参数做些调整:

vm.swappiness = 5 #建议设置5-10

io schedule选择 deadline/noop 之一

MySQL 版本选择

推荐MySQL 5.6以上的版本,最好是MySQL 5.7。

MySQL 5.6优化器增加了ICP、MRR、BKA等特性,5.7在性能上有更多提升。

MySQL参数调整

innodb_buffer_pool_size #物理内存的50% - 70%

innodb_flush_log_at_trx_commit = 1

innodb_max_dirty_pages_pct = 50 #建议不高于50

innodb_io_capacity = 5000 #SSD盘

#大赛要求关闭QC

query_cache_size = 0

query_cache_type = 0

SQL调优过程详解

首先,我们看到原来的执行计划中3个表的查询都是全表扫描(type = ALL),所以先把关联查询字段以及WHERE条件中的字段加上索引。

1、添加索引

alter table a add index i_seller_name(seller_name);

alter table a add index i_seller_id(seller_id);

alter table b add index i_seller_name(seller_name);

alter table b add index i_user_id(user_id);

alter table c add index i_user_id(user_id);

alter table c add index i_state(state);

添加完索引后,再看下新的执行计划:

explain select a.seller_id,

a.seller_name,b.user_name ,c.state from a

left join b on (a.seller_name=b.seller_name)

left join c on( b.user_id=c.user_id ) where c.user_id='17'

and a.gmt_create BETWEEN DATE_ADD(NOW(),

INTERVAL - 600 MINUTE) AND

DATE_ADD(NOW(), INTERVAL 600 MINUTE)\G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: b

partitions: NULL

type: ref

possible_keys: i_user_id

key: i_user_id

key_len: 53

ref: const

rows: 1

filtered: 100.00

Extra: NULL

*************************** 2. row ***************************

id: 1

select_type: SIMPLE

table: c

partitions: NULL

type: ref

possible_keys: i_user_id

key: i_user_id

key_len: 53

ref: const

rows: 1

filtered: 100.00

Extra: NULL

*************************** 3. row ***************************

id: 1

select_type: SIMPLE

table: a

partitions: NULL

type: ref

possible_keys: i_seller_name

key: i_seller_name

key_len: 303

ref: func

rows: 947

filtered: 11.11

Extra: Using index condition; Using where

我们注意到执行计划中3个表的key_len列都太大了,最小也有53字节,最大303字节,要不要这么夸张啊~

2、修改字符集、修改字段数据类型

默认字符集是utf8(每个字符最多占3个字节),因为该表并不存储中文,因此只需要用latin1字符集(最大占1个字节)。

除此外,我们检查3个表的字段数据类型,发现有些varchar(100)的列实际最大长度并没这么大,有些实际存储datetime数据的却采用varchar(30)类型,有些用bigint/int就足够的也采用varchar类型,真是醉了。于是分别把这些数据类型改为更合适的类型。

修改表字符集和调整各个列数据类型很重要的作用是可以减小索引的key_len,从而减少关联的字段的字节,减少内存消耗。

优化后的表结构

CREATE TABLE `a` (

`id` int NOT NULL AUTO_INCREMENT,

`seller_id` int(6) DEFAULT NULL,

`seller_name` char(8) DEFAULT NULL,

`gmt_create` datetime DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `i_seller_id` (`seller_id`),

KEY `i_seller_name` (`seller_name`)

) ENGINE=InnoDB DEFAULT CHARSET=latin1

CREATE TABLE `b` (

`id` int NOT NULL AUTO_INCREMENT,

`seller_name` char(8) DEFAULT NULL,

`user_id` smallint(5) DEFAULT NULL,

`user_name` char(10) DEFAULT NULL,

`sales` int(11) DEFAULT NULL,

`gmt_create` datetime DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `i_seller_name` (`seller_name`),

KEY `i_user_id` (`user_id`),

KEY `i_user_name` (`user_name`)

) ENGINE=InnoDB DEFAULT CHARSET=latin1

CREATE TABLE `c` (

`id` int NOT NULL AUTO_INCREMENT,

`user_id` smallint(5) DEFAULT NULL,

`order_id` char(10) DEFAULT NULL,

`state` int(11) DEFAULT NULL,

`gmt_create` datetime DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `i_user_id` (`user_id`),

KEY `i_state` (`state`)

) ENGINE=InnoDB DEFAULT CHARSET=latin1

以上是我在阿里云数据库挑战赛中的获奖案例,感谢在比赛过程中叶老师对我的提点和帮助,同时非常感谢知数堂教授SQL优化技能!

最后,我想说的是,只要掌握SQL优化的几个常规套路,你也可以完成绝大多数的SQL优化工作滴!

附录:3个表数据初始化

insert into a (seller_id,seller_name,gmt_create) values (100000,'uniqla','2017-01-01');

insert into a (seller_id,seller_name,gmt_create) values (100001,'uniqlb','2017-02-01');

insert into a (seller_id,seller_name,gmt_create) values (100002,'uniqlc','2017-03-01');

insert into a (seller_id,seller_name,gmt_create) values (100003,'uniqld','2017-04-01');

...重复N次写入

insert into b (seller_name,user_id,user_name,sales,gmt_create) values ('niqla','1','a',1,now());

insert into b (seller_name,user_id,user_name,sales,gmt_create) values ('niqlb','2','b',3,now());

insert into b (seller_name,user_id,user_name,sales,gmt_create) values ('niqlc','3','c',1,now());

insert into b (seller_name,user_id,user_name,sales,gmt_create) values ('niqld','4','d',4,now());

...重复N次写入

insert into c (user_id,order_id,state,gmt_create) values( 21,1,0 ,now() );

insert into c (user_id,order_id,state,gmt_create) values( 22,2,0 ,now() );

insert into c (user_id,order_id,state,gmt_create) values( 33,3,0 ,now() );

insert into c (user_id,order_id,state,gmt_create) values( 43,4,0 ,now() );

...重复N次写入

原文发布时间为:2017-09-30

本文作者:田帅萌

本文来自云栖社区合作伙伴“老叶茶馆”,了解相关信息可以关注“老叶茶馆”微信公众号

这篇关于mysql 优化大师执行计划_阿里云数据库挑战赛quot;SQL优化大师quot;获奖案例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/716407

相关文章

数据库oracle用户密码过期查询及解决方案

《数据库oracle用户密码过期查询及解决方案》:本文主要介绍如何处理ORACLE数据库用户密码过期和修改密码期限的问题,包括创建用户、赋予权限、修改密码、解锁用户和设置密码期限,文中通过代码介绍... 目录前言一、创建用户、赋予权限、修改密码、解锁用户和设置期限二、查询用户密码期限和过期后的修改1.查询用

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的

Golang操作DuckDB实战案例分享

《Golang操作DuckDB实战案例分享》DuckDB是一个嵌入式SQL数据库引擎,它与众所周知的SQLite非常相似,但它是为olap风格的工作负载设计的,DuckDB支持各种数据类型和SQL特性... 目录DuckDB的主要优点环境准备初始化表和数据查询单行或多行错误处理和事务完整代码最后总结Duck

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

IDEA如何切换数据库版本mysql5或mysql8

《IDEA如何切换数据库版本mysql5或mysql8》本文介绍了如何将IntelliJIDEA从MySQL5切换到MySQL8的详细步骤,包括下载MySQL8、安装、配置、停止旧服务、启动新服务以及... 目录问题描述解决方案第一步第二步第三步第四步第五步总结问题描述最近想开发一个新应用,想使用mysq

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Mysql DATETIME 毫秒坑的解决

《MysqlDATETIME毫秒坑的解决》本文主要介绍了MysqlDATETIME毫秒坑的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 今天写代码突发一个诡异的 bug,代码逻辑大概如下。1. 新增退款单记录boolean save = s