PG sql调优案例学习

2024-06-11 19:20

本文主要是介绍PG sql调优案例学习,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一,开发范式

1.不要轻易把字段嵌入到表达式

例:在sal列上有索引,但是条件语句中把sal列放在了表达式当中,导致索引被压抑,因为索引里面储存的是sal列的值,而不是sal加上100以后的值。

在条件中查询谁的工资+100=2000。这样写即使在sal上有索引也会走全表扫描,主要原因就是sal列存放的是sal的值,并不是sal+100的值,

改写思路:通过等式等换,把sal列从表达式中剥离出来,就会用到索引:

如上图,代价远远小于全表扫描。

2.不要轻易把字段嵌入到函数中

例:在 hiredate列上有索引,但是条件语句中把该列放在了函数当中,导致索引被压抑,因为索引里面储存的是该列的值,而不是函数处理以后的值。

如上图,hiredate列有索引,但是放在了函数中,导致被压抑,执行计划走了全表扫描。

改写思路:通过等式转换,把列从函数中剥离出来,就会用到索引,比较成本,差别很大。

如上图,索引没有被压抑。

3.如果査询中比较固定查询某些列,可以基于这几个列建复合索引,直接查询索引(覆盖索引),避开回表扫描。

4.改变索引的关联度--类似Oracle的集簇因子

意思就是,在范围扫描的时候,索引关联度高的会扫描更少的块,关联度特别低的类似于b,与走了一遍全表扫描没有什么差别,在这种情况,我们可以改变索引的关联度。

在Oracle中,一般改变索引的集簇因子有两种方法

1、对表的行进行重排序

2、使用单表集簇 这两种办法可以用来维持行的顺序。将所有列值相同或者相邻的行放置在同一数据块中, 消除了全表扫描,使查询速度的增加高达 30 倍或者更多。

在PG中,可以使用重排序的方式。

例1:t1列有索引,如果此时不是范围扫描

主要查看correlation一列(Oracle中叫 clustering_factor),这一列如果和1相差很多,则认为关联度比较松散,此时总成本为12.47。

此时改变索引的关联度:

此时correlation为1,此时总成本为8。

例2:t1列有索引,如果此时是一个范围扫描

从上图可以看到,索引关联度不同,范围扫描消耗的成本更大。

二.多表查询技巧


1.驱动表上有很好的条件限制,同时,驱动表上的限制性条件字段上应该有索引,包括主键、唯一索引或其它索引、复合索引等

2.在每次连接操作之后尽量保证返回记录数最少,传递给下一个连接操作

3.根据返回的行的数量对应正确的连接方式。

4..尽量通过在被驱动表的连接字段上的索引,访问被驱动表。

5..单表扫描应该有效率,如果被驱动表上还有其它限制条件,可以遵循复合索引创建原则,创建合适的复合索引(连接字段与条件字段)

6..全表扫描也许是合理的,例如若干小表、代码表的访问。

7.依次类推,顺序完成所有表的连接操作。

多表查询案例分析1:如果有一张表有条件约束

此时,PG会把emp表作为驱动表,使用emp表上的索引来访问被驱动表dept。

dept表作为被驱动表,连接条件列要有索引。

emp表的deptno列就不需要有索引了。

多表查询案例分析2:如果两张表都有条件约束

如果根据案例1的思路,此时emp表为驱动表,empno上应该有索引,dept表为被驱动表,根据连接条件列d.deptno=e.deptno 被驱动表d.deptno上面要有索引,但dept表有限制条件d.dname='DALLS',此时分情况来讨论:
 

如果d.deptno为主键约束,那么可以不在d.dname列建索引,因为使用d.deptno即可访问。

如果d.dept不是主键索引,那么建议建复合索引(deptno,dname)。

多表查询案例分析3:如果有五张表的关联查询

可以看到,employees表访问了两次,起了两个不同的别名,可以当作两张单独的表,同时关联的还有departments,locations,jobs表。

看限制条件列

首先第一列:I.city= ‘South San Francisco’  , 那么在location的city列上要有索引。

再看location 这张表和哪个表进行连接:

很显然是这一列,所以d.location需要建索引。

再看d表还和哪个表连接:

索引emp.department需要建索引。

所以总而言之:有连接条件列,一般最好建索引
根据我们的思路,来逐步看执行计划:

第一种情况-无索引
在没有任何索引的情况下查看其执行计划,由于没有索引,所以所有扫描方式均为全表扫描,连接方式为 hash join。

第二种情况:建立单列索引

在 locations的city,location_id列上创建索引。
在 departments的 location_id上创建索引在 departments的 department_id上创建主键约束
在 employees的 employee_id上创建主键约束
在jobs的job_id上创建主键约束。

第三种情况-创建复合索引

在 locations的city、 location_id列上创建复合索引。
在 departments的 department_id、 location_id上创建复合索引
在 employees的 employee_id、 department_id、 manager_id、 job_id上创建复合索引(或者单列索引)
在jobs的 job_id上创建主键约束

三种执行计划成本对比:


经过分析发现,如果连接方式能够走嵌套循环,那么其成本比其它连接方式都低,当然我们要提供条件让优化器自动选择成本最低的连接方式,只要有一张表的访问方式是索引扫描,那么连接方式一般会选择嵌套循环。
Employees表的复合索引在执行计划中起到了作用,或者选择在连接条件列上( employee_id, department_id, manager_id)创建单列索引
Departments和 locations表的记录比较少,即使创建了单列或者多列索引,都不会使用索引。
连接顺序是L>D->EMP-MGR-J

虽然复合索引效率很客观,但复合索引维护成本较高,具体的sql调优手段还需要具体问题具体分析。

这篇关于PG sql调优案例学习的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1052064

相关文章

MySQL 分区与分库分表策略应用小结

《MySQL分区与分库分表策略应用小结》在大数据量、复杂查询和高并发的应用场景下,单一数据库往往难以满足性能和扩展性的要求,本文将详细介绍这两种策略的基本概念、实现方法及优缺点,并通过实际案例展示如... 目录mysql 分区与分库分表策略1. 数据库水平拆分的背景2. MySQL 分区策略2.1 分区概念

Python中使用正则表达式精准匹配IP地址的案例

《Python中使用正则表达式精准匹配IP地址的案例》Python的正则表达式(re模块)是完成这个任务的利器,但你知道怎么写才能准确匹配各种合法的IP地址吗,今天我们就来详细探讨这个问题,感兴趣的朋... 目录为什么需要IP正则表达式?IP地址的基本结构基础正则表达式写法精确匹配0-255的数字验证IP地

MySQL高级查询之JOIN、子查询、窗口函数实际案例

《MySQL高级查询之JOIN、子查询、窗口函数实际案例》:本文主要介绍MySQL高级查询之JOIN、子查询、窗口函数实际案例的相关资料,JOIN用于多表关联查询,子查询用于数据筛选和过滤,窗口函... 目录前言1. JOIN(连接查询)1.1 内连接(INNER JOIN)1.2 左连接(LEFT JOI

MySQL 中查询 VARCHAR 类型 JSON 数据的问题记录

《MySQL中查询VARCHAR类型JSON数据的问题记录》在数据库设计中,有时我们会将JSON数据存储在VARCHAR或TEXT类型字段中,本文将详细介绍如何在MySQL中有效查询存储为V... 目录一、问题背景二、mysql jsON 函数2.1 常用 JSON 函数三、查询示例3.1 基本查询3.2

MySQL中动态生成SQL语句去掉所有字段的空格的操作方法

《MySQL中动态生成SQL语句去掉所有字段的空格的操作方法》在数据库管理过程中,我们常常会遇到需要对表中字段进行清洗和整理的情况,本文将详细介绍如何在MySQL中动态生成SQL语句来去掉所有字段的空... 目录在mysql中动态生成SQL语句去掉所有字段的空格准备工作原理分析动态生成SQL语句在MySQL

MySQL中FIND_IN_SET函数与INSTR函数用法解析

《MySQL中FIND_IN_SET函数与INSTR函数用法解析》:本文主要介绍MySQL中FIND_IN_SET函数与INSTR函数用法解析,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一... 目录一、功能定义与语法1、FIND_IN_SET函数2、INSTR函数二、本质区别对比三、实际场景案例分

MySQL中的交叉连接、自然连接和内连接查询详解

《MySQL中的交叉连接、自然连接和内连接查询详解》:本文主要介绍MySQL中的交叉连接、自然连接和内连接查询,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、引入二、交php叉连接(cross join)三、自然连接(naturalandroid join)四

Mysql如何将数据按照年月分组的统计

《Mysql如何将数据按照年月分组的统计》:本文主要介绍Mysql如何将数据按照年月分组的统计方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql将数据按照年月分组的统计要的效果方案总结Mysql将数据按照年月分组的统计要的效果方案① 使用 DA

Mysql表如何按照日期字段的年月分区

《Mysql表如何按照日期字段的年月分区》:本文主要介绍Mysql表如何按照日期字段的年月分区的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、创键表时直接设置分区二、已有表分区1、分区的前置条件2、分区操作三、验证四、注意总结一、创键表时直接设置分区

mysql的基础语句和外键查询及其语句详解(推荐)

《mysql的基础语句和外键查询及其语句详解(推荐)》:本文主要介绍mysql的基础语句和外键查询及其语句详解(推荐),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋... 目录一、mysql 基础语句1. 数据库操作 创建数据库2. 表操作 创建表3. CRUD 操作二、外键