MySQL limit子句用法及优化(Limit Clause Optimization)

2024-06-19 20:12

本文主要是介绍MySQL limit子句用法及优化(Limit Clause Optimization),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在MySQL中,如果只想获取select查询结果的一部分,可以使用limit子句来限制返回记录的数量,limit在获取到满足条件的数据量时即会立刻终止SQL的执行。相比于返回所有数据然后丢弃一部分,执行效率会更高。

文章目录

  • 一、limit子句用法示例
    • 1.1 基本用法
    • 1.2 limit和order by
      • 1.2.1 排序瓶颈优化
  • 二、limit分页优化
    • 2.1 延迟关联
    • 2.2 转换为位置查询
    • 2.3 记录偏移位置

一、limit子句用法示例

limit子句通常放在select查询的最后,语法是limit [offset,] rowcount :

  • limit m,n 返回偏移量为m之后的n条数据,即先获取m+n条记录,然后丢弃前面的m条,返回之后的n条记录
  • limit n 返回开头的n条数据,相当于limit 0, n

1.1 基本用法

新建一张测试表并填充几条数据:

create table test(
id int auto_increment primary key,
name varchar(32),
salary decimal(10,2));insert into test values(null, 'aaa',1000),(null, 'bbb',2000),(null, 'ccc',3000),(null, 'ddd',4000),(null, 'eee',5000),(null, 'fff',6000),(null, 'ggg',7000),(null, 'hhh',8000),(null, 'iii',9000);

在这里插入图片描述

limit 0会立刻返回一个空结果集,它通常用来检测SQL语法是否正确或者快速获取结果集的字段属性。limit n用来返回最先获取的n条记录,找到足够的记录时SQL就会停止执行并返回结果:

select * from test limit 3;

在这里插入图片描述

采用limit m,n的形式,就是跳过前面的m条记录,返回之后的n条记录:

select * from test limit 3,3;

在这里插入图片描述

如果只是想跳过开头的m条记录,只需要给n一个足够大的数字即可,例如跳过开头100条记录:limit 100, 9999999999

1.2 limit和order by

如果order by子句和limit子句同时出现,那么MySQL会先对结果进行排序,对排序后的结果集应用limit子句。例如查询工资最高的3个人(按salary列倒序排列后取前3条记录):

select * from test order by salary desc limit 3;

在这里插入图片描述
如果排序的列存在重复数据,例如本例返回3条数据,但是3,4,5条记录的salary列都是相同的(它们都可以排在第三),这时返回的结果集是不确定的,查询时需注意。

1.2.1 排序瓶颈优化

与order by子句配合使用时,虽然limit子句最终获取的结果集可能很小,但需要先对所有的数据进行排序,如果这个数据量很大,那么排序操作就会成为性能瓶颈。

如果你发现limit子句加上order by之后语句执行很慢,可以尝试通过在排序列上增加索引来消除这个排序操作。由于示例表很小,优化器倾向于走全表扫描,这里找一张更大的表test1来演示,表中约有2万多条数据。观察添加索引前后的执行计划:

explain select * from test1 order by salary desc limit 3;
create index idx_salary on test1(salary);
explain select * from test1 order by salary desc limit 3;

在这里插入图片描述
可以看到索引反向扫描替代了原来的排序操作,同时扫描的行数量从24032降低到了3。

二、limit分页优化

limit子句最常用场景就是数据分页,通过变更偏移量来对数据进行分页展示。例如第一页显示100条数据,limit子句就是limit 0,100。第二页是limit 100,100,第三页是limit 200,100…. 但是当页数非常大时,limit m,n 中被丢弃的m条数据可能成为性能瓶颈。

由于前m条数据(偏移量)是最终需要的丢弃的,它们的内容我们并不关心,因此优化的思路就是"避免查询前m条数据的内容"。

2.1 延迟关联

为了避免查询偏移量m条数据的内容,我们可以先通过索引获取的n条数据的偏移量/主键(而不是对全量数据进行排序),然后通过主键直接获取n条数据的内容。这种策略叫做"延迟关联"。

例如查询:

select * from test1 order by salary desc limit 10000,100;

通过延迟关联可以改写为:

select salary from test1
join ( select id from test1 order by salary desc limit 10000,100) d on d.id=test1.id;

如果salary列上有索引,那么获取id是不需要回表的,通过索引就可以获取n条数据的主键,随后再与主表关联,通过主键取出这n条数据内容。虽然SQL看起来稍微复杂了,但是它绕过了获取前m条数据内容这个步骤,当m值比较大时,性能提升是很明显的。

2.2 转换为位置查询

这种策略是根据排序条件预先计算每行记录的顺序编号并加上索引,例如在表中新增一列position(或者单独新增一张顺序表也可以),保存的是每一行位置顺序。这相当于分页排序已经预先执行了,而偏移操作就被转换成了索引范围扫描。

例如查询:

select * from test1 order by salary desc limit 10000,100;

通过位置查询可以改写为:

select * from test1 where position between 10001 and 10100;

position列是根据order by salary desc条件预先维护好的每一列的顺序编号,此后每次分页查询都不需要计算偏移量,而是被转换成了索引范围扫描(Index Range Scan)。

2.3 记录偏移位置

记录偏移位置的方法,就是当排序列存在顺序的情况下,每次查询后将其最后的值记录下来,然后作为下一次SQL查询的过滤条件。

假设首次查询如下(id列单调递增):

select * from test1 order by id limit 9900,100;

假设上面查询返回结果集的最大id为123456,程序可以将这个值单独记录下来,那么SQL:

select * from test1 order by id limit 10000,100;

就可以改写为:

select * from test1 where id>123456 order by id limit 100;

通过条件where id>123456就可以过滤掉前m条数据,但这种方法的缺陷就是它只能一页一页的顺序往后翻,不能跳转翻页,对比上面2种方法不够灵活。

这篇关于MySQL limit子句用法及优化(Limit Clause Optimization)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1076030

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

Mysql DATETIME 毫秒坑的解决

《MysqlDATETIME毫秒坑的解决》本文主要介绍了MysqlDATETIME毫秒坑的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 今天写代码突发一个诡异的 bug,代码逻辑大概如下。1. 新增退款单记录boolean save = s

mysql-8.0.30压缩包版安装和配置MySQL环境过程

《mysql-8.0.30压缩包版安装和配置MySQL环境过程》该文章介绍了如何在Windows系统中下载、安装和配置MySQL数据库,包括下载地址、解压文件、创建和配置my.ini文件、设置环境变量... 目录压缩包安装配置下载配置环境变量下载和初始化总结压缩包安装配置下载下载地址:https://d