mysql冷热数据LRU_MySQL性能优化学习笔记(三)

2023-11-22 18:10

本文主要是介绍mysql冷热数据LRU_MySQL性能优化学习笔记(三),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在之前的文章《从零开始带你成为MySQL实战优化高手学习笔记(二) 关于buffer pool的相关知识》中,已经简单的了解了的一些buffer pool的东西:free链表用来记录哪些缓存页是空的,flush链表记录哪些是被修改过的。

目录

1、缓存页满了怎么办?

但是,free链表总会有空的时候,也就是说缓存页都满了,再没有空余缓存用来加载磁盘上的数据页?

这时候我们想,怎么办?是不是要把一部分缓存页淘汰掉,也就是清空,然后再加载新的数据页到缓存页。

如何淘汰?

1.1、LRU淘汰算法

1.1.1、策略:

MySQL使用了LRU淘汰算法,LRU也就是least recently use,最近最少使用。

策略就是使用的缓存页就加到LRU链表的头部,只要修改或者查询过就会移到链表头部,最后淘汰LRU尾部的。

1.1.2、存在的问题:

1、MySQL有个预读机制:当从磁盘中加载一个数据页的时候,有可能会把相邻的数据页也一块加载到缓存页。

这会带来什么问题?

a171ae6d40cb048cb9b77fc27206c991.png

看上图,比如,空间大小就为4,原本ABC都是经常被访问的,现在要加入虚线那两个数据页,必须要淘汰一个,那肯定就淘汰C,就把常访问的淘汰了,留下了没有访问的相邻数据页。

那么在此就有必要了解一下MySQL的预读机制

①、通过参数innodb_read_ahead_threshold控制,默认是56。这个参数表示如果顺序访问了一个区里的多个数据页,这里的多个就是56,就会触发预读机制,把下一个区中所有的数据页都加载到缓存页里。

②、通过参数innodb_random_read_ahead控制,默认是off。这个参数表示如果缓存了一个区的13个连续数据页,就会触发预读机制,把这个区里的页全都加载到缓存页里。

2、全表扫描

如果是全表扫描,会把全表都加载到buffer pool中,有可能就把LRU链表中经常访问的都挤到后面去,就有可能被淘汰。

如何优化呐?

既然有经常访问的数据,又有不常访问的数据,是不是可以在LRU链表中分区啊,对这两块数据分别管理。

1.2、基于冷热数据分离的思想设计LRU链表

所有把LRU链表分为两部分,冷热比例由innodb_old_blocks_pct参数控制,默认是37,也就是说冷数据占比37%。

1.2.1、策略

第一次加载的数据页,直接放到冷数据区域的头部。

15f2299742262b2b878df544bac59710.png

那什么时候放到热数据区域那?

通过参数innodb_old_block_time控制,默认1000,毫秒。这个参数表示,必须数据页加载到缓存页1000毫秒之后再次访问才加到热数据区域。

1.2.2、性能优化

位于热数据区域的数据,如果被访问了,应不应该立即加载热数据区域的头部?

无论链表方不方便,频繁的移动肯定是不希望的。MySQL规定,只有在热数据的后3/4部分的数据被访问了才会移动到链表头部。

1.3、冷数据的刷盘机制

之前的讨论都是说缓存满了才淘汰尾部数据刷入磁盘,实际上并不是非得等满了。后台有一个线程,运行一个定时任务,每隔一段时间就刷入磁盘然后清空这几个缓存页,并加到free链表中。

别忘了,刷入磁盘的不仅仅是冷数据区域,还有flush链表,等MySQL不是很忙的时候就会执行,然后从flush链表和LRU链表中移除。

1.4、总结

实际上就是不断的加载数据页到缓存页,然后不停的查询和修改缓存数据,free链表不停的减少,flush链表不停的增加,LRU链表不停的增加和移动。

另一边,后台线程不停的把LRU中的冷数据以及flush中的数据刷入磁盘,清空一部分缓存页。flush链表和LRU链表在减少,free链表在增多。

1.5 问题

如果要加载数据到缓存页,但是没空间了,就需要把冷数据刷盘,然后再读如缓存页,这就是两次磁盘IO。如果一直遇到这种情况,性能肯定很差,这又该怎么办?

欢迎关注微信公众号,公众号的好处是可以持续保持联系。

0b5c1459544048f41f9b552c30a72992.png

本文同步分享在 博客“w_boyang”(CSDN)。

如有侵权,请联系 support@oschina.cn 删除。

本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

这篇关于mysql冷热数据LRU_MySQL性能优化学习笔记(三)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/411960

相关文章

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

C#使用yield关键字实现提升迭代性能与效率

《C#使用yield关键字实现提升迭代性能与效率》yield关键字在C#中简化了数据迭代的方式,实现了按需生成数据,自动维护迭代状态,本文主要来聊聊如何使用yield关键字实现提升迭代性能与效率,感兴... 目录前言传统迭代和yield迭代方式对比yield延迟加载按需获取数据yield break显式示迭

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Python实现将实体类列表数据导出到Excel文件

《Python实现将实体类列表数据导出到Excel文件》在数据处理和报告生成中,将实体类的列表数据导出到Excel文件是一项常见任务,Python提供了多种库来实现这一目标,下面就来跟随小编一起学习一... 目录一、环境准备二、定义实体类三、创建实体类列表四、将实体类列表转换为DataFrame五、导出Da

Python实现数据清洗的18种方法

《Python实现数据清洗的18种方法》本文主要介绍了Python实现数据清洗的18种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录1. 去除字符串两边空格2. 转换数据类型3. 大小写转换4. 移除列表中的重复元素5. 快速统