【MySQL进阶之路 | 高级篇】InnoDB存储结构(页的内部结构)

2024-06-22 17:20

本文主要是介绍【MySQL进阶之路 | 高级篇】InnoDB存储结构(页的内部结构),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 数据库的存储结构 : 页

索引结构给我们提供了高效的索引方式,不过索引信息以及数据记录都是保存在文件上的.确切说是存储在页结构中.另一方面,索引是在存储引擎中实现的,MySQL服务器上的存储引擎负责对表中数据的读取和写入操作.不同的存储引擎中存放的格式一般不同.甚至有个存储引擎比如Memory都不用磁盘来存储数据,而是存储在内存中.重启MySQL服务器直接GG.

(1). 磁盘与内存交互基本单位:页

InnoDB将数据划分为若干个页,InnoDB中页的大小默认为16kb.以页作为磁盘和内存之间的交互的基本单位,也就是一次最少从磁盘中读取16kb的内容到内存中,一次最少把内存中的16kb的内容刷新到磁盘中.也就是说,在数据库中,不论读取一行,还是读取多行,都将这些行所在的页都加载到内存中.即,数据库管理存储空间的基本单位是页.数据库I/O操作的最小单位是页.一般情况下一个页可以存储多个行记录.

记录是按照行来存储的,但数据库的读取并不以行为单位,否则一次I/O操作只处理一行数据,效率会非常低.

(2). 页结构的概述

页a,页b,...这些页可以不在物理结构上相连,只需要通过双向链表在逻辑上相邻即可.每个数据页中的记录按照主键值从小到大的顺序组成一个单向链表,每个数据页都会为存储在其中的记录生成一个页目录,在通过主键查找某条记录的时候可以在页目录中通过二分法快速定位到对应的槽,然后再遍历槽对应分组中的记录即可快速找到指定的记录.

(3). 页的大小

不同数据库管理系统的页的大小是不同的.比如在MySQL的InnoDB存储引擎中,默认页的大小为16kb.

(4). 页的上层结构

另外在数据库中,还存在着区,段,和表空间的概念.行,页,区,段,表空间的关系如图.

1c1af07f4adc4c198f6d9b434ca85be4.png

  • 区是比页大一级的存储结构,在InnoDB存储结构中,一个区会分配64个连续的页.因为在InnoDB中页的大小默认是16kb的.所以一个区的大小是16*64kb=1mb.
  • 段是由一个或多个区组成.区在文件系统是一个连续分配的空间(在InnoDB中是连续的64个页),不过在段中不要求区与区之间是相邻的.段是数据库中的分配单位,不同类型的数据库对象以不同的段形式存在.当我们创建数据库表,索引的时候,就会创建相对应的段,比如创建一张表的时候创建表段,创建索引的时候创建一个索引段.
  • 表空间是一个逻辑容器.表空间存储的对象是段,在一个表空间中可以有一个或多个段,但是一个段只能属于一个表空间.数据库由一个或多个表空间组成,表空间从管理上可以划分为系统表空间和用户表空间,撤销表空间,临时表空间.

(5). 页的内部结构  超级重点

页如果按照类型划分,常见的有数据页(保存b+树节点),系统页,Undo页和事务数据页.数据页是我们最常用的页.

数据页的16kb大小的存储空间被划分为7个部分,分别是文件头,页头,最大最小记录,用户记录,空闲空间,页目录和文件尾.

4308af57afb0440d9ce7a1995630124f.png

这7个部分的作用.

d35afda1cae343ca829d7152f1a650f0.png

1). 文件头(File Header)和文件尾(File Trailer)

首先是文件通用部分,也就是文件头和文件尾.

文件头部信息.

  • 不同类型的页都会以File Header作为第一个组成部分,它描述了一些针对各种页都通用的一些信息.比方说这个页的编号是多少,它上一个页是谁,下一个页是谁等等.所有的数据页会组成一个双向链表.

文件头的构成.

ac41359b033a4b23a209ce1c04e46db7.png

2). 记录部分(Free Space User Records InfiMum SuperMum)

页的主要作用是存储记录,所以最大最小记录和用户记录占了页结构的主要空间.

7685a626a21c470bb79b1054ef6bcbaf.png

1.空闲空间(Free Space)和用户记录(User Records)

我们自己存储的记录会按照指定的行格式存储到User Records部分.但是在一开始生成页的时候,其实并没有User Records这一部分,也就是尚未使用的存储空间中申请一个记录大小的空间划分到User Records.当Free Space部分的空间全部被User Records部分替代后,也就意味着这个页用完了,如果还有其他记录插入,就需要去申请其他新的页.

User Records中这些记录按照指定的行格式一条一条摆在User Records部分,相互之间形成了单链表.

2. 最小最大记录(Infimum, Supermum)

记录是可以比大小的,对于一个完整的记录,比较记录的大小就是比较主键值的大小.InnoDB规定的最小最大记录这两个记录的构造非常简单,都是由5个字节大小的记录头信息和8个字节的一个固定部分组成.

e183f6de75fe4fa6b01e7b22f8477741.png

3). 页目录(Page Directory)

在页中,记录是以单向链表的形式进行存储的.单向链表的特点是插入删除非常方便,但查找效率不高.因此在页结构专门设计了一个页目录这个模块.专门给记录做一个记录,通过二分查找的方式进行检索.

将所有的记录分组,这些记录包括最小记录和最大记录.但不包括已经被"删除"的记录(实际物理磁盘上依然存在,逻辑上是删除的).

第一组 : 就是最小记录所在的分组,只有一条记录.

最后一组 : 就是最大记录所在的分组.会有1-8条记录.

其余的组记录数量在4-8之间.

这样做的好处是除了第一组外,其他组的记录数会尽量平分.

在每个组中最后一条记录的记录头信息中会存储该组有多少条记录.作为n_owned字段的值.

页目录就是用来存储每组最后一条记录的地址偏移量.这些偏移量会按照先后顺序存储起来,每组的地址偏移量也被称为槽slot.每个槽相当于指针指向了不同组的最后一个记录.

719f63f928fc41fc93676ea8273880ee.png

4). 页面头部(Page Header)

为了得到一个数据页中存储的记录的状态信息,比如本页存储了多少条记录,第一条记录的地址是什么等,特意在页中定义了一个叫page header的部分.这个部分占固定的56个字节.

这篇关于【MySQL进阶之路 | 高级篇】InnoDB存储结构(页的内部结构)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1084924

相关文章

SQL注入漏洞扫描之sqlmap详解

《SQL注入漏洞扫描之sqlmap详解》SQLMap是一款自动执行SQL注入的审计工具,支持多种SQL注入技术,包括布尔型盲注、时间型盲注、报错型注入、联合查询注入和堆叠查询注入... 目录what支持类型how---less-1为例1.检测网站是否存在sql注入漏洞的注入点2.列举可用数据库3.列举数据库

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

Python进阶之Excel基本操作介绍

《Python进阶之Excel基本操作介绍》在现实中,很多工作都需要与数据打交道,Excel作为常用的数据处理工具,一直备受人们的青睐,本文主要为大家介绍了一些Python中Excel的基本操作,希望... 目录概述写入使用 xlwt使用 XlsxWriter读取修改概述在现实中,很多工作都需要与数据打交

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

Mysql DATETIME 毫秒坑的解决

《MysqlDATETIME毫秒坑的解决》本文主要介绍了MysqlDATETIME毫秒坑的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 今天写代码突发一个诡异的 bug,代码逻辑大概如下。1. 新增退款单记录boolean save = s

mysql-8.0.30压缩包版安装和配置MySQL环境过程

《mysql-8.0.30压缩包版安装和配置MySQL环境过程》该文章介绍了如何在Windows系统中下载、安装和配置MySQL数据库,包括下载地址、解压文件、创建和配置my.ini文件、设置环境变量... 目录压缩包安装配置下载配置环境变量下载和初始化总结压缩包安装配置下载下载地址:https://d