【MySQL 数据宝典】【磁盘结构】- 003 双写缓冲区

本文主要是介绍【MySQL 数据宝典】【磁盘结构】- 003 双写缓冲区，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一、双写缓冲区 ( Doublewrite Buffer Files)

1.1 背景介绍

写失效 (部分页失效)

InnoDB的页和操作系统的页大小不一致，InnoDB页大小一般为16K，操作系统页大小为4K，InnoDB的页写入到磁盘时，一个页需要分4次写。
如果存储引擎正在写入页的数据到磁盘时发生了宕机，可能出现页只写了一部分的情况，比如只写了4K，就宕机了，这种情况叫做部分写失效（partial page write），可能会导致数据丢失。

1.2 双写缓冲区 Doublewrite Buffer

为了解决写失效问题，InnoDB实现了双写缓冲区，它位于系统表空间，是一个存储区域。
在BufferPool的页刷新到磁盘真正位置前，数据会先被存储在双写缓冲区。
这样在宕机重启时，即使发生数据页损坏，可以通过该页的副本来还原该页，然后再进行redo log重做，确保了数据页的可靠性。

1.3 配置开关

默认情况下启用双写缓冲区，可以通过将 innodb_doublewrite 设置为0 来禁用。

mysql> show variables like '%innodb_doublewrite%';
+--------------------+-------+
| Variable_name      | Value |
+--------------------+-------+
| innodb_doublewrite | ON    |
+--------------------+-------+
1 row in set (0.01 sec)

1.4 数据双写流程

Step 1：脏页刷新到磁盘前，先写入双写缓冲区。
Step 2：使用 memcpy 函数将脏页复制到内存中的双写缓冲区。
Step 3：将双写缓冲区的数据分两次，每次1MB，顺序写入共享表空间的物理磁盘上。
Step 4：完成双写缓冲区的写入后，再将双写缓冲区中的页写入各个表的独立表空间文件中。

1.4.1 双写的原因

为啥写两次，刷一次数据文件保存数据不就可以了，为什么还要写共享表空间 ?

性能提升：共享表空间是在ibdata文件中划出的连续空间，专门用于存储双写缓冲区的数据。在这个过程中，双写缓冲区中的数据是连续存储的，因此写入磁盘时可以实现顺序写入。顺序写入通常比随机写入更快，因为它可以最大程度地减少磁盘头寻址的时间，从而提高了磁盘写入性能。
数据可靠性：完成共享表空间的写入后，再将数据写入到各个表的独立表空间文件中。这时，数据的写入变为离散的，因为每个表的独立表空间文件都是分散在磁盘上的。虽然这种写入方式可能比较慢，但它确保了数据的分散存储，提高了数据的可靠性。即使出现了硬件故障或其他意外情况，只影响到了某个表的数据文件，其他表的数据仍然是安全的。

双写缓冲区在写入过程中发生了宕机，数据页仍然有可能丢失。双写缓冲区的设计是为了减少写失效（partial page write）的风险，但并不能完全消除它

这篇关于【MySQL 数据宝典】【磁盘结构】- 003 双写缓冲区的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！