真丢人,工作六七年了,没搞明白MySQL插入是并发还是串行?

2023-11-06 14:04

本文主要是介绍真丢人,工作六七年了,没搞明白MySQL插入是并发还是串行?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近五哥和同事争辩起来,MySQL插入是并发还是串行,我记得明明是串行插入,同事非要和我杠,说MySQL可以并发插入。

我要亲自试验一下,打他的脸!

6c1c33fbaf0f171cb49730d8c4c28ede.jpeg

MySQL 实验版本 8.0

定义表结构

首先定义 用户信息表userInfo,其中id为自增,name具有唯一索引。

02cb699b9e95316826e9a94a2d6a193f.jpeg

验证流程

默认情况下,在命令行中 MySQL会自动提交,每个SQL执行会非常快,无法验证同时执行的两个事务之间是否存在阻塞情况,所以需要显示开启事务和提交事务 。

验证

首先,我们开启两个事务。在事务1中,首先插入一条记录,暂时不提交。然后,在事务2中开启一个新的事务,并插入一条自增记录。

如果MySQL的innodb插入是串行的,那么此时事务2的插入记录将会被阻塞。如果没有被阻塞,那就说明MySQL的innodb插入是并发执行的。

时间序号事务1事务21开启事务 START TRANSACTION;2主键自增插入记录(ID=1)3开启事务 START TRANSACTION;4主键自增插入记录(ID=2)5提交事务Commit6查询当前用户列表,居然有ID=2的记录7提交事务Commit

实验验证

事务2 的执行记录 ce6915b6515c04be76785083713a9e5d.jpeg

如上图所示,在事务1还未提交,事务2在事务1的间隙中插入一条记录,插入操作立即成功,并且事务2的自增主键ID为2。这说明在MySQL中,当一个事务正在插入记录时,并不会阻塞其他事务的插入。

在MySQL中,多个事务之间的插入操作是并发进行的,而不是串行进行的。

我感觉自己的脸热热的,小丑竟是我自己,赶紧给同事认了错……

54d7db64b543336cc6be3aff4ee06540.jpeg

我的认知一直是错误的。

但是在底层存储层面,MySQL会对数据页加锁。如果两条记录在同一个数据页,实际写入是串行的,但是事务层面是并发的。

想象一下,库存扣减和新增库存流水在同一个事务中,如果新增库存流水是串行的,那将极大的降低库存事务的并发度啊。

本以为验证结束,打卡下班,结果发现 MySQL插入似乎存在幻读问题!

从下图中可以观察到,事务1在插入时似乎确实出现了幻读问题!

事务 1 的执行记录显示,事务1先于事务2开启,但是事务1期间可以查询到事务2提交的记录。这说明有幻读问题! 5b5df2a076960d79ee5e5d0d94fb74d5.jpeg

为什么出现幻读?

所谓幻读,是指在一个事务读取记录时,另一个事务在此时插入或删除了一条记录,导致第一个事务再次读取时发现记录的数量发生了变化。

要想理解出现幻读的原因,需要先了解MySQL是如何解决幻读问题的。

为了解决幻读问题,MySQL采用了间隙锁和多版本并发控制(MVCC)的方法。间隙锁会锁定一段记录的范围,其他事务无法对这些记录进行更新或删除操作。这样,当当前事务再次进行查询时,就不会出现记录数量的新增或减少的情况了。

MySQL 插入时加了什么锁?

MySQL 插入时存在幻读问题,说明MySQL 并没有加间隙锁,主要考虑也是为了提高插入时并发度,如果添加间隙锁,势必导致插入并发度降低!MySQL 在插入之前会申请 插入意向锁,而记录本身不冲突(无唯一键冲突)插入意向锁就不会冲突。

MySQL 文档中记录了 插入意向锁

插入意向锁(insert intention lock)是一种由插入操作在插入行之前设置的锁定类型。这种锁定方式表示插入的意图,使得在相同索引间隙上进行插入的多个事务在插入位置不冲突的情况下不需要互相等待。假设索引记录中存在值为4和7的记录。分别尝试插入值为5和6的两个不同事务,在获得插入行的排他锁之前,它们会先使用插入意向锁锁定位于4和7之间的间隙,并且由于插入行不冲突,它们不会互相阻塞。

插入场景MVCC 不生效?

除更新场景外,查询场景也有幻读的困恼。如果第一次查询时只有3条记录,再次查询则变为4条,实在过于奇幻。

如果给普通的查询语句添加间隙锁,势必极大的降低MySQL 的并发度,如果不能使用间隙锁,还有哪些办法解决幻读呢?

MySQL 通过引入MVCC解决查询场景的幻读问题。MVCC是多版本并发控制(Multiversion Concurrency Control)的缩写,在MVCC中,每个事务可以看到数据库的一个稳定的快照,而不会被其他并发事务的修改所干扰。当一个事务修改数据库时,它会创建一个新的数据版本,而不是直接在原始数据上进行修改。而其他事务仍然可以读取原始数据的旧版本或者已经提交的新版本,这样就避免了读取到未提交的数据或者被其他事务的写操作所阻塞。

MVCC的实现通常涉及对每个数据行或数据块分配一个唯一的标识符,称为"事务ID"。每个事务也有自己的唯一ID。当一个事务读取数据时,系统会检查该数据的事务ID与事务的ID是否兼容,以确定是否允许读取。如果事务的ID大于数据的事务ID,那么说明数据是过期的,事务将无法读取。这种机制保证了事务在读取数据时的隔离性和一致性。

转机出现了

当我在苦苦思考,为什么MVCC 没有生效时,我随手重新测试发现,如果在 insert语句之前,使用select 查询一下,就不会出现幻读问题。

操作顺序如下

时间序号事务1事务21开启事务 START TRANSACTION;新增的操作select * from userInfo2主键自增插入记录(ID=1)3开启事务 START TRANSACTION;4主键自增插入记录(ID=2)5提交事务Commit6查询当前用户列表,无ID=2的记录7提交事务Commit

我在事务1,开启事务以后,新增了select 语句查询,而后第六步,就不会再有幻读问题……

这真的实在太奇幻了。一波三折……

由此可见 MySQL 插入并没有幻读问题,只是我的打开方式不对。我应该先 select一下 ……,终究还是我错了,但是我想问为什么?我为什么错了?

af3544f5dbfefd407acdeae93dd68583.jpeg

ReadView 是关键!

除MVCC 外,MySQL InnoDB 引擎设计了 ReadView(可读视图) 的概念。

ReadView 判断记录的可见性,ReadView 实际上是当前系统中所有活跃事务的列表,主要包含以下组成部分:

m_ids:在生成 ReadView 时当前系统中活跃的事务 ID 列表;

min_trx_id:在生成 ReadView 时当前系统中活跃的事务中最小的事务 ID,也就是 m_ids 中的最小值;

max_trx_id:在生成 ReadView 时系统中应该分配给下一个事务的 ID 值;

creator_trx_id:生成 ReadView 的事务对应的事务 ID,也就是当前事务 ID。 有了这个 ReadView 之后,在访问某条记录时,只需要按照下边的步骤判断该记录的某个版本是否可见:

  1. 如果被访问版本的 trx_id 属性值与 ReadView 中的 creator_trx_id 值相同,意味着当前事务在访问它自己修改过的记录,所以该版本记录可以被当前事务访问。
  2. 如果被访问版本的 trx_id 属性值小于 ReadView 中的 min_trx_id 值,表明生成该版本的事务在当前事务生成 ReadView 前已经提交,所以该版本记录可以被当前事务访问。
  3. 如果被访问版本的 trx_id 属性值大于或等于 ReadView 中的 max_trx_id 值,表明生成该版本的事务在当前事务生成 ReadView 后才开启,所以该版本记录不可以被当前事务访问。
  4. 如果被访问版本的 trx_id 属性值在 ReadView 的 min_trx_id 和 max_trx_id 之间,那就需要判断一下 trx_id 属性值是不是在 m_ids 列表中,如果在,说明创建 ReadView 时生成该版本的事务还是活跃的,该版本不可以被访问;如果不在,说明创建 ReadView 时生成该版本的事务已经被提交,该版本记录可以被访问。 如果某个版本的记录对当前事务不可见的话,那就顺着版本链找到下一个版本的数据,继续按照上边的步骤判断可见性,依此类推,直到版本链中的最后一个版本。如果最后一个版本也不可见的话,那么就意味着该条记录对该事务完全不可见,查询结果就不包含该记录。

总结一下就是: 如果当前事务id的生成时间发生在 记录的更新之后,那么当前事务就可以看见这个记录,否则看不见!避免幻读问题

那 ReadView 又是何时生成的呢?

在 REPEATABLE READ 隔离级别下,每个事务执行第一个 SELECT 语句时,会将当前系统中的所有的活跃事务拷贝到一个列表生成 ReadView,后续所有的 SELECT 都是复用这个 ReadView。

REPEATABLE READ 隔离级别下,只有第一次 SELECT 才会生成 ReadView,后续 SELECT 都会复用这个 ReadView,也就不存在新提交事务对这个 ReadView 的影响了。

所以 当我在 事务 1 新增select语句,会生成一个ReadView,这个ReadView 生成时间要早于 事务2的时间,所以事务1 的后续所有查询都不会看到事务2的记录,从而避免幻读问题发生。

总结

  1. MySQL innodb 插入记录是并发的。
  2. MySQL innodb 插入记录不存在幻读问题,MySQL 通过 mvcc+ ReadView解决幻读问题。

这篇关于真丢人,工作六七年了,没搞明白MySQL插入是并发还是串行?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/357065

相关文章

MySQL中删除重复数据SQL的三种写法

《MySQL中删除重复数据SQL的三种写法》:本文主要介绍MySQL中删除重复数据SQL的三种写法,文中通过代码示例讲解的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下... 目录方法一:使用 left join + 子查询删除重复数据(推荐)方法二:创建临时表(需分多步执行,逻辑清晰,但会

Mysql 中的多表连接和连接类型详解

《Mysql中的多表连接和连接类型详解》这篇文章详细介绍了MySQL中的多表连接及其各种类型,包括内连接、左连接、右连接、全外连接、自连接和交叉连接,通过这些连接方式,可以将分散在不同表中的相关数据... 目录什么是多表连接?1. 内连接(INNER JOIN)2. 左连接(LEFT JOIN 或 LEFT

mysql重置root密码的完整步骤(适用于5.7和8.0)

《mysql重置root密码的完整步骤(适用于5.7和8.0)》:本文主要介绍mysql重置root密码的完整步骤,文中描述了如何停止MySQL服务、以管理员身份打开命令行、替换配置文件路径、修改... 目录第一步:先停止mysql服务,一定要停止!方式一:通过命令行关闭mysql服务方式二:通过服务项关闭

SQL Server数据库磁盘满了的解决办法

《SQLServer数据库磁盘满了的解决办法》系统再正常运行,我还在操作中,突然发现接口报错,后续所有接口都报错了,一查日志发现说是数据库磁盘满了,所以本文记录了SQLServer数据库磁盘满了的解... 目录问题解决方法删除数据库日志设置数据库日志大小问题今http://www.chinasem.cn天发

mysql主从及遇到的问题解决

《mysql主从及遇到的问题解决》本文详细介绍了如何使用Docker配置MySQL主从复制,首先创建了两个文件夹并分别配置了`my.cnf`文件,通过执行脚本启动容器并配置好主从关系,文中还提到了一些... 目录mysql主从及遇到问题解决遇到的问题说明总结mysql主从及遇到问题解决1.基于mysql

MySQL的索引失效的原因实例及解决方案

《MySQL的索引失效的原因实例及解决方案》这篇文章主要讨论了MySQL索引失效的常见原因及其解决方案,它涵盖了数据类型不匹配、隐式转换、函数或表达式、范围查询、LIKE查询、OR条件、全表扫描、索引... 目录1. 数据类型不匹配2. 隐式转换3. 函数或表达式4. 范围查询之后的列5. like 查询6

Linux下MySQL8.0.26安装教程

《Linux下MySQL8.0.26安装教程》文章详细介绍了如何在Linux系统上安装和配置MySQL,包括下载、解压、安装依赖、启动服务、获取默认密码、设置密码、支持远程登录以及创建表,感兴趣的朋友... 目录1.找到官网下载位置1.访问mysql存档2.下载社区版3.百度网盘中2.linux安装配置1.

PostgreSQL如何用psql运行SQL文件

《PostgreSQL如何用psql运行SQL文件》文章介绍了两种运行预写好的SQL文件的方式:首先连接数据库后执行,或者直接通过psql命令执行,需要注意的是,文件路径在Linux系统中应使用斜杠/... 目录PostgreSQ编程L用psql运行SQL文件方式一方式二总结PostgreSQL用psql运

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M