第二十章 幻读是什么,幻读有什么问题?

2024-01-03 16:48
文章标签 问题 第二十章 幻读

本文主要是介绍第二十章 幻读是什么,幻读有什么问题?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第二十章 幻读是什么,幻读有什么问题?

CREATE TABLE `t` (`id` int(11) NOT NULL,`c` int(11) DEFAULT NULL,`d` int(11) DEFAULT NULL,PRIMARY KEY (`id`),KEY `c` (`c`)
) ENGINE=InnoDB;insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);
  • 下面的语句序列,是怎么加锁的,加的锁又是什么时候释放的呢 ?
begin;
select * from t where d=5 for update;
commit;
  • select ... for update
    • 对于 非索引字段 进行 updateselect .. for update 操作,代价极高。所有记录上锁,以及所有间隔的锁
    • 对于 索引字段 进行上述操作,代价一般。只有 索引字段 本身和 附近的间隔 会被加锁
    • select ... for update 是为了在查询时,对这条数据进行加锁,避免其他用户以该表进行插入、修改或删除等操作,造成表的不一致性

关于 “这个语句会命中 d=5 的这一行,对应的主键 id=5,因此在 select 语句执行完成后,id=5 这一行会加一个写锁,而且由于两阶段锁协议,这个写锁会在执行 commit 语句的时候释放” 这句话的理解

由于字段 d 上没有索引,因此这条查询语句会做全表扫描。那么,其他被扫描到的,但是不满足条件的 5 行记录上,会不会被加锁呢?

  • RR (可重复读) 级别:扫描到的数据都会加 行锁 和 间隙锁
  • RC (读提交) 级别:扫描到的数据都会加行锁,但是不满足条件的数据,没有到 commit 阶段,就会被释放,违反了两阶段加锁原则
  • 全表扫描一直指的是扫描主键索引

什么是幻读 ?

InnoDB 的默认隔离级别是 可重复读

share in mode:当前读,给数据加读锁

for update:当前读,给数据加写锁

什么是幻读 ?

  • 在同一个事务中,两次读取到的数据不一致的情况,称为 幻读不可重复读
  • 幻读是针对 insert 导致的数据不一致
  • 不可重复读是针对 deleteupdate 导致的数据不一致
  • 可重复读 隔离级别下,事务内查询用 “当前读”,读到本事务外新增的数据,称为 幻读
  • 幻读 是用户在使用 可重复读 隔离级别下,在进行 select 查询时加 IX锁、IS锁才可能出现的,是用户主动打破业务层面上的查询时的一致性视图隔离性
  • 其不属于事务隔离的可见性规则问题(可见性规则是来解决各种事务问题的),而是用户在使用上出现的问题,属于业务问题

什么是快照读 ? 什么是当前读 ?

  • 当前读指的是 select for update 或者 select in share mode ,指的是在更新之前必须先查询当前的值,因此叫当前读
  • 快照读指的是在语句执行之前或者在事务开始的时候会创建一个视图,后面的读都是基于这个视图的,不会再去查询最新的值

当前读 具体包括哪些操作 ?

  • for updatelock in share modeupdatedeleteinsert 都是当前读的规则,就是读取最新的已经提交的数据
  • update 先查询再修改,这里的查询就是使用的当前读
  • delete 要先查询再删除,这里的查询也是要当前读
  • insert 的时候,要判断主键是否已经存在、是否违反唯一约束,此时查看主键是否存在的查询也是当前读

幻读 和 脏读 的区别 ?

  • 幻读是读到了提交了的数据,而脏读是读到了没提交的脏数据
  • 读提交 的隔离级别下,没有讨论幻读的实际意义
  • 而在 可重复读 隔离级别下,当前读 打破了视图的隔离限制,实现了读到不应该读的数据的作用

可重复读 的隔离级别下,幻读只会在查询为哪种性质时才会出现 ?

  • 由于 一致性视图 的作用,因此幻读只会在 “当前读” 情况下发生

幻读 跟 事务的可见性规则 冲突吗 ?

  • 可重复读 隔离级别下,幻读是用户选择使用 当前读 而产生的,符合 当前读 的规则,也不跟事务的 可见性规则 相矛盾

幻读有什么问题 ?

select .. lock in share modeselect ... for update 的区别 ?

  • select .. lock in share mode 走的是 IS锁(意向锁)
    • 即在符合条件的 rows 上都加了共享锁,这样的话,其他 session 可以读取这些记录,也可以继续添加 IS 锁,但是无法修改这些记录直到你这个加锁的 session 执行完成 (否则直接锁等待超时)
  • select ... for update 走的是 IX锁 (意向排它锁)
    • 即在符合条件的 rows 上都加了排它锁,其他 session 也就无法在这些记录上添加任何的IS锁IX锁
  • 如果不存在 一致性非锁定读的话,那么其他 session 是无法读取和修改这些记录的
  • 但是 innoDB 存在 非锁定读 (快照读并不需要加锁),for update 之后并不会阻塞其他 session 的快照读取操作
  • 除了 select ...lock in share modeselect ... for update 这种显示加锁的查询操作
  • 通过对比,发现 for update 的加锁方式无非是比 lock in share mode 的方式多阻塞了select...lock in share mode 的查询方式,并不会阻塞快照读

幻读 产生的原因 ?

  • 注意:binlog 日志是在 commit 提交时才进行记录的
  • 即使给所有行加上了锁,也避免不了幻读
  • 这是因为给行加锁的时候,这条记录还不存在,没法加锁
  • 例如下面这种情况:假设扫描到的行都被加上了 行锁

Untitled

  • 由于 session A 把所有的行都加了写锁,所以 session B 在执行第一个 update 语句的时候就被锁住了,需要等到 T6 时刻 session A 提交以后,session B 才能继续执行
  • binlog 里面,执行序列是这样的:
insert into t values(1,1,5); /*(1,1,5)*/
update t set c=5 where id=1; /*(1,5,5)*/update t set d=100 where d=5;/*所有d=5的行,d改成100*/update t set d=5 where id=0; /*(0,0,5)*/
update t set c=5 where id=0; /*(0,5,5)*/
  • 按照日志顺序执行,id=0 这一行的最终结果也是 (0,5,5)。所以,id=0 这一行的问题解决了
  • 但是你可以看到,id=1 这一行,在数据库里面的结果是 (1,5,5),而根据 binlog 的执行结果是 (1,5,100),也就是说 幻读 的问题还是没有得到解决
    • 原因是:在 T3 时刻,我们给所有行加锁的时候,id=1 这一行还不存在,不存在也就加不上锁

如何解决幻读 ?

如何解决 幻读 ?

  • InnoDB 在 行锁 的基础上,引入了 间隙锁 (Gap Lock)
  • 间隙锁,锁的就是两个值之间的空隙
  • 比如文章开头的表 t,初始化插入了 6 个记录,这就产生了 7 个间隙
insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);

Untitled

  • MySQL 会对扫描经过的索引对象,加上间隙锁

行锁 和 行锁 之间会产生冲突,那 间隙锁 和 间隙锁 之间,也会产生冲突吗 ?

  • 行锁分为:读锁、写锁

Untitled

  • 行锁:读锁之间不冲突写锁与读锁冲突写锁与写锁冲突
  • 但是,跟间隙锁存在冲突关系的,是 “往这个间隙中插入一个记录” 这个操作
  • 间隙锁 与 间隙锁 之间,都不存在冲突关系

什么是 next-key lock ?

  • 间隙锁行锁 合称 next-key lock,每个 next-key lock前开后闭区间
  • 如果用 select * from t for update 要把整个表所有记录锁起来,就形成了 7 个 next-key lock,分别是 (-∞,0](0,5](5,10](10,15](15,20](20, 25](25, +supremum]
  • 间隙锁只是锁间隙,没有锁住记录行,而 next-key lock 就是间隙锁基础上锁住右边界行
  • 间隙锁:( ) 开区间
  • next-key lock:( ] 前开后闭区间
  • 如果是表的最后一行数据,则下一个区间是这行数据到表索引的不存在最大值,也就是 +supremum

引入 间隙锁 后,可能会导致什么问题 ?

  • 首先需要了解 间隙锁 的特性:锁的是间隙,是禁止其他操作往间隙中插入数据的。因此间隙锁与间隙锁之间不冲突
  • 所以在 AB 两个事务当中
  • A事务 随机查询某一条数据(+排它锁,也就是 for update )的方式产生间隙锁
  • B事务 也执行同一条SQL,随后 A事务 判定数据不存在时,对其插入,B事务也同样如此操作,则最终导致 A事务 等待 B事务 的间隙锁,B事务 也在等待 A事务 的间隙锁,这将导致死锁
  • 当然,由于 InnoDB 有开启死锁检测,最后 A事务 报错返回
  • 但是,间隙锁 会影响数据的并发度

除了引入 间隙锁, 还有什么方式可以解决幻读 ?

  • RR (可重复读) 改为 RC (读提交),则不存在幻读问题
  • 但此时需要将 binlog 格式改为 row,否则可能出现 数据 和 日志 不一致的问题

为什么 RC (读提交) 下,需要将 binlog 格式改为 row 呢 ?

  • RC 没有幻读问题,也没有间隙锁,但在显示控制事务更新
  • 若在 事务A 还未提交之前,有别的 事务B 后执行并且添加的数据是 事务A 的更新语句逻辑层面会命中的条件
  • 那等 事务A 提交之后,statement 的 binlog 记录上,事务B的记录在前,而事务A的记录在后(这没毛病,谁先提交谁先记录,但恢复的时候会产生问题)
  • 当执行日志恢复时,后提交的 事务A 的记录会把 事务B 的记录也进行更新,这就导致了数据恢复错误
  • 此时,如果改成 row 格式,binlog 会具体记录语句的各项条件,这样在恢复时便不会恢复错误了
  • 注意:除了恢复,还有主从库的同步也会有这个问题
  • 举个例子:
  • 例子一:
  • 删除 statement 记录的是这个删除的语句
delete from t where age>10 and modified_time<='2020-03-04' limit 1;
  • row 格式记录的是实际受影响的数据是真实删除行的主键id
delete from t where id=3 and age=12 and modified_time='2020-03-05';
  • 例子二:
-- statemnt格式
beginupdate t set d=5 where id=0;
commit;-- row格式
beginupdate t where id=0 and c=0 and d=0
set id=0,c=0,d=5
commit;

关于row格式的参考资料

为什么要把MySQL的binlog格式修改为row

大家都用读提交,可是逻辑备份的时候,mysqldump 为什么要把备份线程设置成可重复读呢 ?

  • 官方自带的逻辑备份工具是 mysqldump
  • mysqldump 使用参数 –single-transaction 的时候,导数据之前就会启动一个事务,来确保拿到一致性视图
  • 因为 RR (可重复读) 的一致性读视图可以保证 数据备份时,不阻塞其他数据写入

在备份期间,备份线程用的是可重复读,而业务线程用的是读提交。同时存在两种事务隔离级别,会不会有问题 ?

  • 没有问题,不管是 读提交 还是 可重复读,都是 MVCC 支持
  • 备份是从某个快照时间之后开始的,数据是固定一致准确的

一条加了 排它锁 的查询语句,如果查询是全表扫描,那么扫描过的语句会如何 ?

  • 可重复读 隔离级别下,MySQL 会对扫过的语句加 next-key lock

总结

  • 重复读 更新时采用 当前读,这是为了防止数据丢失
  • 但使用 当前读,可能造成更新层面语义的破坏日志数据 不一致的问题
  • 为解决更新层面幻读 问题,可重复读时,引入了 next-key lock
  • 若是直接采取 读提交,则解决了语义层面的破坏,但需要通过将 binlog 改为 maxrow 的形式,防止日志数据不一致

这篇关于第二十章 幻读是什么,幻读有什么问题?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/566390

相关文章

SpringBoot自定义注解如何解决公共字段填充问题

《SpringBoot自定义注解如何解决公共字段填充问题》本文介绍了在系统开发中,如何使用AOP切面编程实现公共字段自动填充的功能,从而简化代码,通过自定义注解和切面类,可以统一处理创建时间和修改时间... 目录1.1 问题分析1.2 实现思路1.3 代码开发1.3.1 步骤一1.3.2 步骤二1.3.3

基于.NET编写工具类解决JSON乱码问题

《基于.NET编写工具类解决JSON乱码问题》在开发过程中,我们经常会遇到JSON数据处理的问题,尤其是在数据传输和解析过程中,很容易出现编码错误导致的乱码问题,下面我们就来编写一个.NET工具类来解... 目录问题背景核心原理工具类实现使用示例总结在开发过程中,我们经常会遇到jsON数据处理的问题,尤其是

springboot3.4和mybatis plus的版本问题的解决

《springboot3.4和mybatisplus的版本问题的解决》本文主要介绍了springboot3.4和mybatisplus的版本问题的解决,主要由于SpringBoot3.4与MyBat... 报错1:spring-boot-starter/3.4.0/spring-boot-starter-

在 Spring Boot 中使用异步线程时的 HttpServletRequest 复用问题记录

《在SpringBoot中使用异步线程时的HttpServletRequest复用问题记录》文章讨论了在SpringBoot中使用异步线程时,由于HttpServletRequest复用导致... 目录一、问题描述:异步线程操作导致请求复用时 Cookie 解析失败1. 场景背景2. 问题根源二、问题详细分

解读为什么@Autowired在属性上被警告,在setter方法上不被警告问题

《解读为什么@Autowired在属性上被警告,在setter方法上不被警告问题》在Spring开发中,@Autowired注解常用于实现依赖注入,它可以应用于类的属性、构造器或setter方法上,然... 目录1. 为什么 @Autowired 在属性上被警告?1.1 隐式依赖注入1.2 IDE 的警告:

解决java.lang.NullPointerException问题(空指针异常)

《解决java.lang.NullPointerException问题(空指针异常)》本文详细介绍了Java中的NullPointerException异常及其常见原因,包括对象引用为null、数组元... 目录Java.lang.NullPointerException(空指针异常)NullPointer

Android开发中gradle下载缓慢的问题级解决方法

《Android开发中gradle下载缓慢的问题级解决方法》本文介绍了解决Android开发中Gradle下载缓慢问题的几种方法,本文给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、网络环境优化二、Gradle版本与配置优化三、其他优化措施针对android开发中Gradle下载缓慢的问

关于Nginx跨域问题及解决方案(CORS)

《关于Nginx跨域问题及解决方案(CORS)》文章主要介绍了跨域资源共享(CORS)机制及其在现代Web开发中的重要性,通过Nginx,可以简单地解决跨域问题,适合新手学习和应用,文章详细讲解了CO... 目录一、概述二、什么是 CORS?三、常见的跨域场景四、Nginx 如何解决 CORS 问题?五、基

MySQL安装时initializing database失败的问题解决

《MySQL安装时initializingdatabase失败的问题解决》本文主要介绍了MySQL安装时initializingdatabase失败的问题解决,文中通过图文介绍的非常详细,对大家的学... 目录问题页面:解决方法:问题页面:解决方法:1.勾选红框中的选项:2.将下图红框中全部改为英

Nginx启动失败:端口80被占用问题的解决方案

《Nginx启动失败:端口80被占用问题的解决方案》在Linux服务器上部署Nginx时,可能会遇到Nginx启动失败的情况,尤其是错误提示bind()to0.0.0.0:80failed,这种问题通... 目录引言问题描述问题分析解决方案1. 检查占用端口 80 的进程使用 netstat 命令使用 ss