第二十章 幻读是什么,幻读有什么问题?

2024-01-03 16:48
文章标签 问题 第二十章 幻读

本文主要是介绍第二十章 幻读是什么,幻读有什么问题?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第二十章 幻读是什么,幻读有什么问题?

CREATE TABLE `t` (`id` int(11) NOT NULL,`c` int(11) DEFAULT NULL,`d` int(11) DEFAULT NULL,PRIMARY KEY (`id`),KEY `c` (`c`)
) ENGINE=InnoDB;insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);
  • 下面的语句序列,是怎么加锁的,加的锁又是什么时候释放的呢 ?
begin;
select * from t where d=5 for update;
commit;
  • select ... for update
    • 对于 非索引字段 进行 updateselect .. for update 操作,代价极高。所有记录上锁,以及所有间隔的锁
    • 对于 索引字段 进行上述操作,代价一般。只有 索引字段 本身和 附近的间隔 会被加锁
    • select ... for update 是为了在查询时,对这条数据进行加锁,避免其他用户以该表进行插入、修改或删除等操作,造成表的不一致性

关于 “这个语句会命中 d=5 的这一行,对应的主键 id=5,因此在 select 语句执行完成后,id=5 这一行会加一个写锁,而且由于两阶段锁协议,这个写锁会在执行 commit 语句的时候释放” 这句话的理解

由于字段 d 上没有索引,因此这条查询语句会做全表扫描。那么,其他被扫描到的,但是不满足条件的 5 行记录上,会不会被加锁呢?

  • RR (可重复读) 级别:扫描到的数据都会加 行锁 和 间隙锁
  • RC (读提交) 级别:扫描到的数据都会加行锁,但是不满足条件的数据,没有到 commit 阶段,就会被释放,违反了两阶段加锁原则
  • 全表扫描一直指的是扫描主键索引

什么是幻读 ?

InnoDB 的默认隔离级别是 可重复读

share in mode:当前读,给数据加读锁

for update:当前读,给数据加写锁

什么是幻读 ?

  • 在同一个事务中,两次读取到的数据不一致的情况,称为 幻读不可重复读
  • 幻读是针对 insert 导致的数据不一致
  • 不可重复读是针对 deleteupdate 导致的数据不一致
  • 可重复读 隔离级别下,事务内查询用 “当前读”,读到本事务外新增的数据,称为 幻读
  • 幻读 是用户在使用 可重复读 隔离级别下,在进行 select 查询时加 IX锁、IS锁才可能出现的,是用户主动打破业务层面上的查询时的一致性视图隔离性
  • 其不属于事务隔离的可见性规则问题(可见性规则是来解决各种事务问题的),而是用户在使用上出现的问题,属于业务问题

什么是快照读 ? 什么是当前读 ?

  • 当前读指的是 select for update 或者 select in share mode ,指的是在更新之前必须先查询当前的值,因此叫当前读
  • 快照读指的是在语句执行之前或者在事务开始的时候会创建一个视图,后面的读都是基于这个视图的,不会再去查询最新的值

当前读 具体包括哪些操作 ?

  • for updatelock in share modeupdatedeleteinsert 都是当前读的规则,就是读取最新的已经提交的数据
  • update 先查询再修改,这里的查询就是使用的当前读
  • delete 要先查询再删除,这里的查询也是要当前读
  • insert 的时候,要判断主键是否已经存在、是否违反唯一约束,此时查看主键是否存在的查询也是当前读

幻读 和 脏读 的区别 ?

  • 幻读是读到了提交了的数据,而脏读是读到了没提交的脏数据
  • 读提交 的隔离级别下,没有讨论幻读的实际意义
  • 而在 可重复读 隔离级别下,当前读 打破了视图的隔离限制,实现了读到不应该读的数据的作用

可重复读 的隔离级别下,幻读只会在查询为哪种性质时才会出现 ?

  • 由于 一致性视图 的作用,因此幻读只会在 “当前读” 情况下发生

幻读 跟 事务的可见性规则 冲突吗 ?

  • 可重复读 隔离级别下,幻读是用户选择使用 当前读 而产生的,符合 当前读 的规则,也不跟事务的 可见性规则 相矛盾

幻读有什么问题 ?

select .. lock in share modeselect ... for update 的区别 ?

  • select .. lock in share mode 走的是 IS锁(意向锁)
    • 即在符合条件的 rows 上都加了共享锁,这样的话,其他 session 可以读取这些记录,也可以继续添加 IS 锁,但是无法修改这些记录直到你这个加锁的 session 执行完成 (否则直接锁等待超时)
  • select ... for update 走的是 IX锁 (意向排它锁)
    • 即在符合条件的 rows 上都加了排它锁,其他 session 也就无法在这些记录上添加任何的IS锁IX锁
  • 如果不存在 一致性非锁定读的话,那么其他 session 是无法读取和修改这些记录的
  • 但是 innoDB 存在 非锁定读 (快照读并不需要加锁),for update 之后并不会阻塞其他 session 的快照读取操作
  • 除了 select ...lock in share modeselect ... for update 这种显示加锁的查询操作
  • 通过对比,发现 for update 的加锁方式无非是比 lock in share mode 的方式多阻塞了select...lock in share mode 的查询方式,并不会阻塞快照读

幻读 产生的原因 ?

  • 注意:binlog 日志是在 commit 提交时才进行记录的
  • 即使给所有行加上了锁,也避免不了幻读
  • 这是因为给行加锁的时候,这条记录还不存在,没法加锁
  • 例如下面这种情况:假设扫描到的行都被加上了 行锁

Untitled

  • 由于 session A 把所有的行都加了写锁,所以 session B 在执行第一个 update 语句的时候就被锁住了,需要等到 T6 时刻 session A 提交以后,session B 才能继续执行
  • binlog 里面,执行序列是这样的:
insert into t values(1,1,5); /*(1,1,5)*/
update t set c=5 where id=1; /*(1,5,5)*/update t set d=100 where d=5;/*所有d=5的行,d改成100*/update t set d=5 where id=0; /*(0,0,5)*/
update t set c=5 where id=0; /*(0,5,5)*/
  • 按照日志顺序执行,id=0 这一行的最终结果也是 (0,5,5)。所以,id=0 这一行的问题解决了
  • 但是你可以看到,id=1 这一行,在数据库里面的结果是 (1,5,5),而根据 binlog 的执行结果是 (1,5,100),也就是说 幻读 的问题还是没有得到解决
    • 原因是:在 T3 时刻,我们给所有行加锁的时候,id=1 这一行还不存在,不存在也就加不上锁

如何解决幻读 ?

如何解决 幻读 ?

  • InnoDB 在 行锁 的基础上,引入了 间隙锁 (Gap Lock)
  • 间隙锁,锁的就是两个值之间的空隙
  • 比如文章开头的表 t,初始化插入了 6 个记录,这就产生了 7 个间隙
insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);

Untitled

  • MySQL 会对扫描经过的索引对象,加上间隙锁

行锁 和 行锁 之间会产生冲突,那 间隙锁 和 间隙锁 之间,也会产生冲突吗 ?

  • 行锁分为:读锁、写锁

Untitled

  • 行锁:读锁之间不冲突写锁与读锁冲突写锁与写锁冲突
  • 但是,跟间隙锁存在冲突关系的,是 “往这个间隙中插入一个记录” 这个操作
  • 间隙锁 与 间隙锁 之间,都不存在冲突关系

什么是 next-key lock ?

  • 间隙锁行锁 合称 next-key lock,每个 next-key lock前开后闭区间
  • 如果用 select * from t for update 要把整个表所有记录锁起来,就形成了 7 个 next-key lock,分别是 (-∞,0](0,5](5,10](10,15](15,20](20, 25](25, +supremum]
  • 间隙锁只是锁间隙,没有锁住记录行,而 next-key lock 就是间隙锁基础上锁住右边界行
  • 间隙锁:( ) 开区间
  • next-key lock:( ] 前开后闭区间
  • 如果是表的最后一行数据,则下一个区间是这行数据到表索引的不存在最大值,也就是 +supremum

引入 间隙锁 后,可能会导致什么问题 ?

  • 首先需要了解 间隙锁 的特性:锁的是间隙,是禁止其他操作往间隙中插入数据的。因此间隙锁与间隙锁之间不冲突
  • 所以在 AB 两个事务当中
  • A事务 随机查询某一条数据(+排它锁,也就是 for update )的方式产生间隙锁
  • B事务 也执行同一条SQL,随后 A事务 判定数据不存在时,对其插入,B事务也同样如此操作,则最终导致 A事务 等待 B事务 的间隙锁,B事务 也在等待 A事务 的间隙锁,这将导致死锁
  • 当然,由于 InnoDB 有开启死锁检测,最后 A事务 报错返回
  • 但是,间隙锁 会影响数据的并发度

除了引入 间隙锁, 还有什么方式可以解决幻读 ?

  • RR (可重复读) 改为 RC (读提交),则不存在幻读问题
  • 但此时需要将 binlog 格式改为 row,否则可能出现 数据 和 日志 不一致的问题

为什么 RC (读提交) 下,需要将 binlog 格式改为 row 呢 ?

  • RC 没有幻读问题,也没有间隙锁,但在显示控制事务更新
  • 若在 事务A 还未提交之前,有别的 事务B 后执行并且添加的数据是 事务A 的更新语句逻辑层面会命中的条件
  • 那等 事务A 提交之后,statement 的 binlog 记录上,事务B的记录在前,而事务A的记录在后(这没毛病,谁先提交谁先记录,但恢复的时候会产生问题)
  • 当执行日志恢复时,后提交的 事务A 的记录会把 事务B 的记录也进行更新,这就导致了数据恢复错误
  • 此时,如果改成 row 格式,binlog 会具体记录语句的各项条件,这样在恢复时便不会恢复错误了
  • 注意:除了恢复,还有主从库的同步也会有这个问题
  • 举个例子:
  • 例子一:
  • 删除 statement 记录的是这个删除的语句
delete from t where age>10 and modified_time<='2020-03-04' limit 1;
  • row 格式记录的是实际受影响的数据是真实删除行的主键id
delete from t where id=3 and age=12 and modified_time='2020-03-05';
  • 例子二:
-- statemnt格式
beginupdate t set d=5 where id=0;
commit;-- row格式
beginupdate t where id=0 and c=0 and d=0
set id=0,c=0,d=5
commit;

关于row格式的参考资料

为什么要把MySQL的binlog格式修改为row

大家都用读提交,可是逻辑备份的时候,mysqldump 为什么要把备份线程设置成可重复读呢 ?

  • 官方自带的逻辑备份工具是 mysqldump
  • mysqldump 使用参数 –single-transaction 的时候,导数据之前就会启动一个事务,来确保拿到一致性视图
  • 因为 RR (可重复读) 的一致性读视图可以保证 数据备份时,不阻塞其他数据写入

在备份期间,备份线程用的是可重复读,而业务线程用的是读提交。同时存在两种事务隔离级别,会不会有问题 ?

  • 没有问题,不管是 读提交 还是 可重复读,都是 MVCC 支持
  • 备份是从某个快照时间之后开始的,数据是固定一致准确的

一条加了 排它锁 的查询语句,如果查询是全表扫描,那么扫描过的语句会如何 ?

  • 可重复读 隔离级别下,MySQL 会对扫过的语句加 next-key lock

总结

  • 重复读 更新时采用 当前读,这是为了防止数据丢失
  • 但使用 当前读,可能造成更新层面语义的破坏日志数据 不一致的问题
  • 为解决更新层面幻读 问题,可重复读时,引入了 next-key lock
  • 若是直接采取 读提交,则解决了语义层面的破坏,但需要通过将 binlog 改为 maxrow 的形式,防止日志数据不一致

这篇关于第二十章 幻读是什么,幻读有什么问题?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/566390

相关文章

好题——hdu2522(小数问题:求1/n的第一个循环节)

好喜欢这题,第一次做小数问题,一开始真心没思路,然后参考了网上的一些资料。 知识点***********************************无限不循环小数即无理数,不能写作两整数之比*****************************(一开始没想到,小学没学好) 此题1/n肯定是一个有限循环小数,了解这些后就能做此题了。 按照除法的机制,用一个函数表示出来就可以了,代码如下

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

购买磨轮平衡机时应该注意什么问题和技巧

在购买磨轮平衡机时,您应该注意以下几个关键点: 平衡精度 平衡精度是衡量平衡机性能的核心指标,直接影响到不平衡量的检测与校准的准确性,从而决定磨轮的振动和噪声水平。高精度的平衡机能显著减少振动和噪声,提高磨削加工的精度。 转速范围 宽广的转速范围意味着平衡机能够处理更多种类的磨轮,适应不同的工作条件和规格要求。 振动监测能力 振动监测能力是评估平衡机性能的重要因素。通过传感器实时监

缓存雪崩问题

缓存雪崩是缓存中大量key失效后当高并发到来时导致大量请求到数据库,瞬间耗尽数据库资源,导致数据库无法使用。 解决方案: 1、使用锁进行控制 2、对同一类型信息的key设置不同的过期时间 3、缓存预热 1. 什么是缓存雪崩 缓存雪崩是指在短时间内,大量缓存数据同时失效,导致所有请求直接涌向数据库,瞬间增加数据库的负载压力,可能导致数据库性能下降甚至崩溃。这种情况往往发生在缓存中大量 k

6.1.数据结构-c/c++堆详解下篇(堆排序,TopK问题)

上篇:6.1.数据结构-c/c++模拟实现堆上篇(向下,上调整算法,建堆,增删数据)-CSDN博客 本章重点 1.使用堆来完成堆排序 2.使用堆解决TopK问题 目录 一.堆排序 1.1 思路 1.2 代码 1.3 简单测试 二.TopK问题 2.1 思路(求最小): 2.2 C语言代码(手写堆) 2.3 C++代码(使用优先级队列 priority_queue)

【VUE】跨域问题的概念,以及解决方法。

目录 1.跨域概念 2.解决方法 2.1 配置网络请求代理 2.2 使用@CrossOrigin 注解 2.3 通过配置文件实现跨域 2.4 添加 CorsWebFilter 来解决跨域问题 1.跨域概念 跨域问题是由于浏览器实施了同源策略,该策略要求请求的域名、协议和端口必须与提供资源的服务相同。如果不相同,则需要服务器显式地允许这种跨域请求。一般在springbo

题目1254:N皇后问题

题目1254:N皇后问题 时间限制:1 秒 内存限制:128 兆 特殊判题:否 题目描述: N皇后问题,即在N*N的方格棋盘内放置了N个皇后,使得它们不相互攻击(即任意2个皇后不允许处在同一排,同一列,也不允许处在同一斜线上。因为皇后可以直走,横走和斜走如下图)。 你的任务是,对于给定的N,求出有多少种合法的放置方法。输出N皇后问题所有不同的摆放情况个数。 输入

vscode中文乱码问题,注释,终端,调试乱码一劳永逸版

忘记咋回事突然出现了乱码问题,很多方法都试了,注释乱码解决了,终端又乱码,调试窗口也乱码,最后经过本人不懈努力,终于全部解决了,现在分享给大家我的方法。 乱码的原因是各个地方用的编码格式不统一,所以把他们设成统一的utf8. 1.电脑的编码格式 开始-设置-时间和语言-语言和区域 管理语言设置-更改系统区域设置-勾选Bata版:使用utf8-确定-然后按指示重启 2.vscode

Android Environment 获取的路径问题

1. 以获取 /System 路径为例 /*** Return root of the "system" partition holding the core Android OS.* Always present and mounted read-only.*/public static @NonNull File getRootDirectory() {return DIR_ANDR

form表单提交编码的问题

浏览器在form提交后,会生成一个HTTP的头部信息"content-type",标准规定其形式为Content-type: application/x-www-form-urlencoded; charset=UTF-8        那么我们如果需要修改编码,不使用默认的,那么可以如下这样操作修改编码,来满足需求: hmtl代码:   <meta http-equiv="Conte