Redis面试题系列:讲一讲 rehash 的过程

2024-04-09 20:58

本文主要是介绍Redis面试题系列:讲一讲 rehash 的过程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

字典是什么

字典,又称为符号表(Symbol table),关联数组(associative array)或映射(map),是一种用来保存键值对(key-value-pair)的抽象数据结构。字典中的键不会重复。
接下来会分析Redis中字典的实现方式,哈希算法,解决键冲突的方法及rehash的过程。文中展示的 Redis 源码均来自 3.0.4 版本。

字典的实现

Redis 的字典使用哈希表作为底层实现,一个哈希表里面可以有多个结点,每个结点保存了一个键值对。

typedef struct dictht {// hash表结点数组// 每个 table[i] 其实是一个链表的头节点dictEntry **table;// hash表结点数组的大小,总是为 2^nunsigned long size;// 用于计算索引值的掩码,总是等于 size-1unsigned long sizemask;// 该hash表中的结点数量unsigned long used;
} dictht;

table 是一个数组,数组中每个元素其实都是一个链表的头指针。链表中每个结点都保存着一个键值对。
size 属性记录了table数组的大小,Redis的扩容和收缩机制,保证了 size 总是为 2^n。
sizemask 是用于计算索引值的掩码,总是等于 size-1。
used 记录了哈希表中结点的数量,即所有链表中结点的总数。

哈希算法

当要将一个新的键值添加到字典里面时,程序会先先根据键值对的键计算出哈希值和索引值,然后再根据索引值,将包含新键值对的节点放到哈希表数组(table)的指定索引上面。
Redis 通常使用 MurmurHash2 计算键的哈希值。该算法由 Austin Appleby 于 2008 年发明,这种算法的优点在于,即使输入的键是有规律的,算法仍能给出一个很好的随机分布性,并且算法的计算速度也非常快。
而索引值计算则非常简单:将哈希值和 dictht::sizemask 做与运算的结果即为索引值。
比如,哈希值为 6,sizemask 为 3,则索引值为 6&3 = 2。

解决键冲突

当有两个或以上数量的键被分配到了同一个索引上面时,我们称这些键发生了冲突。比如上图中 k2 和 k0。
Redis 使用链地址法解决冲突。每个节点都有一个 next 指针,多个冲突的结点通过 next 指针构成一个单向链表,这样就解决了键冲突的问题。

Rehash

负载因子:哈希表中单向链表的平均长度。

随着增删操作的进行,Redis 通过 rehash 操作将负载因子维持在一个合理的范围内。Rehash操作分为两种:

  • 扩展:当负载因子较大时,应该扩大 dictht::size 以降低平均长度,加快查询速度。
  • 收缩:当负载因子较小时,应该减小 dictht::size 以减少对内存的浪费。
typedef struct dict {//哈希表dictht ht[2];//rehashidx 记录了rehash 的进度。//当没有进行 rehash 时为 -1。int rehashidx; // 其他数据成员....
};

rehash 过程如下:

  • 为字典的ht[1]哈希表分配空间,ht[1].size 的大小取决于要执行的操作,以及ht[0].used 的值。
    • 如果执行的是扩展操作:那么 ht[1].size 为最小的且不小于 ht[0].used*2 的 2 的 n 次方。比如 ht[0].size 为 5,那么 ht[1].size 为 16。
    • 如果执行的是收缩操作:那么 ht[1].size 为最小的且不小于 ht[0].used 的 2 的 n 次方。比如 ht[0].size 为 5,ht[1].size 为 8。
  • 将 ht[0] 中所有键值对移动到 ht[1] 中:根据 ht[1].sizemask 重新计算哈希值与索引值;根据新的索引值将键值对插入到 ht[1] 中;将键值对从 ht[0] 中删除。
  • 当 ht[0] 中所有键值对移动到 ht[1] 之后开始执行清理工作:释放 ht[0] 占用的内存;将 ht[1] 赋值给 ht[0];为 ht[1] 分配一个空的哈希表,为下一次 rehash 做准备。
    在这里插入图片描述

渐进式 rehash

扩展或收缩哈希表需要将 ht[0] 的所有键值对移动到 ht[1] 当中。这个动作是分多次,渐进式地完成的。原因在于当键值对过多时,一次性移动所有键值对会导致Redis在一段时间内无法对外提供服务
渐进式 rehash 步骤如下:

  • 为 ht[1] 分配空间,此时字典同时存在两个哈希表。
  • 将 dict::rehashidx 置为 0,rehash 工作正式开始。
  • 在 rehash 进行期间,每次对字典执行增删改查操作时,程序在执行指定操作之外,还会将 ht[0] 在 rehashidx 索引上的所有键值对rehash 到 ht[1],然后将 rehashidx 的值加一。
  • 随着字典操作的不断执行,ht[0] 的所有键值对最终会全部移动到 ht[1],此时程序会将 rehashidx 设为 -1,表示 rehash 操作已完成。

特别的,在渐进式 rehash 操作过程中,因为同时存在两个哈希表,所以字典的删除,查找,更新操作会在两个哈希表上进行。程序会先尝试在 ht[0] 中寻找目标键值对,如果没有找到则会在 ht[1] 再次进行寻找,然后进行具体操作。但是新增操作只会在 ht[1] 上进行,这保证了 ht[0] 中的已经被清空的单向链表不会新增元素。

这篇关于Redis面试题系列:讲一讲 rehash 的过程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/889200

相关文章

SpringBoot 整合 Grizzly的过程

《SpringBoot整合Grizzly的过程》Grizzly是一个高性能的、异步的、非阻塞的HTTP服务器框架,它可以与SpringBoot一起提供比传统的Tomcat或Jet... 目录为什么选择 Grizzly?Spring Boot + Grizzly 整合的优势添加依赖自定义 Grizzly 作为

Redis主从/哨兵机制原理分析

《Redis主从/哨兵机制原理分析》本文介绍了Redis的主从复制和哨兵机制,主从复制实现了数据的热备份和负载均衡,而哨兵机制可以监控Redis集群,实现自动故障转移,哨兵机制通过监控、下线、选举和故... 目录一、主从复制1.1 什么是主从复制1.2 主从复制的作用1.3 主从复制原理1.3.1 全量复制

Redis延迟队列的实现示例

《Redis延迟队列的实现示例》Redis延迟队列是一种使用Redis实现的消息队列,本文主要介绍了Redis延迟队列的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习... 目录一、什么是 Redis 延迟队列二、实现原理三、Java 代码示例四、注意事项五、使用 Redi

Redis缓存问题与缓存更新机制详解

《Redis缓存问题与缓存更新机制详解》本文主要介绍了缓存问题及其解决方案,包括缓存穿透、缓存击穿、缓存雪崩等问题的成因以及相应的预防和解决方法,同时,还详细探讨了缓存更新机制,包括不同情况下的缓存更... 目录一、缓存问题1.1 缓存穿透1.1.1 问题来源1.1.2 解决方案1.2 缓存击穿1.2.1

redis-cli命令行工具的使用小结

《redis-cli命令行工具的使用小结》redis-cli是Redis的命令行客户端,支持多种参数用于连接、操作和管理Redis数据库,本文给大家介绍redis-cli命令行工具的使用小结,感兴趣的... 目录基本连接参数基本连接方式连接远程服务器带密码连接操作与格式参数-r参数重复执行命令-i参数指定命

深入理解Redis大key的危害及解决方案

《深入理解Redis大key的危害及解决方案》本文主要介绍了深入理解Redis大key的危害及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录一、背景二、什么是大key三、大key评价标准四、大key 产生的原因与场景五、大key影响与危

mysql-8.0.30压缩包版安装和配置MySQL环境过程

《mysql-8.0.30压缩包版安装和配置MySQL环境过程》该文章介绍了如何在Windows系统中下载、安装和配置MySQL数据库,包括下载地址、解压文件、创建和配置my.ini文件、设置环境变量... 目录压缩包安装配置下载配置环境变量下载和初始化总结压缩包安装配置下载下载地址:https://d

Redis主从复制的原理分析

《Redis主从复制的原理分析》Redis主从复制通过将数据镜像到多个从节点,实现高可用性和扩展性,主从复制包括初次全量同步和增量同步两个阶段,为优化复制性能,可以采用AOF持久化、调整复制超时时间、... 目录Redis主从复制的原理主从复制概述配置主从复制数据同步过程复制一致性与延迟故障转移机制监控与维

Redis过期键删除策略解读

《Redis过期键删除策略解读》Redis通过惰性删除策略和定期删除策略来管理过期键,惰性删除策略在键被访问时检查是否过期并删除,节省CPU开销但可能导致过期键滞留,定期删除策略定期扫描并删除过期键,... 目录1.Redis使用两种不同的策略来删除过期键,分别是惰性删除策略和定期删除策略1.1惰性删除策略

Linux(Centos7)安装Mysql/Redis/MinIO方式

《Linux(Centos7)安装Mysql/Redis/MinIO方式》文章总结:介绍了如何安装MySQL和Redis,以及如何配置它们为开机自启,还详细讲解了如何安装MinIO,包括配置Syste... 目录安装mysql安装Redis安装MinIO总结安装Mysql安装Redis搜索Red