Redis 源码分析(二) 一个 rehash 也不阻塞的哈希表

2024-08-22 09:38

本文主要是介绍Redis 源码分析(二) 一个 rehash 也不阻塞的哈希表,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Redis 的架构设计挺巧妙的,舍弃了主流的多线程架构,别出心裁的使用单线程架构,说实话,作为一个 kv,我一开始认为多线程并行的访问应该是一个默认选项,但是 Redis 的高效,用事实证明,这显然不是。这个单线程的事件系统另开一坑再聊吧,今天主要是看一下这个有趣的哈希表。

typedef struct dict {dictType *type;void *privdata;dictht ht[2];int rehashidx; /* rehashing not in progress if rehashidx == -1 */int iterators; /* number of iterators currently running */
} dict;

这就是 Redis 里面存哈希表的数据结构,真正的哈希表是哪个 dictht,dictht[0] 是一个哈希表,dictht[1] 是另一个哈希表。这里两个哈希表的设计主要是为了完成一个操作—— rehash,并且是不阻塞的 rehash。
哈希表中最耗时的操作就是 rehash 了,作为一个单线程生物,Redis 不会另外开一个线程去搞这个事情,增删改查还有 rehash 都在一个线程里跑,那么如何能让 rehash 的过程不影响其他的操作呢?
我们来随便找一个哈希表的操作函数,就拿哈希表的查找函数来讲吧

dictEntry *dictFind(dict *d, const void *key)
{dictEntry *he;unsigned int h, idx, table;if (d->ht[0].size == 0) return NULL; /* We don't have a table at all */if (dictIsRehashing(d)) _dictRehashStep(d);// 注意h = dictHashKey(d, key);for (table = 0; table <= 1; table++) {idx = h & d->ht[table].sizemask;he = d->ht[table].table[idx];while(he) {if (dictCompareHashKeys(d, key, he->key))return he;he = he->next;}if (!dictIsRehashing(d)) return NULL;}return NULL;
}

如果你看了我上一篇文章的话,这个函数应该已经见过了,同样不需要看整个函数,只需要看我标注的地方就好了,就一行,意思呢,很明白,这个哈希表是不是在 rehash 呀?如果是的话执行 _dictRehashStep 这个函数(开头加了个 _ 这个符号,假装私有函数。。)这个函数是什么意思呢?

static void _dictRehashStep(dict *d) {if (d->iterators == 0) dictRehash(d,1);
}

里面那个 dictRehash 是执行 rehash 的地方,直接进来

int dictRehash(dict *d, int n) {if (!dictIsRehashing(d)) return 0;while(n--) {dictEntry *de, *nextde;/* Check if we already rehashed the whole table... */if (d->ht[0].used == 0) {_dictFree(d->ht[0].table);d->ht[0] = d->ht[1];_dictReset(&d->ht[1]);d->rehashidx = -1;return 0;}/* Note that rehashidx can't overflow as we are sure there are more* elements because ht[0].used != 0 */while(d->ht[0].table[d->rehashidx] == NULL) d->rehashidx++;de = d->ht[0].table[d->rehashidx];/* Move all the keys in this bucket from the old to the new hash HT 简单说就是找到我们该搬的桶,搬空它,然后结束战斗,就只搬一个桶*/while(de) {unsigned int h;nextde = de->next;/* Get the index in the new hash table */h = dictHashKey(d, de->key) & d->ht[1].sizemask;de->next = d->ht[1].table[h];d->ht[1].table[h] = de;d->ht[0].used--;d->ht[1].used++;de = nextde;}d->ht[0].table[d->rehashidx] = NULL;d->rehashidx++;}return 1;
}

上文代码中的中文应该很引人注目(因为代码还是不如人话好懂啊~),这里这个函数就是找到这个哈希表中需要被搬运的第一个桶,然后把这个桶里面的所有项一个个重新哈希一下,搬到第二个哈希表中,就是从 dictht 中的 ht[0] 搬运到 ht[1],然后结束之后,指针交换一下就可以了呀。
既然了解了这个搬运工函数的作用,我们来看一下哪些部分调用了这个函数呢?
dictAdd
dictFind
dictGenericDelete
增删改查(改是先删再add)里面都用到了呀,也就是在线上不停的增删改查中不知不觉就 rehash 完了,一个 O(n) 的操作就这样变成了均摊 O(1) 的,当然不会阻塞啦。
Redis 是一个在线服务,其数据结构也是根据这个特性来设计的,把一个大的操作均摊到每个细小的操作中来降低算法复杂度,这种思想并不罕见,比如带懒惰标记的线段树,伸展树,STL 中的 vector 也是均摊的来算复杂度,这种方法虽然有点耍赖皮,但是相当实用啊。
下一讲来讲 Redis 的事件系统吧,这个系统一方面使得 Redis 效率极高,另一方面也降低了很多的编码复杂度,也是一个精妙的设计。

这篇关于Redis 源码分析(二) 一个 rehash 也不阻塞的哈希表的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095904

相关文章

哈希leetcode-1

目录 1前言 2.例题  2.1两数之和 2.2判断是否互为字符重排 2.3存在重复元素1 2.4存在重复元素2 2.5字母异位词分组 1前言 哈希表主要是适合于快速查找某个元素(O(1)) 当我们要频繁的查找某个元素,第一哈希表O(1),第二,二分O(log n) 一般可以分为语言自带的容器哈希和用数组模拟的简易哈希。 最简单的比如数组模拟字符存储,只要开26个c

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟&nbsp;开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚&nbsp;第一站:海量资源,应有尽有 走进“智听

usaco 1.3 Prime Cryptarithm(简单哈希表暴搜剪枝)

思路: 1. 用一个 hash[ ] 数组存放输入的数字,令 hash[ tmp ]=1 。 2. 一个自定义函数 check( ) ,检查各位是否为输入的数字。 3. 暴搜。第一行数从 100到999,第二行数从 10到99。 4. 剪枝。 代码: /*ID: who jayLANG: C++TASK: crypt1*/#include<stdio.h>bool h

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

Java ArrayList扩容机制 (源码解读)

结论:初始长度为10,若所需长度小于1.5倍原长度,则按照1.5倍扩容。若不够用则按照所需长度扩容。 一. 明确类内部重要变量含义         1:数组默认长度         2:这是一个共享的空数组实例,用于明确创建长度为0时的ArrayList ,比如通过 new ArrayList<>(0),ArrayList 内部的数组 elementData 会指向这个 EMPTY_EL

如何在Visual Studio中调试.NET源码

今天偶然在看别人代码时,发现在他的代码里使用了Any判断List<T>是否为空。 我一般的做法是先判断是否为null,再判断Count。 看了一下Count的源码如下: 1 [__DynamicallyInvokable]2 public int Count3 {4 [__DynamicallyInvokable]5 get

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

工厂ERP管理系统实现源码(JAVA)

工厂进销存管理系统是一个集采购管理、仓库管理、生产管理和销售管理于一体的综合解决方案。该系统旨在帮助企业优化流程、提高效率、降低成本,并实时掌握各环节的运营状况。 在采购管理方面,系统能够处理采购订单、供应商管理和采购入库等流程,确保采购过程的透明和高效。仓库管理方面,实现库存的精准管理,包括入库、出库、盘点等操作,确保库存数据的准确性和实时性。 生产管理模块则涵盖了生产计划制定、物料需求计划、