数据结构:跳表讲解

2024-02-21 07:12
文章标签 讲解 数据结构 跳表

本文主要是介绍数据结构:跳表讲解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

跳表

    • 1.什么是跳表-skiplist
      • 1.1简介
      • 1.2设计思路
    • 2.跳表的效率分析
    • 3.跳表实现
      • 3.1类成员设计
      • 3.2查找
      • 3.3插入
      • 3.4删除
      • 3.5完整代码
    • 4.skiplist跟平衡搜索树和哈希表的对比

1.什么是跳表-skiplist

1.1简介

skiplist本质上也是一种查找结构,用于解决算法中的查找问题,跟平衡搜索树和哈希表的价值是一样的,可以作为key或者key/value的查找模型。后面我会进行比对。

skiplist是由William Pugh发明的,最早出现于他在1990年发表的论文《Skip Lists: A
Probabilistic Alternative to Balanced Trees》。

skiplist,顾名思义,首先它是一个list。实际上,它是在有序链表的基础上发展起来的。如果是一个有序的链表,查找数据的时间复杂度是O(N)。


1.2设计思路


(1)假如我们每相邻两个节点升高一层,增加一个指针,让指针指向下下个节点,如下图所示。这样所有新增加的指针连成了一个新的链表,但它包含的节点个数只有原来的一半。由于新增加的指针,我们不再需要与链表中每个节点逐个进行比较了,需要比较的节点数大概只有原来的一半(后面讲为什么)

在这里插入图片描述
这样设计利于查找,查找规则为:

  1. cur表示当前节点,nextV为节点指针数组,j表示下标,key为要查找的值。 其中cur一开始为哨兵节点,j为顶部下标
  2. 从cur位置向右看,如果key大于右边,就直接向右走,即更新cur为右节点
    (即cur = cur->nextV[j])。
  3. 如果key小于右边或者右边为空,直接向下走,即让j减一
  4. 右边等于key找到。
  5. 不存在的情况,j最后会走到-1(看后面图解)。

查找存在的情况:
在这里插入图片描述

查找不存在的情况:
在这里插入图片描述


(2)以此类推,我们可以在第二层新产生的链表上,继续为每相邻的两个节点升高一层,增加一个指针,从而产生第三层链表。如下图,这样搜索效率就进一步提高了。

在这里插入图片描述


(3)skiplist正是受这种多层链表的想法的启发而设计出来的。实际上,按照上面生成链表的方式,上面每一层链表的节点个数,是下面一层的节点个数的一半,这样查找过程就非常类似二分查找,使得查找的时间复杂度可以降低到O(log n)。但是这个结构在插入删除数据的时候有很大的问题,插入或者删除一个节点之后,就会打乱上下相邻两层链表上节点个数严格的2:1的对应关系。如果要维持这种对应关系,就必须把新插入的节点后面的所有节点(也包括新插入的节点)重新进行调整,这会让时间复杂度重新退化成O(n)


(4)skiplist的设计为了避免这种问题,做了一个大胆的处理,不再严格要求对应比例关系,而是插入一个节点的时候随机出一个层数。这样每次插入和删除都不需要考虑其他节点的层数,这样就好处理多了。细节过程入下图(插入和删除过程后面详细讲,现在只需知道随机层数一样可行):

在这里插入图片描述



2.跳表的效率分析

上面我们说到,skiplist插入一个节点时随机出一个层数,听起来怎么这么随意,如何保证搜索时的效率呢?

这里首先要细节分析的是这个随机层数是怎么来的。一般跳表会设计一个最大层数maxLevel的限制,其次会设置一个多增加一层的概率p。那么计算这个随机层数的代码如下:

int RandomLevel()
{int level = 1;//RAND_MAX为rand函数可生成的最大值//即rand()落到[0, RAND_MAX * _p]的概率为_pwhile(rand() < RAND_MAX * _p){level++;}return level;}

根据前面RandomLevel(),我们很容易看出,产生越高的节点层数,概率越低。定量的分析如下:

  • 节点层数至少为1。而大于1的节点层数,满足一个概率分布。
  • 节点层数恰好等于1的概率为1-p(即第一次就失败)。
  • 节点层数大于等于2的概率为p,而节点层数恰好等于2的概率为p(1-p)(第一次成功,第二次失败)。
  • 节点层数大于等于3的概率为p^2, 而节点层数恰好等于3的概率为p^2*(1-p)。
  • 节点层数大于等于4的概率为p^3, 而节点层数恰好等于4的概率为p^3*(1-p)。
  • ……

因此,一个节点的平均层数(也即包含的平均指针数目),计算如下:
在这里插入图片描述

现在很容易计算出:

  • 当p=1/2时,每个节点所包含的平均指针数目为2;
  • 当p=1/4时,每个节点所包含的平均指针数目为1.33。
  • p越大,平均层数越多,时间效率就越快,但太大可能导致空间浪费,故一般都会限制最大层数。

跳表的平均时间复杂度为O(logN),我会用图解来帮助大家理解大概,但完整推导的过程较为复杂,需要有一定的数学功底,有兴趣的同学,可以参考以下文章中的讲解:

铁蕾大佬的博客:Redis内部数据结构详解(6)——skiplist

在这里插入图片描述



3.跳表实现

本文跳表实现以本题为准:设计跳表

3.1类成员设计

//跳表节点
struct SkiplistNode
{SkiplistNode(int val, int level){_val = val;_nextV.resize(level, nullptr); }int _val;  //节点值vector<SkiplistNode*> _nextV;  //指针数组
};//跳表
class Skiplist {
public:typedef SkiplistNode Node;Skiplist() {srand(time(0));  //设置随机数种子_head = new Node(-1, 1);}double _p = 0.25;  //增加层数的概率int _maxLevel = 32;  //限制最大层数Node* _head;  //哨兵头节点,存储的是无效数据//头节点从一层开始,后面生成了更高层数节点在扩容,减少不必要的查询工作
};

3.2查找

参照设计思路里面讲的即可

bool search(int target) 
{int level = _head->_nextV.size() - 1;  //下标从顶部开始Node* cur = _head;  //从哨兵位开始while(level >= 0){//大于,跳到下个节点//小于或者空,向下走if(cur->_nextV[level] && cur->_nextV[level]->_val < target)  {cur = cur->_nextV[level];}else if(!cur->_nextV[level] || cur->_nextV[level]->_val > target)  {level--;}else  //找到了{return true;}}return false;
}

3.3插入

思路很简单,假设当前插入节点有x层,只需要找到这x层每一层对应的前置节点,然后做简单的链接工作即可。
在这里插入图片描述

//找前置节点
vector<SkiplistNode*> GetPrev(int num)
{//核心是找到每一层的前置节点//本题允许冗余int level = _head->_nextV.size() - 1;vector<SkiplistNode*> prevV(level + 1, nullptr);Node* cur = _head;while(level >= 0){//大于,跳到下个节点//小于或者空,向下走if(cur->_nextV[level] && cur->_nextV[level]->_val < num)  {cur = cur->_nextV[level];}else  {prevV[level] = cur;level--;}}return prevV;
}//插入节点
void add(int num) {vector<SkiplistNode*> prevV = GetPrev(num);//生成节点int n = RandomLevel();Node* newnode = new Node(num, n);if(n > _head->_nextV.size())   //节点层数超过当前最大{_head->_nextV.resize(n, nullptr);prevV.resize(n, _head);}//链接节点for(int i = 0; i < n; i++){newnode->_nextV[i] = prevV[i]->_nextV[i];prevV[i]->_nextV[i] = newnode;}
}

3.4删除

删除大体分两种情况:

  1. 存在该节点,思路与插入类似,假设当前删除节点有x层,只需要找到这x层每一层对应的前置节点,然后做简单的链接工作即可。
  2. 不存在该节点,那找前置节点的时候第0层的右边要么是空,要么就不是目标值

在这里插入图片描述

删除还有个可优化的点,不做也不影响正确性:
在这里插入图片描述

bool erase(int num) {vector<SkiplistNode*> prevV = GetPrev(num);//随机生成至少有一层节点if(prevV[0]->_nextV[0] == nullptr || prevV[0]->_nextV[0]->_val != num)  //不存在{return false;}else {//记录待删除的节点SkiplistNode* del = prevV[0]->_nextV[0];for(int i = 0; i < del->_nextV.size(); i++){prevV[i]->_nextV[i] = del->_nextV[i];}delete del;//这里不影响正确性,对头节点的多余空间做处理int j = _head->_nextV.size() - 1;while(j >= 0){if(_head->_nextV[j] == nullptr){j--;}else{break;}}_head->_nextV.resize(j + 1);return true;}
}

3.5完整代码

struct SkiplistNode
{SkiplistNode(int val, int level){_val = val;_nextV.resize(level, nullptr); }int _val;vector<SkiplistNode*> _nextV;
};class Skiplist {
public:typedef SkiplistNode Node;Skiplist() {srand(time(0));_head = new Node(-1, 1);}bool search(int target) {int level = _head->_nextV.size() - 1;Node* cur = _head;while(level >= 0){//大于,跳到下个节点//小于或者空,向下走if(cur->_nextV[level] && cur->_nextV[level]->_val < target)  {cur = cur->_nextV[level];}else if(!cur->_nextV[level] || cur->_nextV[level]->_val > target)  {level--;}else  //找到了{return true;}}return false;}vector<SkiplistNode*> GetPrev(int num){//核心是找到每一层的前置节点//本题允许冗余int level = _head->_nextV.size() - 1;vector<SkiplistNode*> prevV(level + 1, nullptr);Node* cur = _head;while(level >= 0){//大于,跳到下个节点//小于或者空,向下走if(cur->_nextV[level] && cur->_nextV[level]->_val < num)  {cur = cur->_nextV[level];}else  {prevV[level] = cur;level--;}}return prevV;}void add(int num) {vector<SkiplistNode*> prevV = GetPrev(num);//链接节点int n = RandomLevel();Node* newnode = new Node(num, n);if(n > _head->_nextV.size()){_head->_nextV.resize(n, nullptr);prevV.resize(n, _head);}for(int i = 0; i < n; i++){newnode->_nextV[i] = prevV[i]->_nextV[i];prevV[i]->_nextV[i] = newnode;}}bool erase(int num) {vector<SkiplistNode*> prevV = GetPrev(num);//随机生成至少有一层节点if(prevV[0]->_nextV[0] == nullptr || prevV[0]->_nextV[0]->_val != num)  //不存在{return false;}else {//记录待删除的节点SkiplistNode* del = prevV[0]->_nextV[0];for(int i = 0; i < del->_nextV.size(); i++){prevV[i]->_nextV[i] = del->_nextV[i];}delete del;//这里不影响正确性,对头节点的多余空间做处理int j = _head->_nextV.size() - 1;while(j >= 0){if(_head->_nextV[j] == nullptr){j--;}else{break;}}_head->_nextV.resize(j + 1);return true;}}int RandomLevel(){int level = 1;while(rand() < RAND_MAX * _p){level++;}return level;}double _p = 0.25;int _maxLevel = 32;Node* _head;
};



4.skiplist跟平衡搜索树和哈希表的对比

  1. skiplist相比平衡搜索树(AVL树和红黑树)对比,都可以做到遍历数据有序,时间复杂度也差不多
    skiplist的优势是:
    a、skiplist实现简单,容易控制。平衡树增删查改遍历都更复杂。
    b、skiplist的额外空间消耗更低。平衡树节点存储每个值有三叉链,平衡因子/颜色等消耗。skiplist中p=1/2时,每个节点所包含的平均指针数目为2;skiplist中p=1/4时,每个节点所包含的平均指针数目为1.33;
  2. skiplist相比哈希表而言,就没有那么大的优势了哈希表平均时间复杂度是O(1),比skiplist快。。
    skiplist优势如下:
    a、遍历数据有序b、skiplist空间消耗略小一点,哈希表存在链接指针和表空间消耗。
    b、哈希表扩容有性能损耗。
    c、哈希表再极端场景下哈希冲突高,效率下降厉害,需要红黑树补足接力,实现复杂。

这篇关于数据结构:跳表讲解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/730958

相关文章

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

6.1.数据结构-c/c++堆详解下篇(堆排序,TopK问题)

上篇:6.1.数据结构-c/c++模拟实现堆上篇(向下,上调整算法,建堆,增删数据)-CSDN博客 本章重点 1.使用堆来完成堆排序 2.使用堆解决TopK问题 目录 一.堆排序 1.1 思路 1.2 代码 1.3 简单测试 二.TopK问题 2.1 思路(求最小): 2.2 C语言代码(手写堆) 2.3 C++代码(使用优先级队列 priority_queue)

计算机毕业设计 大学志愿填报系统 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点赞 👍 收藏 ⭐评论 📝 🍅 文末获取源码联系 👇🏻 精彩专栏推荐订阅 👇🏻 不然下次找不到哟~Java毕业设计项目~热门选题推荐《1000套》 目录 1.技术选型 2.开发工具 3.功能

《数据结构(C语言版)第二版》第八章-排序(8.3-交换排序、8.4-选择排序)

8.3 交换排序 8.3.1 冒泡排序 【算法特点】 (1) 稳定排序。 (2) 可用于链式存储结构。 (3) 移动记录次数较多,算法平均时间性能比直接插入排序差。当初始记录无序,n较大时, 此算法不宜采用。 #include <stdio.h>#include <stdlib.h>#define MAXSIZE 26typedef int KeyType;typedef char In

【408数据结构】散列 (哈希)知识点集合复习考点题目

苏泽  “弃工从研”的路上很孤独,于是我记下了些许笔记相伴,希望能够帮助到大家    知识点 1. 散列查找 散列查找是一种高效的查找方法,它通过散列函数将关键字映射到数组的一个位置,从而实现快速查找。这种方法的时间复杂度平均为(

浙大数据结构:树的定义与操作

四种遍历 #include<iostream>#include<queue>using namespace std;typedef struct treenode *BinTree;typedef BinTree position;typedef int ElementType;struct treenode{ElementType data;BinTree left;BinTre

Python 内置的一些数据结构

文章目录 1. 列表 (List)2. 元组 (Tuple)3. 字典 (Dictionary)4. 集合 (Set)5. 字符串 (String) Python 提供了几种内置的数据结构来存储和操作数据,每种都有其独特的特点和用途。下面是一些常用的数据结构及其简要说明: 1. 列表 (List) 列表是一种可变的有序集合,可以存放任意类型的数据。列表中的元素可以通过索

ispunct函数讲解 <ctype.h>头文件函数

目录 1.头文件函数 2.ispunct函数使用  小心!VS2022不可直接接触,否则..!没有这个必要,方源一把抓住VS2022,顷刻 炼化! 1.头文件函数 以上函数都需要包括头文件<ctype.h> ,其中包括 ispunct 函数 #include<ctype.h> 2.ispunct函数使用 简述: ispunct函数一种判断字符是否为标点符号的函

浙大数据结构:04-树7 二叉搜索树的操作集

这道题答案都在PPT上,所以先学会再写的话并不难。 1、BinTree Insert( BinTree BST, ElementType X ) 递归实现,小就进左子树,大就进右子树。 为空就新建结点插入。 BinTree Insert( BinTree BST, ElementType X ){if(!BST){BST=(BinTree)malloc(sizeof(struct TNo

深度学习速通系列:深度学习算法讲解

深度学习算法是一系列基于人工神经网络的算法,它们通过模拟人脑处理信息的方式来学习和解决复杂问题。这些算法在图像识别、语音识别、自然语言处理、游戏等领域取得了显著的成就。以下是一些流行的深度学习算法及其基本原理: 1. 前馈神经网络(Feedforward Neural Networks, FNN) 原理:FNN 是最基本的神经网络结构,它由输入层、隐藏层和输出层组成。信息从输入层流向隐藏层,最