【C++进阶】哈希表的闭散列和开散列(哈希桶)的代码实现

2024-03-01 20:04

本文主要是介绍【C++进阶】哈希表的闭散列和开散列(哈希桶)的代码实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

👦个人主页:@Weraphael
✍🏻作者简介:目前学习C++和算法
✈️专栏:C++航路
🐋 希望大家多多支持,咱一起进步!😁
如果文章对你有帮助的话
欢迎 评论💬 点赞👍🏻 收藏 📂 加关注✨


目录

  • 一、哈希表的闭散列实现
      • 1.1 结构
      • 1.2 插入操作
      • 1.3 查找操作
      • 1.3 删除操作
  • 二、哈希表的开散列实现(哈希桶)
      • 2.1 结构
      • 2.2 构造函数
      • 2.3 插入操作
      • 2.4 测试
      • 2.5 查找操作
      • 2.6 删除操作
      • 2.7 析构函数
  • 三、源码

一、哈希表的闭散列实现

1.1 结构

【分析】

  • 当在哈希表中删除值时,如何抹除数据?给个0或者-1,那如果数据本身就有0或者-1呢,因此不行;挪动数据覆盖就更加不行了,因为会影响数据的哈希值。
  • 当在哈希表中插入值时,如果不为空,说明该位置已存储数据,需要向后遍历,直到遇到空位置或者已经删除数据的位置插入

因此,在闭散列的哈希表中,哈希表每个位置除了存储所给数据之外,还应该存储该位置当前的状态,哈希表中每个位置的可能状态如下:

  1. EMPTY:当前是无数据的空位置
  2. EXIST:当前位置已存储数据
  3. DELETE:当前位置原本有数据,但被删除了

在这里插入图片描述

  • vector里面有一个size接口为什么还要再定义_n呢?

这是因为哈希表存储数据是分散存储的,因此size接口的大小是不确定的。

在这里插入图片描述

1.2 插入操作

  • 通过哈希函数计算出对应的哈希地址。当位置的状态是EMPTY或者DELETE就可以直接插入;如果是EXIT则要向后继续遍历(越界后需要从0开始)

在这里插入图片描述

然而如果哈希表中的元素接近满了,这时候就很容易引发哈希冲突,而哈希表不期望这样。那么扩容就很有必要,因此,哈希表引入了负载因子(载荷因子)

散列表的载荷因子定义为:α = 填入表中的元素个数 / 散列表的长度

  • α是散列表装满程度的标志因子。由于散列表是定值,α填入表中的元素个数_n成正比,所以,_n越大,表明填入表中的元素越多,产生冲突的概率就越大;反之,_n越小,标明填入表中的元素越少,产生冲突的概率就越小。
  • 注意:哈希表不能满了再扩容,需要控制负载因子一定值就扩容。
  • 对于散列表,荷载因子α是特别重要因素,应严格限制在0.7 - 0.8

在这里插入图片描述

以上这种扩容方式是由问题的

在这里插入图片描述

扩容完后,映射关系变了,需要重新映射

  • 现代写法

步骤如下:

  1. 创建新哈希表并扩容到足够的空间
  2. 遍历旧表的数据插入到新表即可(建立映射关系的工作交给Insert
  3. 交换新表旧表。

在这里插入图片描述

以上代码还有问题,假设key的类型是除了int之外的类型,那么除留余数法就走不通了!因为求余数的两个操作数必须是整数。

因此可以做两次映射。先让key和整型做映射( 使用仿函数),最后再和存储位置做映射。

在这里插入图片描述

有的人想:在仿函数那一块key不是被const修饰吗,为什么还是能修改key。比如const double key = 1.1转化成(size_t)key = 1

const只限制修饰的对象不能修改,但并不影响对其进行类型转换操作,这是合法的!

但是当测试string类型的时候,发现还是编译不通过

在这里插入图片描述

法一:可以再针对string类型写一个仿函数

在这里插入图片描述

然后编译就通过了

在这里插入图片描述

但是返回字符串的第一个字符的asc码也不好,万一序列中字符串第一个字符都相等,那么又会引发哈希冲突的概率就越大。因此,可以将字符串中的asc码全部相加再返回

在这里插入图片描述

但是因此方法还是完美避免哈希冲突。比如有这些字符串:"abc""bac"“cab”等九种排列组合,它们相加的asc码都是一样的。因此,就有人发明了字符串哈希算法:点击跳转。它的思想也是将所有字符的asc码相加,但是在相加之前乘以131

在这里插入图片描述

法二:类模板特化。好处:不用在main函数显示传递列表类型,由编译器自己匹配

在这里插入图片描述

同样也能编译通过

在这里插入图片描述

1.3 查找操作

  • 通过哈希函数计算出对应的哈希地址。

  • 如果位置的状态是EXIST则要比较key。相等返回,不相等继续向后找。

  • 如果位置的状态是DELETE还要继续向后找

  • 如果位置的状态是EMPTY就没有必要向后查找了

在这里插入图片描述

1.3 删除操作

  • 调用Find函数,如果找到了,直接在当前位置标记为DELETE;否则返回false

在这里插入图片描述

闭散列只做简单了解即可,真正重点在于开散列

二、哈希表的开散列实现(哈希桶)

2.1 结构

开散列又称为哈希桶。当发生哈希冲突时,直接在冲突位置挂着一个单链表,形似一个桶,也看作是一个指针数组

在这里插入图片描述

该结点类型除了存储所给数据之外,还需要存储一个结点指针用于指向下一个结点。

在这里插入图片描述

在开散列的哈希表中,哈希表的每个位置存储的实际上是某个单链表的头结点,即每个哈希桶中存储的数据实际上是一个结点类型

当然了,在插入数据时也需要根据负载因子判断是否需要增容,所以我们也应该存储哈希表中的有效元素个数,当负载因子过大时就应该进行哈希表的增容。
在这里插入图片描述

与闭散列的哈希表不同的是,开散列是将相同哈希值的元素都放到了同一个哈希桶中,并不需要经过探测寻找所谓的下一个位置,因此不需要存储状态字段

2.2 构造函数

  • 默认设置表长为10,并且初始化每个位置都为空nullptr

在这里插入图片描述

2.3 插入操作

在进行数据插入时,既可以尾插,也可以头插,因为桶中的存储顺序没有要求。为了操作简单,这里 选择头插

【头插思路】

在这里插入图片描述

【代码实现】

在这里插入图片描述

随着元素的不断插入,每个桶中元素的个数不断增多,极端情况下,可能会导致一个桶中链表节点非常多,。那么这就和链表没什么区别了,因此在一定条件下需要对哈希表进行增容

那该什么条件需要增容呢?

开散列的扩容还是要控制负载因子α = 填入表中的元素个数 / 散列表的长度对于开散列,一般控制在1,即填入表中的元素个数 == 散列表的长度

注意:扩容的时候不能像闭散列一样复用insert,因为开散列的insert是有new操作的,会有损耗

因此,这里可以步骤是:

  • 开一个新表
  • 遍历旧表的结点,通过计算结点在新表的哈希值,然后头插到新表中
  • 最后新旧表交换。

在这里插入图片描述

当然还要特殊处理key是不是整数的情况(和闭散列一样)

在这里插入图片描述

2.4 测试

在这里插入图片描述

【测试结果】

  • 插入十个数据(没有扩容)
    在这里插入图片描述

  • 插入十个数据(扩容2倍)

在这里插入图片描述

2.5 查找操作

步骤:

  • 首先计算查找元素的哈希值
  • 最后再根据哈希值去遍历链表

在这里插入图片描述

2.6 删除操作

步骤:

  • 通过哈希函数计算出key的哈希值。
  • 遍历链表查找并删除。要注意头删的情况

在这里插入图片描述

2.7 析构函数

因为有new操作,所以需要手动遍历将其释放,避免内存泄漏

在这里插入图片描述

三、源码

Gitee仓库链接:点击跳转

这篇关于【C++进阶】哈希表的闭散列和开散列(哈希桶)的代码实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/763650

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

哈希leetcode-1

目录 1前言 2.例题  2.1两数之和 2.2判断是否互为字符重排 2.3存在重复元素1 2.4存在重复元素2 2.5字母异位词分组 1前言 哈希表主要是适合于快速查找某个元素(O(1)) 当我们要频繁的查找某个元素,第一哈希表O(1),第二,二分O(log n) 一般可以分为语言自带的容器哈希和用数组模拟的简易哈希。 最简单的比如数组模拟字符存储,只要开26个c

Java进阶13讲__第12讲_1/2

多线程、线程池 1.  线程概念 1.1  什么是线程 1.2  线程的好处 2.   创建线程的三种方式 注意事项 2.1  继承Thread类 2.1.1 认识  2.1.2  编码实现  package cn.hdc.oop10.Thread;import org.slf4j.Logger;import org.slf4j.LoggerFactory

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

【C++ Primer Plus习题】13.4

大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: main.cpp #include <iostream>#include "port.h"int main() {Port p1;Port p2("Abc", "Bcc", 30);std::cout <<

C++包装器

包装器 在 C++ 中,“包装器”通常指的是一种设计模式或编程技巧,用于封装其他代码或对象,使其更易于使用、管理或扩展。包装器的概念在编程中非常普遍,可以用于函数、类、库等多个方面。下面是几个常见的 “包装器” 类型: 1. 函数包装器 函数包装器用于封装一个或多个函数,使其接口更统一或更便于调用。例如,std::function 是一个通用的函数包装器,它可以存储任意可调用对象(函数、函数

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来