【数据结构3】哈希表、哈希表的应用(集合与字典、md5算法和文件的哈希值)

2024-08-25 03:20

本文主要是介绍【数据结构3】哈希表、哈希表的应用(集合与字典、md5算法和文件的哈希值),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1 哈希表

哈希表一个通过哈希函数来计算数据存 储位置的数据结构,通常支持如下操作:
插入(键,值):插入键值对(键,值)
Get(key):如果存在键为键的键值对则返回其值,否则返回空值
删除():删除键为键的键值对哈希表(Hash Table,又称为散列表),是一种线性表的存储结构。哈希表由一个直接寻址表和一个哈希函数组成。哈希函数h(k)将元素关键字k作为自变量,返回元素的存储下标。解决哈希冲突使用:拉链法
拉链法:哈希表每个位置都连接一个链表,当冲突发生时,冲突的元素将被加到该位置链表的最后。

在这里插入图片描述

class LinkList:"""单链表实现"""# Node类表示链表中的一个节点class Node:def __init__(self, item=None):"""初始化链表节点:param item: 节点存储的数据,默认为None"""self.item = item  # 存储节点的数据self.next = None  # 指向下一个节点的指针,初始为None# LinkListIterator类用于实现链表的迭代器class LinkListIterator:def __init__(self, node):"""初始化链表迭代器:param node: 链表的起始节点"""self.node = node  # 保存当前节点,用于迭代def __next__(self):"""获取链表中的下一个元素:return: 当前节点的数据:raises StopIteration: 如果没有更多节点,则停止迭代"""if self.node:cur_node = self.node  # 保留当前节点self.node = cur_node.next  # 移动到下一个节点return cur_node.item  # 返回当前节点的数据else:raise StopIteration  # 如果没有更多节点,则停止迭代def __iter__(self):"""返回迭代器对象自身:return: 迭代器对象自身"""return self  # 返回迭代器对象自身,使其可以在for循环中使用def __init__(self, iterable=None):"""初始化链表:param iterable: 可迭代对象,用于初始化链表的元素"""self.head = None  # 链表头节点的引用,初始化为空self.tail = None  # 链表尾节点的引用,初始化为空if iterable:self.extend(iterable)  # 如果传入了可迭代对象,则扩展链表def append(self, obj):"""在链表末尾添加一个新节点:param obj: 要添加的元素"""s = LinkList.Node(obj)  # 创建一个新节点if not self.head:self.head = s  # 如果链表为空,将头节点和尾节点都指向新节点self.tail = selse:self.tail.next = s  # 将当前尾节点的next指针指向新节点self.tail = s  # 更新尾节点为新节点def extend(self, iterable):"""扩展链表,将可迭代对象中的每个元素添加到链表中:param iterable: 可迭代对象"""for obj in iterable:self.append(obj)  # 依次添加可迭代对象中的每个元素def find(self, obj):"""查找链表中是否存在指定的元素:param obj: 要查找的元素:return: 如果找到目标元素,则返回True;否则返回False"""for n in self:if n == obj:return True  # 如果找到了目标元素,返回Truereturn False  # 如果遍历结束也没有找到目标元素,返回Falsedef delete(self, obj):"""从链表中删除指定的元素:param obj: 要删除的元素:return: 如果成功删除,返回True;否则返回False"""current = self.head  # 当前节点,初始化为链表的头节点previous = None  # 前一个节点的引用,初始化为Nonewhile current:if current.item == obj:if previous:previous.next = current.next  # 跳过当前节点else:self.head = current.next  # 如果删除的是头节点,更新头节点if current == self.tail:self.tail = previous  # 如果删除的是尾节点,更新尾节点return True  # 删除成功previous = currentcurrent = current.nextreturn False  # 如果没有找到目标元素,返回Falsedef __iter__(self):"""返回链表的迭代器对象:return: 链表的迭代器对象"""return self.LinkListIterator(self.head)  # 返回一个迭代器对象,从头节点开始迭代def __repr__(self):"""返回链表的字符串表示形式:return: 链表的字符串表示形式,格式为"<<" + 元素 + ">>""""return "<<" + ",".join(map(str, self)) + ">>"  # 返回链表的字符串表示形式,元素之间用逗号分隔,整体用"<<"和">>"包围# lk = LinkList([1, 2, 3, 4, 5])
# print(lk)
# for element in lk:
#     print(element)class HashTable:"""哈希表实现"""def __init__(self, size=101):self.size = size  # 哈希表的大小self.T = [LinkList() for _ in range(self.size)]  # 初始化哈希表数组,每个位置是一个链表def h(self, k):"""哈希函数,将键k映射到表中的索引位置"""return k % self.size  # 计算哈希值def insert(self, k):"""插入一个键到哈希表中"""i = self.h(k)  # 计算键的哈希值,确定插入位置if self.find(k):print('重复插入')  # 如果键已存在,打印提示else:self.T[i].append(k)  # 将键插入到相应位置的链表中print(f'{k}插入成功')  # 插入成功提示def find(self, k):"""查找哈希表中是否存在指定的键"""i = self.h(k)  # 计算键的哈希值,确定查找位置return self.T[i].find(k)  # 在链表中查找键def delete(self, k):"""从哈希表中删除指定的键"""i = self.h(k)  # 计算键的哈希值,确定删除位置if self.T[i].delete(k):print(f'{k}删除成功')  # 删除成功提示else:print(f'{k}未找到')  # 如果键不存在,打印提示# 使用示例
lk = HashTable()
lk.insert(1)
lk.insert(2)
lk.insert(3)
print(lk.find(2))  # 输出: True
print(lk.find(4))  # 输出: False
lk.delete(2)  # 删除键2
print(lk.find(2))  # 输出: False

2 哈希表的应用-集合与字典

字典与集合都是通过哈希表来实现的。
a={'name': 'Alex', 'age':18, 'gender': 'an'}
使用哈希表存储字典,通过哈希函数将字典的键映射为下标。假设h('name')=3,h('age')=1,h('gender')= 4,则哈希表存储为[None, 18,None,'Alex''Man']
如果发生哈希冲突,则通过拉链法或开发寻址法解决

3 哈希表的应用-md5算法和文件的哈希值

MD5(Message-Digest Algorithm 5)曾经是密码学中常用的哈希函数,可以把任意长度的数据映射为128 位的哈希值。
其曾经包含如下特征:
1.同样的消息,其MD5值必定相同;
2.可以快速计算出任意给定消息的MD5值:
3.除非暴力的枚举所有可能的消息,否则不可能从哈 希值反推出消息本身;
4.两条消息之间即使只有微小的差别,其对应的MD5 值也应该是完全不同、完全不相关的;
5.不能在有意义的时间内人工的构造两个不同的消息 使其具有相同的MD5值。应用举例:文件的哈希值
算出文件的哈希值,若两个文件的哈希值相同,则可认为这两个文件是相同的。
因此:
1.用户可以利用它来验证下载的文件是否完整
2.云存储服务商可以利用它来判断用户要上传的文件 是否已经存在于服务么器上,从而实现秒传的功能,同时避免存储过多相同的文件副本。

这篇关于【数据结构3】哈希表、哈希表的应用(集合与字典、md5算法和文件的哈希值)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1104400

相关文章

哈希leetcode-1

目录 1前言 2.例题  2.1两数之和 2.2判断是否互为字符重排 2.3存在重复元素1 2.4存在重复元素2 2.5字母异位词分组 1前言 哈希表主要是适合于快速查找某个元素(O(1)) 当我们要频繁的查找某个元素,第一哈希表O(1),第二,二分O(log n) 一般可以分为语言自带的容器哈希和用数组模拟的简易哈希。 最简单的比如数组模拟字符存储,只要开26个c

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#