【深入解析算法】基于拉链法的散列表

2024-04-01 09:04

本文主要是介绍【深入解析算法】基于拉链法的散列表,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

8.2 基于拉链法的散列表

一个散列函数能够将键转化为数组索引。散列算法的第二步是碰撞处理,也就是处理两个或多个键的散列值相同的情况。一种直接的办法是将大小为M的数组中的每个元素指向一条链表,链表中的每个结点都存储了散列值为该元素的索引的键值对。这种方法被称为拉链法,因为发生冲突的元素都被存储在链表中。这个方法的基本思想就是选择足够大的M,使得所有链表都尽可能短以保证高效的查找。查找分两步:首先根据散列值找到对应的链表,然后沿着链表顺序查找相应的键。拉链法的一种实现方法是使用原始的链表数据类型来扩展SequentialSearchST 。另一种更简单的方法(但效率稍低)是采用一般性的策略,为M个元素分别构建符号表来保存散列到这里的键,这样也可以重用我们之前的代码。下面算法实现的SeparateChainingHashST使用了一个SequentialSearchST对象的数组,在put()和get()的实现中先计算散列函数来选定被查找的SequantialSearchST对象,然后使用符号表的put(和get()方法来完成相应的任务。

因为我们要用M条链表键 散列值保存N个键,无论键在各个链表中的分布如何,链表的平均长度肯定是N/M。例如,假设:所有的键都落在了第一条链表上,所有链表的平均长度仍然是0+0+…+0/M=-NIM。拉链法在实际情况中很有用,因为每条链表确实都大约含有N/M个键值对。在一般情况中,我们能够由它验证假设J并且可以依赖这种高效的查找和插入实现。

算法 基于拉链法的散列表
public class SeparateChainingHashST<Key, Value>{private int N;   //键值对总数private int M;   //散列表的大小private SequentialSearchST<Key, Value>[] st;  //存放链表对象的教组public SeparateChainingHashST(){ this(997);}public SeparateChainingHashST(int M){//创建M条链表this.M = M;st = (SequentialSearchST<Key, Value> []) new SequentialSearchST[M];for(int i = 0; i < M; i++){st[i] = new SequentialSearchST() ;}}private int hash(Key key){ return (key. hashCode() & 0fxffffff) %M;}public Value get(Key key){return  (Value) st [hash(key)].get(key); }public void put(Key key, Value val){st[hash(key)].put(key, val); }}

这段简单的符号表实现维护着一-条链表的数组,用散列丽数来为每个键选择- - 条链表。简单起见,我们使用了SequentialSearchST。在创建st[]时需要进行类型转换,因为Java不允许泛型的数组。默认的构造函数会使用997条链表,因此对于较大的符号表,这种实现比SequentialSearchST大约会快1000倍。当你能够预知所需要的符号表的大小时,这段短小精悍的方案能够得到不错的性能。一种更可靠的方案是动态调整链表数组的大小,这样无论在符号表中有多少键值对都能保证链表较短。

命题K:在一张含有M条链表和N个键的的散列表中,(在假设J成立的前提下)任意一条链表中的键的数量均在NIM的常数因子范围内的概率无限趋向于1。

简略的证明:有了假设了,这个问题就变成了一个经典的概率论问题。

性质L:在一张含有M条链表和N个键的的散列表中,未命中查找和插入操作所霄的比较次数为~NIM。

例证:在实际应用中,散列表算法的高性能并不需要散列函数完全符合假设了意义上的均匀性。自20世纪50年代以来,无数程序员都见证了命题K所预言的性能改进,即使有些散列函数不是均匀的,命题也成立。例如,图3.4.4 所示的FrequencyCounter使用的散列表(其中的hash()方法是基于Java的String类型的hashCode()方法中的链表长度和理论模型完全一致。这条性质的例外之一是在许多情况下散列函数未能使用键的所有信息而造成的性能低下。除此之外,大量经验丰富的程序员给出的应用实例令我们确信,在基于拉链法的散列表中使用大小为M的数组能够将查找和插入操作的效率提高M倍。

这篇关于【深入解析算法】基于拉链法的散列表的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/866762

相关文章

Python如何计算两个不同类型列表的相似度

《Python如何计算两个不同类型列表的相似度》在编程中,经常需要比较两个列表的相似度,尤其是当这两个列表包含不同类型的元素时,下面小编就来讲讲如何使用Python计算两个不同类型列表的相似度吧... 目录摘要引言数字类型相似度欧几里得距离曼哈顿距离字符串类型相似度Levenshtein距离Jaccard相

C语言中自动与强制转换全解析

《C语言中自动与强制转换全解析》在编写C程序时,类型转换是确保数据正确性和一致性的关键环节,无论是隐式转换还是显式转换,都各有特点和应用场景,本文将详细探讨C语言中的类型转换机制,帮助您更好地理解并在... 目录类型转换的重要性自动类型转换(隐式转换)强制类型转换(显式转换)常见错误与注意事项总结与建议类型

Redis存储的列表分页和检索的实现方法

《Redis存储的列表分页和检索的实现方法》在Redis中,列表(List)是一种有序的数据结构,通常用于存储一系列元素,由于列表是有序的,可以通过索引来访问元素,因此可以很方便地实现分页和检索功能,... 目录一、Redis 列表的基本操作二、分页实现三、检索实现3.1 方法 1:客户端过滤3.2 方法

MySQL 缓存机制与架构解析(最新推荐)

《MySQL缓存机制与架构解析(最新推荐)》本文详细介绍了MySQL的缓存机制和整体架构,包括一级缓存(InnoDBBufferPool)和二级缓存(QueryCache),文章还探讨了SQL... 目录一、mysql缓存机制概述二、MySQL整体架构三、SQL查询执行全流程四、MySQL 8.0为何移除查

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

使用Java实现一个解析CURL脚本小工具

《使用Java实现一个解析CURL脚本小工具》文章介绍了如何使用Java实现一个解析CURL脚本的工具,该工具可以将CURL脚本中的Header解析为KVMap结构,获取URL路径、请求类型,解析UR... 目录使用示例实现原理具体实现CurlParserUtilCurlEntityICurlHandler

深入解析Spring TransactionTemplate 高级用法(示例代码)

《深入解析SpringTransactionTemplate高级用法(示例代码)》TransactionTemplate是Spring框架中一个强大的工具,它允许开发者以编程方式控制事务,通过... 目录1. TransactionTemplate 的核心概念2. 核心接口和类3. TransactionT

数据库使用之union、union all、各种join的用法区别解析

《数据库使用之union、unionall、各种join的用法区别解析》:本文主要介绍SQL中的Union和UnionAll的区别,包括去重与否以及使用时的注意事项,还详细解释了Join关键字,... 目录一、Union 和Union All1、区别:2、注意点:3、具体举例二、Join关键字的区别&php

深入理解Apache Airflow 调度器(最新推荐)

《深入理解ApacheAirflow调度器(最新推荐)》ApacheAirflow调度器是数据管道管理系统的关键组件,负责编排dag中任务的执行,通过理解调度器的角色和工作方式,正确配置调度器,并... 目录什么是Airflow 调度器?Airflow 调度器工作机制配置Airflow调度器调优及优化建议最

Spring IOC控制反转的实现解析

《SpringIOC控制反转的实现解析》:本文主要介绍SpringIOC控制反转的实现,IOC是Spring的核心思想之一,它通过将对象的创建、依赖注入和生命周期管理交给容器来实现解耦,使开发者... 目录1. IOC的基本概念1.1 什么是IOC1.2 IOC与DI的关系2. IOC的设计目标3. IOC