Hash算法、MD5算法、HashMap

2024-06-13 19:20
文章标签 算法 hashmap hash md5

本文主要是介绍Hash算法、MD5算法、HashMap,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Hash算法

先说结论:MD5算法是Hash算法中的一种。
“哈希值”(Hash Value)本身是由哈希算法生成的,而hashCode算法在Java中是与对象的hashCode()方法相关联的概念。下面我将分别解释哈希值和Java中的hashCode算法。

哈希值(Hash Value)

哈希值是由哈希函数生成的,哈希函数接受输入(或“消息”)并返回固定大小的字符串,通常是数字形式。这个返回值通常是固定长度的,且通常与原始数据的长度无关。哈希函数的主要目的是快速比较两个不同数据的哈希值,如果哈希值相同,那么原始数据有很大可能性也是相同的

常见的哈希算法包括:

- MD5(Message Digest Algorithm 5)

  • SHA-1(Secure Hash Algorithm 1)
  • SHA-256(Secure Hash Algorithm 256)

Java中的hashCode算法

Java中的hashCode算法与安全哈希算法(如MD5或SHA)不同,它是由Java对象的hashCode()方法实现的。这个方法是java.lang.Object类中的一个本地方法,每个Java对象都继承了这个方法。hashCode方法的目的是为对象生成一个32位的整数值,这个值在对象的生命周期内是不变的。

hashCode的特点:
  1. 一致性:在同一个程序执行过程中,同一个对象多次调用hashCode()方法,应该返回相同的值。
  2. 不唯一性:不同的对象可能有不同的hashCode值,但也有可能相同。
  3. 快速性hashCode的计算应该尽可能快,以便在哈希表等数据结构中高效使用。
使用场景:
  • 作为哈希表(如HashMapHashSet)中键的哈希码。
  • 用于快速比较对象的相似性。
注意:

hashCode方法默认的实现可能依赖于对象的内存地址,但是Java鼓励开发者重写此方法,以便为对象提供一个与其equals()方法一致的散列码。如果两个对象通过equals()方法比较结果为true,则它们调用hashCode()方法也应该返回相同的值。

在Java中,你可以通过覆盖Object类的hashCode()方法来提供自定义的散列码实现。例如:

@Override
public int hashCode() {// 根据对象的属性来计算散列码return Objects.hash(this.property1, this.property2);
}

在这个例子中,Objects.hash()方法接受多个参数,返回一个根据这些参数值计算出的散列码。这可以确保如果对象的属性值相同,那么它们的散列码也相同。

MD5算法

文件的MD5值是一个128位的哈希值,由MD5(Message Digest Algorithm 5,消息摘要算法第五版)哈希算法生成。MD5算法是一种广泛使用的哈希函数,它可以产生一个32位的十六进制字符串作为输入数据的“摘要”或“指纹”。

MD5值的特点:

  1. 唯一性:理论上,不同的输入数据经过MD5算法处理后,产生相同MD5值的可能性非常小。
  2. 不变性:给定的文件或数据,无论何时何地使用MD5算法,都会得到相同的MD5值。
  3. 紧凑性:128位的哈希值可以以32位的十六进制字符串形式紧凑地表示。

MD5值的用途:

  • 数据完整性校验:常用于验证文件是否在传输或存储过程中被篡改。
  • 密码存储:在某些系统中,用户的密码可能会被存储为MD5哈希值,以增加安全性。
  • 数据指纹:用于快速比较大量数据的相似性。

如何获取文件的MD5值:

在不同的操作系统中,可以使用不同的命令行工具来计算文件的MD5值:

  • Windows:可以使用 certUtil 命令,例如:
    certUtil -hashfile "C:\path\to\file.txt" MD5
    
  • Linux/Unix:可以使用 md5sum 命令,例如:
    md5sum /path/to/file.txt
    

在编程中,许多编程语言提供了生成MD5值的库或函数。例如,在Java中,可以使用java.security.MessageDigest类来计算文件的MD5值。

注意:

尽管MD5在某些场合仍然有用,但它已经不再被认为是安全的哈希函数,因为它容易受到多种攻击,如碰撞攻击。在需要高安全性的场合,建议使用更安全的哈希算法,如SHA-256。

HashMap

HashMap插值的整体过程
在Java中,HashMap的插入流程涉及几个关键步骤,确保键值对能够高效地存储和检索。以下是HashMap插入键值对的整体流程:

  1. 计算哈希码
    首先,通过调用键对象的hashCode()方法来获取其哈希码。

  2. 定位哈希桶
    使用哈希码通过某种形式的散列(通常是一个简单的模运算,例如h % capacity,其中capacity是哈希表的容量)来确定该键值对应该存储在哈希表的哪个桶(bucket)中。
    这里的h是通过hashcode算法计算得来的:
    高位运算:为了进一步减少哈希冲突并更好地分布键值对,HashMap会对原始哈希码进行一些位运算处理。在Java 8及以后的版本中,这包括一个无符号右移16位操作和异或操作,如下所示:

int hash = (key == null) ? 0 : key.hashCode();
int h = hash ^ (hash >>> 16);

这样做的好处是:
1、高低位混合可以使得哈希表的bucket分布更加均匀。
2、异或操作可以保持原始哈希码的更多信息,增加哈希表的性能

3. 处理哈希冲突
如果两个或多个键的哈希码定位到同一个桶,就会发生哈希冲突。HashMap通过链表或树(当链表长度超过一定阈值时,比如默认的8)来解决冲突。

  1. 遍历哈希桶
    如果桶中已有元素,HashMap会遍历该桶的链表或树,检查是否已经存在相同的键(通过equals()方法比较)。

  2. 插入键值对
    如果桶中没有找到相同的键,则将新的键值对添加到桶中。如果桶是空的,键值对将成为桶中的第一个元素。如果桶中有元素,并且存在哈希冲突,则将新键值对添加到链表的末尾或树中。

  3. 调整容量(如果需要)
    当哈希表中的元素数量超过容量与加载因子(load factor)的乘积时,HashMap会进行扩容。扩容通常涉及创建一个更大的哈希表,并重新分配现有键值对到新的桶中。
    加载因子:一般为0.75,是一个经验值。

  4. 返回结果
    put()方法返回插入操作的结果。如果插入的键是新的,返回null;如果键已存在,返回原先对应的值。

这篇关于Hash算法、MD5算法、HashMap的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1058195

相关文章

Redis的Hash类型及相关命令小结

《Redis的Hash类型及相关命令小结》edisHash是一种数据结构,用于存储字段和值的映射关系,本文就来介绍一下Redis的Hash类型及相关命令小结,具有一定的参考价值,感兴趣的可以了解一下... 目录HSETHGETHEXISTSHDELHKEYSHVALSHGETALLHMGETHLENHSET

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

usaco 1.2 Milking Cows(类hash表)

第一种思路被卡了时间 到第二种思路的时候就觉得第一种思路太坑爹了 代码又长又臭还超时!! 第一种思路:我不知道为什么最后一组数据会被卡 超时超了0.2s左右 大概想法是 快排加一个遍历 先将开始时间按升序排好 然后开始遍历比较 1 若 下一个开始beg[i] 小于 tem_end 则说明本组数据与上组数据是在连续的一个区间 取max( ed[i],tem_end ) 2 反之 这个