CPP中的hash [more cpp-7]

2024-09-08 05:20
文章标签 hash cpp

本文主要是介绍CPP中的hash [more cpp-7],希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

写在前面

hash 在英文中是弄乱的含义。在编程中,hash是一种数据技术它把任意类型的数据通过算法,生成一串数字(hash code),实现hash的函数称为哈希函数,又称散列函数,杂凑函数。在CPP中hashcode是一个size_t类型的数字

你可能会问?把数据弄乱有什么用?为什么我们要把数据映射到一串数字上?这又什么意义吗?我们先看看hash的性质

一般hash性质

唯一性(唯一映射)

  • 理想情况下,不同的输入应该映射到不同的哈希值,这样可以确保哈希值具有唯一性。(唯一且不重复)不过,由于输入空间的大小通常远大于哈希值的输出空间,实际上可能会发生哈希冲突(即不同输入映射到相同的哈希值)。

固定长度

  • 不论输入数据的长度是多少,哈希值的长度是固定的。比如,SHA-256 哈希函数总是生成 256 位的哈希值。

不可逆性(One-Way Property)

  • 不可逆性: 哈希函数是单向的,即从哈希值不能反推出原始输入。这是因为哈希函数将原始数据压缩成固定长度的哈希值,可能会丢失信息。由于信息丢失,哈希值不能唯一地表示原始数据。

碰撞(Collision)

  • 碰撞: 哈希函数的输出范围是有限的,因此不同的输入数据可能会生成相同的哈希值。这种现象称为碰撞。尽管哈希函数设计时尽量减少碰撞的发生,但理论上总是存在碰撞的可能性。

std::hash

CPP为内建类型提供了hash的计算方法(当然还有类型本身)

const std::type_info& inttype = typeid(int);
cout << inttype.name() << endl;
cout << inttype.hash_code() << endl;const std::type_info& floattype = typeid(float);
cout << floattype.name() << endl;
cout << floattype.hash_code() << endl;std::hash<int> intHash;
std::hash<std::string> stringHash;
std::cout << "Hash of 42: " << intHash(42) << std::endl;
std::cout << "Hash of 42: " << intHash(52) << std::endl;
std::cout << "Hash of 'hello': " << stringHash("hello") << std::endl;

哈希表

在一些常见的任务中,我们其实有意无意的就在使用hash表

  • 给定一个数组arr,我们要统计其中每个数字出现的次数(数字大于0小于1000),那我们可以命出一个int table[1000]数组,先把每个元素置零,再历遍arr, table[arr[j]]++.这里其实就是一个1->1的hash
    • 它在给定的范围内唯一且不重复,没有碰撞现象,这就是一个简单的hash表
  • 给定一个字符串string,里面只有小写字母,我们统计26个英文字母出现的次数,那我们可以命出一个int alphanum[26],置零每个元素,历遍string ,alphanum[string[j]]++,这里其实是’a’->0的hash
  • 下一个场景,你开了一家小卖部,有1000种 商品,你记不清每种商品的价格,把它记在一个本子上,以
    商品名-价格 的形式,那如果是直接检索,买任意一种商品最糟糕要对比1000次名字。我们如果做一个hash
    商品名对上唯一的数字,那按照数字来找不是快多了?

std::hash map

哈希表是一种用于存储和查找数据的数据结构,通过哈希函数将键映射到表中的位置,从而在平均情况下实现常数时间的插入、删除和查找操作。在 C++ 中,哈希表的实现主要通过标准库提供的 unordered_mapunordered_set 类来实现。

unordered_mapunordered_set

这两个容器都基于哈希表实现。unordered_map 用于存储键值对,而 unordered_set 用于存储唯一的键。

1. unordered_map

unordered_map 是一个哈希表实现的关联容器,它将键映射到值。其主要特性包括:

  • 插入操作:在平均情况下,插入时间复杂度为 O(1)。
  • 查找操作:在平均情况下,查找时间复杂度为 O(1)。
  • 删除操作:在平均情况下,删除时间复杂度为 O(1)。
示例代码
#include <iostream>
#include <unordered_map>using namespace std;int main() {// 创建一个 unordered_mapunordered_map<string, int> umap;// 插入键值对umap["apple"] = 3;umap["banana"] = 2;umap["orange"] = 1;// 查找元素if (umap.find("banana") != umap.end()) {cout << "Banana count: " << umap["banana"] << endl;}// 遍历 unordered_mapfor (const auto& pair : umap) {cout << pair.first << ": " << pair.second << endl;}// 删除元素umap.erase("apple");// 查找删除后的元素if (umap.find("apple") == umap.end()) {cout << "Apple not found" << endl;}return 0;
}
2. unordered_set

unordered_set 是一个哈希表实现的集合容器,用于存储唯一的元素。它的主要特性包括:

  • 插入操作:在平均情况下,插入时间复杂度为 O(1)。
  • 查找操作:在平均情况下,查找时间复杂度为 O(1)。
  • 删除操作:在平均情况下,删除时间复杂度为 O(1)。
示例代码
#include <iostream>
#include <unordered_set>using namespace std;int main() {// 创建一个 unordered_setunordered_set<string> uset;// 插入元素uset.insert("apple");uset.insert("banana");uset.insert("orange");// 查找元素if (uset.find("banana") != uset.end()) {cout << "Banana is in the set" << endl;}// 遍历 unordered_setfor (const auto& element : uset) {cout << element << endl;}// 删除元素uset.erase("apple");// 查找删除后的元素if (uset.find("apple") == uset.end()) {cout << "Apple not found" << endl;}return 0;
}

主要功能和操作

  • 构造函数unordered_mapunordered_set 提供了多种构造函数,包括默认构造函数、带初始桶数的构造函数等。
  • 哈希函数unordered_mapunordered_set 默认使用 std::hash 作为哈希函数,用户也可以提供自定义哈希函数。
  • 键的比较:默认使用 std::equal_to 进行键的比较,也可以提供自定义比较函数。

这篇关于CPP中的hash [more cpp-7]的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1147229

相关文章

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

usaco 1.2 Milking Cows(类hash表)

第一种思路被卡了时间 到第二种思路的时候就觉得第一种思路太坑爹了 代码又长又臭还超时!! 第一种思路:我不知道为什么最后一组数据会被卡 超时超了0.2s左右 大概想法是 快排加一个遍历 先将开始时间按升序排好 然后开始遍历比较 1 若 下一个开始beg[i] 小于 tem_end 则说明本组数据与上组数据是在连续的一个区间 取max( ed[i],tem_end ) 2 反之 这个

uva 10029 HASH + DP

题意: 给一个字典,里面有好多单词。单词可以由增加、删除、变换,变成另一个单词,问能变换的最长单词长度。 解析: HASH+dp 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#inc

整数Hash散列总结

方法:    step1  :线性探测  step2 散列   当 h(k)位置已经存储有元素的时候,依次探查(h(k)+i) mod S, i=1,2,3…,直到找到空的存储单元为止。其中,S为 数组长度。 HDU 1496   a*x1^2+b*x2^2+c*x3^2+d*x4^2=0 。 x在 [-100,100] 解的个数  const int MaxN = 3000

POJ 1198 双广+Hash

此题采用双广可从bfs的O(16^8)降低到O(2*16^4); 坐标0-7,刚好3位存储, 需要24位存储四个坐标(x,y),也就是[0,2^24) 。 很好的一题。 import java.io.BufferedReader;import java.io.InputStream;import java.io.InputStreamReader;import

C# Hash算法之MD5、SHA

MD5我们用的还是比较多的,一般用来加密存储密码。但是现在很多人觉MD5可能不太安全了,所以都用上了SHA256等来做加密(虽然我觉得都差不多,MD5还是能玩)。 还是跟上一篇说的一样,当一个算法的复杂度提高的同时肯定会带来效率的降低,所以SHA和MD5比较起来的话,SHA更安全,MD5更高效。 由于HASH算法的不可逆性,所以我认为MD5和SHA主要还是应用在字符串的"加密"上。 由于

类模板中.h和.cpp的实现方法

一般类的声明和实现放在两个文件中,然后在使用该类的主程序代码中,包含相应的头文件".h"就可以了,但是,模板类必须包含该其实现的.cpp文件才行。也就是说,在你的主程序中,将 #include"DouCirLList.h" 替换成 #include"DouCirLList.cpp" 应该就可以了。 在使用类模板技术时,可在.h中实现,也可在.h和.cpp中分开实现,若用.h实