蓝桥杯算法竞赛系列第九章·巧解哈希题,用这3种数据类型足矣

本文主要是介绍蓝桥杯算法竞赛系列第九章·巧解哈希题,用这3种数据类型足矣,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

你好,我是安然无虞。

文章目录

  • 哈希基础概念
  • 哈希相关题目
    • · 有效的字母异位词
    • · 赎金信
    • · 字母异位词分组
    • · 两个数组的交集
    • · 快乐数
    • · 两数之和
    • · 四数相加 II
    • · 最长连续序列
    • · 查找共用字符
    • · 同构字符串
    • · 单词规律
    • · 字节跳动面试:缺失的第一个正数

哈喽哈喽,好久没总结完整的算法博客啦,今天开始把之前欠下的补上,一起加油哦。

在开肝之前,请老铁们思考一个问题:算法对于我们计算机相关专业的大学生来说重要吗,是“非常重要”,还是“狗都不学”,欢迎大家在评论区发表自己的看法。

首先从哈希表说起吧,因为我上次面试遇到这个题型了,还是TM hard(哭泣)。

OK,话不多说,开车~

哈希基础概念

常用作哈希表的三种数据结构:

  • 数组
  • set
  • map

数组的话就不多说了,下面我们来谈谈set和map:

首先来说说unordered_setset以及multiset的区别:

unordered_set底层实现是哈希表,setmultiset的底层是红黑树,而红黑树是一种平衡二叉搜索树,所以key是有序的,但是key不可以修改,因为改动key会导致整棵树的错乱,所以只能删除或者增加。

具体如下表:

集合底层实现是否有序数值是否可以重复能否更改数值查询效率增删效率
set红黑树有序O(logN)O(logN)
multiset红黑树有序O(logN)O(logN)
unordered_set哈希表无序O(1)O(1)

接下来谈谈unordered_mapmap以及multimap的区别:

unordered_map底层实现是哈希表,mapmultimap的底层是红黑树,而红黑树是一种平衡二叉搜索树,同理mapmultimap的key也是有序的。

映射底层实现是否有序数值是否可以重复能否更改数值查询效率增删效率
map红黑树key有序key不可重复key不可修改O(logN)O(logN)
multimap红黑树key有序key可重复key不可修改O(logN)O(logN)
unordered_map哈希表key无序key不可重复key不可修改O(1)O(1)

所以当我们要使用集合来解决哈希问题的时候,优先使用unordered_set,因为它的查询和增删效率都是最优的,如果要求集合是有序的,那么就使用set,如果要求集合不仅有序,还要有重复数值,那么就使用multiset

map是一个<key, value>的数据结构,map对key是有限制的,因为其不可以修改,对value是没有限制的,因为key的存储方式是使用红黑树实现的。

但是哈希法是牺牲空间换取了时间,因为我们要使用额外的数组、set或者map来存放数据,才能实现快速的查找。

当遇到需要判断一个元素是否在集合中出现过的场景,就应该第一时间想到哈希法。


哈希相关题目

下面开始我们刷题之旅,在刷题中探索算法的奥秘~

· 有效的字母异位词

题目链接:有效的字母异位词

在这里插入图片描述

解题思路:

首先我们看到字符串s和t都只包含小写字母,所以我们可以定义一个整数数组用于统计字符串中每个字符的出现次数。

  • 先遍历字符串s统计其中每个字符的出现次数;
  • 紧接着再遍历字符串t用哈希数组中统计的s字符串中字符出现次数减去t中出现次数;
  • 最后再遍历哈希数组,如果数组中每个元素都是0就是有效字母异位词。

代码详解:

class Solution {
public:bool isAnagram(string s, string t) {// 定义一个数组用来统计每个字符的出现次数int hashNums[26] = {0};// 遍历字符串s统计每个字符的出现次数for(int i = 0; i < s.size(); i++){hashNums[s[i] - 'a']++;}// 遍历字符串t用哈希数组中统计的字符出现次数减去t中出现次数for(int i = 0; i < t.size(); i++){hashNums[t[i] - 'a']--;}// 最后再遍历哈希数组,如果都为0就符合题意for(int i = 0; i < 26; i++){if(hashNums[i] != 0){return false;}}return true;}
};// 思路2:
// 1. 分别统计每个字符串中的字符出现次数
// 2. 判断两个字符串中所有字符出现次数是否相等
class Solution {
public:bool isAnagram(string s, string t) {vector<int> nums1 = encode(s);vector<int> nums2 = encode(t);// 判断两个字符串中所有字符出现次数是否相等for(int i = 0; i < 26; i++){if(nums1[i] != nums2[i]){return false;}}return true;}// 统计字符串中字符的出现次数vector<int> encode(string& s){vector<int> hashNums(26);for(int i = 0; i < s.size(); i++){hashNums[s[i] - 'a']++;}return hashNums;}
};

· 赎金信

题目链接:赎金信

在这里插入图片描述

解题思路:

本题跟上一道题很类似,只不过可能需要注意一下对于细节的处理,这里就不多说了,请老铁细品。

代码详解:

class Solution {
public:bool canConstruct(string ransomNote, string magazine) {vector<int> hashNums(26);// 先统计字符串magazine中字符的出现次数for(int i = 0; i < magazine.size(); i++){hashNums[magazine[i] - 'a']++;}// 遍历字符串ransomNote用哈希数组中统计的字符出现次数减去其中出现次数for(int i = 0; i < ransomNote.size(); i++){hashNums[ransomNote[i] - 'a']--;if(hashNums[ransomNote[i] - 'a'] < 0)return false;}return true;}
};

· 字母异位词分组

题目链接:字母异位词分组

在这里插入图片描述

解题思路:参考:《la bu la dong》

本题也是异位词相关,异位词这类问题的关键在于,如何迅速判断两个字符串是异位词,主要考察我们数据编码和 哈希表的使用:

是否可以找到一种编码方法,使得字母异位词的编码都相同?找到这种编码方式之后,就可以用一个哈希表存储编码相同的所有异位词,得到最终的答案。

242. 有效的字母异位词 考察了异位词的编码问题,对字符串排序可以是一种编码方案,如果是异位词,排序后就变成一样的了,但是这样时间复杂度略高,且会修改原始数据。更好的编码方案是利用每个字符的出现次数进行编码,也就是下面的解法代码。

代码详解:

class Solution {
public:vector<vector<string>> groupAnagrams(vector<string>& strs) {// 建立编码到分组的映射unordered_map<string, vector<string>> encodeToGroup;// 将相同编码的字符串放到一个分组中for(auto& str : strs){// 对字符串进行编码string code = encode(str);// 将相同编码的字符串放到一起encodeToGroup[code].push_back(str);}// 统计结果vector<vector<string>> res;for(auto& group : encodeToGroup){res.push_back(group.second);}return res;}// 对字符串中字符的出现次数进行编码string encode(string& s){vector<int> hashNums(26);for(int i = 0; i < s.size(); i++){hashNums[s[i] - 'a']++;}string code(hashNums.begin(), hashNums.end());return code;}
};

· 两个数组的交集

题目链接:两个数组的交集

在这里插入图片描述

解题思路:

统计两个数组的交集,而且要保证结果中每个元素都是唯一的,所以第一时间想到的是set相关结构。

然后本题很简单,有不理解的地方直接看代码注释就行啦。

代码详解:

class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {// 将nums1中数字存放到集合中unordered_set<int> set;for(int num : nums1){set.insert(num);}// 记录结果unordered_set<int> res;// 遍历数组2进行比较,统计结果for(int num : nums2){if(set.count(num)){res.insert(num);}}return vector<int>(res.begin(), res.end());}
};

· 快乐数

题目链接:快乐数

在这里插入图片描述

解题思路:

题目中说了会 无限循环,那么也就是说求和的过程中,sum会重复出现,这对解题很重要!

当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法。

所以这道题目使用哈希法,来判断这个sum是否重复出现,如果重复了就是return false, 否则一直找到sum为1为止。

代码详解:

class Solution {
public:// 统计数字的每一位的平方和 - 101int getNum(int n){int sum = 0;while(n != 0){sum += (n % 10) * (n % 10);n /= 10;}return sum;}bool isHappy(int n) {// 将计算结果记录到集合当中unordered_set<int> set;while(n != 1){int num = getNum(n);if(set.count(num)){return false;}else{set.insert(num);}n = num;}return true;}
};

· 两数之和

题目链接:两数之和

在这里插入图片描述

解题思路:

对于一个元素 nums[i],想知道有没有另一个元素 nums[j] 的值为 target - nums[i],这很简单,我们用一个哈希表记录每个元素的值到索引的映射,这样就能快速判断数组中是否有一个值为 target - nums[i] 的元素了。

简单说,数组其实可以理解为一个「索引 -> 值」的哈希表映射,而我们又建立一个「值 -> 索引」的映射即可完成此题。

代码详解:

class Solution {
public:vector<int> twoSum(vector<int>& nums, int target) {// 建立值到索引的映射unordered_map<int, int> valToIndex;for(int i = 0; i < nums.size(); i++){// 查哈希表,看是否有能和 nums[i] 凑出 target 的元素int need = target - nums[i];if(valToIndex.count(need)){return {i, valToIndex[need]};}// 存入val->index的映射valToIndex[nums[i]] = i;}    return {-1, -1};}
};

· 四数相加 II

题目链接:四数相加 II

在这里插入图片描述

解题思路:

  1. 首先定义 一个unordered_map,key放a和b两数之和,value 放a和b两数之和出现的次数。
  2. 遍历大A和大B数组,统计两个数组元素之和,和出现的次数,放到map中。
  3. 定义int变量count,用来统计 a+b+c+d = 0 出现的次数。
  4. 在遍历大C和大D数组,找到如果 0-(c+d) 在map中出现过的话,就用count把map中key对应的value也就是出现次数统计出来。
  5. 最后返回统计值 count 就可以了

代码详解:

class Solution {
public:int fourSumCount(vector<int>& nums1, vector<int>& nums2, vector<int>& nums3, vector<int>& nums4) {// 统计数组12所有元素的和及其出现次数unordered_map<int, int> sumToCount;for(int i = 0; i < nums1.size(); i++){for(int j = 0; j < nums2.size(); j++){int sum = nums1[i] + nums2[j];sumToCount[sum]++;}}// 记录符合题意的结果int count = 0;// 遍历数组34寻找符合条件的组合for(int i = 0; i < nums3.size(); i++){for(int j = 0; j < nums4.size(); j++){int sum = nums3[i] + nums4[j];if(sumToCount.count(0 - sum)){count += sumToCount[0-sum];}}}return count;}
};

· 最长连续序列

题目链接:最长连续序列

在这里插入图片描述

解题思路:

这道题最直接的想法就是排序,排序之后连续的序列就很容易找到了。但是排序的时间复杂度是 O(NlogN),而题目要求我们时间复杂度为 O(N),所以我们需要另想办法。

想找连续序列,首先要找到这个连续序列的开头元素,然后递增,看看之后有多少个元素还在 nums 中,即可得到最长连续序列的长度了。

由此我们可以想到用空间换时间的思路,把数组元素放到哈希集合里面,然后去寻找连续序列的第一个元素,即可在 O(N) 时间找到答案。

比方说 nums = [8,4,9,1,3,2],我们先找到 1,然后递增,找到了 2, 3, 4,这就是一个长度为 4 的序列。

代码详情:

class Solution {
public:int longestConsecutive(vector<int>& nums) {// 转化成哈希集合,方便快速判断是否存在某个元素unordered_set<int> set;for (int num : nums) {set.insert(num);}// 记录结果int res = 0;for (int num : set) {if (set.count(num - 1)) {// num 不是连续子序列的第一个,跳过continue;}// num 是连续子序列的第一个,开始继续计算连续子序列的长度int curNum = num;int curLen = 1;while (set.count(curNum + 1)) {curNum += 1;curLen += 1;}// 更新最长连续序列的长度res = max(res, curLen);}return res;}
};

· 查找共用字符

题目链接:查找共用字符

在这里插入图片描述

解题思路:

  • 我们先定义一个哈希数组记录第一个字符串中字符的出现次数
  • 然后再定义一个哈希数组记录其他字符串中字符的出现次数,循环比较取两者较小值,请参考代码注释进行理解
1002.查找常用字符

代码详情:

class Solution {
public:vector<string> commonChars(vector<string>& words) {// 记录结果vector<string> res;// 统计第一个字符串中字符的出现次数int hash[26] = {0};for(int i = 0; i < words[0].size(); i++){hash[words[0][i] - 'a']++;}// 统计出第一个字符串之外的字符串中字符的出现次数int hashOther[26] = {0};for(int i = 1; i < words.size(); i++){memset(hashOther, 0, sizeof(hashOther)); // 别忘记每次都要清空for(int j = 0; j < words[i].size(); j++){hashOther[words[i][j] - 'a']++;}// 和第一个字符串比较,取较小值for(int i = 0; i < 26; i++){hash[i] = min(hash[i], hashOther[i]);}}// 将哈希数组中元素不为0的转换为字符后插入到结果字符串中for(int i = 0; i < 26; i++){// 注意理解为啥是while而不是ifwhile(hash[i] != 0){string str(1, i + 'a');res.push_back(str);hash[i]--;}}return res;}
};

· 同构字符串

题目链接:同构字符串

在这里插入图片描述

解题思路:

字符串没有说都是小写字母之类的,所以用数组不合适了,用map来做映射。

使用两个map 保存 s[i] 到 t[j] 和 t[j] 到 s[i] 的映射关系,如果发现对应不上,立刻返回 false

代码详解:

class Solution {
public:bool isIsomorphic(string s, string t) {// 使用两个map来保存从s[i]到t[j]和从t[j]到s[i]的映射关系unordered_map<char, char> map1;unordered_map<char, char> map2;for(int i = 0, j = 0; i < s.size(); i++, j++){if(map1.find(s[i]) == map1.end()){// map1保存着从s[i]到t[j]的映射map1[s[i]] = t[j];}if(map2.find(t[j]) == map2.end()){// map2保存着从t[j]到s[i]的映射map2[t[j]] = s[i];}// 发现映射 对应不上,立刻返回falseif(map1[s[i]] != t[j] || map2[t[j]] != s[i])return false;}return true;}
};// 思路2: 可以仿照单词规律的思路,请题请看下一题
class Solution {
public:bool isIsomorphic(string s, string t) {if(s.size() != t.size()){return false;}unordered_map<char,char> map; // 建立字符到字符的映射unordered_set<char> hasWord; // 记录有字符映射字符for(int i = 0; i < s.size(); i++){if(!map.count(s[i])){if(hasWord.count(t[i])){return false;}map[s[i]] = t[i];}else{if(map[s[i]] != t[i]){return false;}}hasWord.insert(t[i]);}return true;}
};

· 单词规律

题目链接:单词规律

在这里插入图片描述

解题思路:

利用哈希表,把 pattern 中的每个叠词模式字符在 s 中的对应单词记录下来,就能判断 s 是否匹配 pattern 的模式了。

具体请看代码详解:

class Solution {
public:bool wordPattern(string pattern, string s) {vector<string> words;stringstream ss(s);string str;while(getline(ss, str, ' ')){words.push_back(str);}// 注意这一条判断语句,别忘记了if(pattern.size() != words.size()){return false;}// 建立字符到字符串的映射unordered_map<char, string> patternToStr;// 记录已经有字符对应的字符串unordered_set<string> hasWord;for(int i = 0; i < pattern.size(); i++){char c = pattern[i]; string word = words[i];// 该字符还没有建立对应的单词映射if(!patternToStr.count(c)){// 但是与之对应的单词却有自己的字符了if(hasWord.count(word)){return false;}   // 建立该字符到单词的映射patternToStr[c] = word;}else // 该字符已经有对应的单词了{   // 如若该字符所对应的单词与实际不符if(patternToStr[c] != word){return false;}}hasWord.insert(word);}return true;}
};

· 字节跳动面试:缺失的第一个正数

题目链接:缺失的第一个正数

在这里插入图片描述

解题思路:

理想情况下每个元素都在自己的位置上,如下:

alt

现在将元素对应位置打乱,并且缺失了一个元素,如下:

alt

题目就是要求我们找到这个缺失的元素,我们该如何找呢?

注意:首先我们需要遍历数组中的每一个元素,比如nums[i],我们将以nums[i]为下标的元素中的值置换为其绝对值的相反数,也就是做标记。(做这道题目的时候一定要画图来理解)

像下面这样:

nums[1] = 3,将3这个位置做标记:

alt

nums[2] = 1,将1这个位置做标记:

alt

nums[3] = 5,将5这个位置做标记:

alt

nums[4] = 1,将1这个位置做标记:

alt

nums[5] = 6,将6这个位置做标记:

alt

nums[6] = 4,将4这个位置做标记:

alt

现在我们看到,只有2这个位置是没有做标记的,所以2就是所求。

温馨提示:可能比较难以理解,一定要自己动手画图去理解。

所以想到这一步的话,那么这道题目前的难点就是怎么做标记了,OK接着看:

首先,我们遍历数组将数组中值为非正整数的元素全部忽略,什么意思呢就是将其值全部映射到n之外,所以我们遍历一遍数组,将值为负数和值为0的元素全部赋值为n+1;

接下来就是,遍历数组中的每一个元素nums[i],先判断其值是否大于n,若大于,则说明其之前是非正整数,忽略它,继续向后遍历;反之,则将以nums[i]为下标的值置换为其绝对值的相反数(因为可能有两个相同的元素,注意画图理解)。

最后再遍历数组中的每一个元素,值不为负数,其下标就是题目所求。

题目详解:

class Solution {
public:int firstMissingPositive(vector<int>& nums) {   int n = nums.size();// 将数组中的非正整数元素忽略,即是映射到n之外for(int i = 0; i < n; i++){if(nums[i] <= 0){nums[i] = n + 1;}}// 遍历数组中的元素,将以元素的值为对应的下标里的元素取其绝对值的相反数,也就是做标记for(int i = 0; i < n; i++){if(abs(nums[i]) <= n) // 说明是正整数{nums[abs(nums[i]) - 1] = -abs(nums[abs(nums[i]) - 1]);}}// 遍历数组中的元素,元素值不为负数的其下标就是答案for(int i = 0; i < n; i++){if(nums[i] > 0){return i + 1;}}return n + 1;}
};

遇见安然遇见你,不负代码不负卿。
谢谢老铁时间,咱们下篇见~

这篇关于蓝桥杯算法竞赛系列第九章·巧解哈希题,用这3种数据类型足矣的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/364551

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

哈希leetcode-1

目录 1前言 2.例题  2.1两数之和 2.2判断是否互为字符重排 2.3存在重复元素1 2.4存在重复元素2 2.5字母异位词分组 1前言 哈希表主要是适合于快速查找某个元素(O(1)) 当我们要频繁的查找某个元素,第一哈希表O(1),第二,二分O(log n) 一般可以分为语言自带的容器哈希和用数组模拟的简易哈希。 最简单的比如数组模拟字符存储,只要开26个c

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

usaco 1.3 Prime Cryptarithm(简单哈希表暴搜剪枝)

思路: 1. 用一个 hash[ ] 数组存放输入的数字,令 hash[ tmp ]=1 。 2. 一个自定义函数 check( ) ,检查各位是否为输入的数字。 3. 暴搜。第一行数从 100到999,第二行数从 10到99。 4. 剪枝。 代码: /*ID: who jayLANG: C++TASK: crypt1*/#include<stdio.h>bool h

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl