早上好,我的leetcode 【hash】(第二期)

2023-12-17 15:30

本文主要是介绍早上好,我的leetcode 【hash】(第二期),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

写在前面:坚持才是最难的事情

C++代码还是不方便写,改用python了,TAT


文章目录

  • 1.两数之和
  • 49. 字母异位词分组
  • 128.最长连续序列

1.两数之和

你好,梦开始的地方~

在这里插入图片描述
https://leetcode.cn/problems/two-sum/description/?envType=study-plan-v2&envId=top-100-liked

直接两个for循环

class Solution {
public:vector<int> twoSum(vector<int>& nums, int target) {int size = nums.size();for (int i = 0; i < size; i++ ){for (int j = i + 1; j < size; j++){if (nums[i] + nums[j] == target){return {i ,j};}}}return {};}
};

时间复杂度:O( N 2 N^2 N2),其中N是数组中的元素数量。最坏情况下数组中任意两个数都要被匹配一次
空间复杂度:O (1)。

最容易想到的方法是枚举数组中的每一个数 x,寻找数组中是否存在 target - x。方法一的时间复杂度较高的原因是寻找 target - x 的时间复杂度过高。因此,我们需要一种更优秀的方法,能够快速寻找数组中是否存在目标元素。如果存在,我们需要找出它的索引。

class Solution {
public:vector<int> twoSum(vector<int>& nums, int target) {unordered_map<int, int> hashtable;for (int i = 0; i < nums.size(); ++i){auto it = hashtable.find(target - nums[i]);// 如果找到了就返回if (it != hashtable.end()){return {it->second, i};}// 都保存这个数的位置hashtable[nums[i]] = i;}return {};}
};

49. 字母异位词分组

在这里插入图片描述
https://leetcode.cn/problems/group-anagrams/description/?envType=study-plan-v2&envId=top-100-liked

思路:将字符串排序,字符串排序后相同的放在一起

由于互为字母异位词的两个字符串包含的字母相同,因此对两个字符串分别进行排序之后得到的字符串一定是相同的,故可以将排序之后的字符串作为哈希表的键。

class Solution {
private:unordered_map<string, vector<string>> hash;vector<vector<string>> ans;
public:vector<vector<string>> groupAnagrams(vector<string>& strs) {for (const auto& str : strs){string tmp = str;sort(tmp.begin(), tmp.end());hash[tmp].emplace_back(str);}for (const auto& one: hash){ans.emplace_back(one.second);}return ans;}
};

时间复杂度 : O ( n k log ⁡ k ) :O(nk\log k) :O(nklogk),其中 n n n s t r s strs strs 中的字符串的数量, k k k s t r s strs strs 中的字符串的的最大长度。需要遍历 n n n 个字符串,对于每个字符串,需要 O ( k log ⁡ k ) O(k\log k) O(klogk) 的时间进行排序以及 O ( 1 ) O(1) O(1) 的时间更新哈希表,因此总时间复杂度是 O ( n k log ⁡ k ) O(nk\log k) O(nklogk)

空间复杂度: O ( n k ) O(nk) O(nk),其中 n n n s t r s strs strs 中的字符串的数量, k k k s t r s strs strs 中的字符串的的最大长
度。需要用哈希表存储全部字符串。


方法二:计数
由于互为字母异位词的两个字符串包含的字母相同,因此两个字符串中的相同字母出现的次数一定是相同的,故可以将每个字母出现的次数使用字符串表示,作为哈希表的键。

由于字符串只包含小写字母,因此对于每个字符串,可以使用长度为 26 的数组记录每个字母出现的次数。、

还是python写比较方便,C++太不熟悉了TAT

class Solution(object):def groupAnagrams(self, strs):""":type strs: List[str]:rtype: List[List[str]]"""mp = collections.defaultdict(list);for st in strs:# 记录字母出现的次数counts = [0] * 26for ch in st:# 字母出现记录+1# ord() 函数返回一个字符的Unicode码点,因此 ord(ch) 返回字符 ch 的Unicode码点counts[ord(ch) - ord("a")] += 1# 两个字符串中的相同字母出现的次数一定是相同的,放在一起mp[tuple(counts)].append(st)return list(mp.values())

时间复杂度 : O ( n ( k + ∣ Σ ∣ ) ) :O(n(k+|\Sigma|)) :O(n(k+∣Σ∣)),其中 n n n s t r s strs strs 中的字符串的数量, k k k s t r s strs strs 中的字符串的的最大长度,Σ 是字符集,在本题中字符集为所有小写字母, ∣ Σ ∣ = 26 |\Sigma|=26 ∣Σ∣=26。需要遍历 n n n 个字符串,对于每个字符串,需要 O ( k ) O(k) O(k) 的时间计算每个字母出现的次数, O ( ∣ Σ ∣ ) O(|\Sigma|) O(∣Σ∣) 的时间生成哈希表的键, 以及 O ( 1 ) O(1) O(1) 的时间更新哈希表,
因此总时间复杂度是 O ( n ( k + ∣ Σ ∣ ) ) O(n(k+|\Sigma|)) O(n(k+∣Σ∣))

空间复杂度: O ( n ( k + ∣ Σ ∣ ) ) O(n(k+|\Sigma|)) O(n(k+∣Σ∣)),其中 n n n s t r s strs strs 中的字符串的数量, k k k s t r s strs strs 中的字符串的最大
长度,Σ 是字符集,在本题中字符集为所有小写字母, ∣ Σ ∣ = 26 |\Sigma|=26 ∣Σ∣=26。需要用哈希表存储全部字符串,而记录每个字符串中每个字母出现次数的数组需要的空间为 O ( ∣ Σ ∣ ) O(|\Sigma|) O(∣Σ∣), 在渐进意义下小于 O ( n ( k + ∣ Σ ∣ ) ) O(n(k+|\Sigma|)) O(n(k+∣Σ∣)),忽略不计。

128.最长连续序列

在这里插入图片描述
https://leetcode.cn/problems/longest-consecutive-sequence/description/?envType=study-plan-v2&envId=top-100-liked

我们考虑枚举数组中的每个数 x x x,考虑以其为起点,不断尝试匹配 x + 1 , x + 2 , ⋯ x+1,x+2,\cdots x+1,x+2,是否存在,假设最长匹配到了 x + y x+y x+y,那么以 x x x 为起点的最长连续序列即为 x , x + 1 , x + 2 , ⋯ , x + y x,x+1,x+2,\cdots,x+y x,x+1,x+2,,x+y, 其长度为
y + 1 y+1 y+1, 我们不断枚举并更新答案即可。

对于匹配的过程,暴力的方法是 O ( n ) O(n) O(n) 遍历数组去看是否存在这个数,但其实更高效的方法是用一
个哈希表存储数组中的数,这样查看一个数是否存在即能优化至 O ( 1 ) O(1) O(1) 的时间复杂度。

仅仅是这样我们的算法时间复杂度最坏情况下还是会达到 O ( n 2 ) O(n^2) O(n2)
即外层需要枚举 O ( n ) O(n) O(n) 个数,内层需要暴力匹配 O ( n ) O(n) O(n) 次), 无法满足题目的要求。

但仔细分析这个过程,我们会发现其中执行了很多不必要的枚举,如果已知有一个 x , x + 1 , x + 2 , ⋯ , x + y x,x+1,x+2,\cdots,x+y x,x+1,x+2,,x+y 的连续序列,而我们却重新从 x + 1 x+1 x+1 , x + 2 x+2 x+2 或者是 x + y x+y x+y 处开始尝试匹配,那么得到的结果肯定不会优于枚举 x x x 为起点的答案,因此我们在外层循环的时候碰到这种情况跳过即可。

那么怎么判断是否跳过呢? 由于我们要枚举的数 x x x一定是在数组中不存在前驱数 x − 1 x- 1 x1的,不然按
照上面的分析我们会从 x − 1 x-1 x1 开始尝试匹配,因此我们每次在哈希表中检查是否存在 x − 1 x-1 x1 即能判断是否需要跳过了。

class Solution(object):def longestConsecutive(self, nums):""":type nums: List[int]:rtype: int"""longest_streak = 0num_set = set(nums)for num in num_set:if num - 1 not in num_set:current_num = numcurrent_streak = 1while current_num + 1 in num_set:current_num += 1current_streak += 1longest_streak = max(longest_streak, current_streak)return longest_streak    

时间复杂度: O ( n ) O(n) O(n),其中 n n n 为数组的长度。具体分析已在上面正文中给出。
空间复杂度: O ( n ) O(n) O(n)。哈希表存储数组中所有的数需要 O ( n ) O(n) O(n) 的空间。

在 Python 中,使用 in 操作符来判断元素是否存在于 set 中,其平均时间复杂度是 O(1)。这是因为 set 是基于哈希表实现的,在大多数情况下,通过哈希函数将元素映射到哈希表的特定位置,可以在常数时间内进行查找操作。当然,如果出现哈希冲突,时间复杂度可以增高到 O(n)。但是在平均情况下,查询元素是否在 set 中仍然是效率很高的操作。

这篇关于早上好,我的leetcode 【hash】(第二期)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/504875

相关文章

Redis的Hash类型及相关命令小结

《Redis的Hash类型及相关命令小结》edisHash是一种数据结构,用于存储字段和值的映射关系,本文就来介绍一下Redis的Hash类型及相关命令小结,具有一定的参考价值,感兴趣的可以了解一下... 目录HSETHGETHEXISTSHDELHKEYSHVALSHGETALLHMGETHLENHSET

哈希leetcode-1

目录 1前言 2.例题  2.1两数之和 2.2判断是否互为字符重排 2.3存在重复元素1 2.4存在重复元素2 2.5字母异位词分组 1前言 哈希表主要是适合于快速查找某个元素(O(1)) 当我们要频繁的查找某个元素,第一哈希表O(1),第二,二分O(log n) 一般可以分为语言自带的容器哈希和用数组模拟的简易哈希。 最简单的比如数组模拟字符存储,只要开26个c

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

usaco 1.2 Milking Cows(类hash表)

第一种思路被卡了时间 到第二种思路的时候就觉得第一种思路太坑爹了 代码又长又臭还超时!! 第一种思路:我不知道为什么最后一组数据会被卡 超时超了0.2s左右 大概想法是 快排加一个遍历 先将开始时间按升序排好 然后开始遍历比较 1 若 下一个开始beg[i] 小于 tem_end 则说明本组数据与上组数据是在连续的一个区间 取max( ed[i],tem_end ) 2 反之 这个

uva 10029 HASH + DP

题意: 给一个字典,里面有好多单词。单词可以由增加、删除、变换,变成另一个单词,问能变换的最长单词长度。 解析: HASH+dp 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#inc

整数Hash散列总结

方法:    step1  :线性探测  step2 散列   当 h(k)位置已经存储有元素的时候,依次探查(h(k)+i) mod S, i=1,2,3…,直到找到空的存储单元为止。其中,S为 数组长度。 HDU 1496   a*x1^2+b*x2^2+c*x3^2+d*x4^2=0 。 x在 [-100,100] 解的个数  const int MaxN = 3000

leetcode-24Swap Nodes in Pairs

带头结点。 /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode(int x) { val = x; }* }*/public class Solution {public ListNode swapPairs(L