[100天算法】-面试题 17.17.多次搜索(day 43)

2023-10-28 05:28

本文主要是介绍[100天算法】-面试题 17.17.多次搜索(day 43),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

题目描述

给定一个较长字符串big和一个包含较短字符串的数组smalls,设计一个方法,根据smalls中的每一个较短字符串,对big进行搜索。输出smalls中的字符串在big里出现的所有位置positions,其中positions[i]为smalls[i]出现的所有位置。示例:输入:
big = "mississippi"
smalls = ["is","ppi","hi","sis","i","ssippi"]
输出: [[1,4],[8],[],[3],[1,4,7,10],[5]]
提示:0 <= len(big) <= 1000
0 <= len(smalls[i]) <= 1000
smalls的总字符数不会超过 100000。
你可以认为smalls中没有重复字符串。
所有出现的字符均为英文小写字母。来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/multi-search-lcci
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

方法 1:Trie

思路

用 Trie 有两个思路方向,一个是把 big 存进 Trie 中,另一个是把 smalls 存进 Trie 中。

但由于 Trie 这种数据结构非常消耗空间,所以,当我们要在一个长字符串中查找短字符串时,正确的直觉应该是把短字符串存到 Trie 中,保证 Trie 的高度要尽量的小。

  • 以 smalls 数组构建 Trie,并在结束节点记录每个短串在 smalls 数组中的下标;
  • 遍历 big,截取所有以 longest 为长度的子串(longest 是 smalls 中最长的单词长度),拿到 Trie 中去寻找所有匹配的短串,返回所有匹配到的下标,根据下标把当前子串的位置更新到对应的结果数组中。

截取 longest 长度的字符子串这步并不是必须,但 JS 中函数参数是按值传递的,所以如果每次都传整个 big 字符串,感觉是不是也有点消耗空间?

复杂度分析

时间空间
insertO(len(smalls)∗avg) avg 是短串的平均长度O(navg) n 是字符集大小,avg 是短串的平均长度
searchO(maxLen(smalls)∗len(smalls))O(nm)

代码

Trie 的修改:

  • insert: 把单词的下标存在最后的节点中
  • search: 需要返回寻找路径中匹配到的所有单词的下标

TypeScript Code

search(word: string): Array<number> {let crawl: TrieNode = this.rootconst res: Array<number> = []for (let char of word) {const index: number = this._char2Index(char)if (!crawl.children[index]) return rescrawl = crawl.children[index]if (crawl.pos > -1) res.push(crawl.pos)}return res
}

TypeScript Code

function multiSearch(big: string, smalls: string[]): number[][] {// 把短字符串存进 Trieconst trie: Trie = new Trie();smalls.forEach((word: string, index: number): void => {trie.insert(word, index);});const res: number[][] = Array(smalls.length).fill(0).map(() => []);// 找到 smalls 中最长字符串长度const longest: number = smalls.reduce((res: number, word: string): number => Math.max(res, word.length),0,);// 遍历 big,将以 longest 为长度的子串拿到 Trie 中去找有没有匹配的短串// 有的话,会返回那个短串在 smalls 中对应的下标,那就把子串对应的开始下标 i 存在对应的结果数组里好了for (let i = 0; i < big.length; i++) {const indices = trie.search(big.slice(i, i + longest));indices.forEach(index => res[index].push(i));}return res;
}

方法 2:暴力法

思路

又写了下暴力法,先找出 smalls 中最长的单词长度 longest,遍历 big,然后在第二层循环中,枚举所有长度小于 longest 的子串,跟 smalls 中的词一一对比。

代码

JavaScript

/*** @param {string} big* @param {string[]} smalls* @return {number[][]}*/
function multiSearch(big, smalls) {const longest = smalls.reduce((res, w) => Math.max(res, w.length), 0);const res = Array(smalls.length).fill(0).map(() => []);for (let i = 0; i < big.length; i++) {for (let j = i + 1; j <= i + longest && j <= big.length; j++) {const subStr = big.slice(i, j);for (let k = 0; k < smalls.length; k++) {if (smalls[k] === subStr) {res[k].push(i);}}}}return res;
}

这篇关于[100天算法】-面试题 17.17.多次搜索(day 43)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/290989

相关文章

C# ComboBox下拉框实现搜索方式

《C#ComboBox下拉框实现搜索方式》文章介绍了如何在加载窗口时实现一个功能,并在ComboBox下拉框中添加键盘事件以实现搜索功能,由于数据不方便公开,作者表示理解并希望得到大家的指教... 目录C# ComboBox下拉框实现搜索步骤一步骤二步骤三总结C# ComboBox下拉框实现搜索步骤一这

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

hdu1240、hdu1253(三维搜索题)

1、从后往前输入,(x,y,z); 2、从下往上输入,(y , z, x); 3、从左往右输入,(z,x,y); hdu1240代码如下: #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#inc

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO

day-51 合并零之间的节点

思路 直接遍历链表即可,遇到val=0跳过,val非零则加在一起,最后返回即可 解题过程 返回链表可以有头结点,方便插入,返回head.next Code /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode() {}*