30. 串联所有单词的子串【 力扣(LeetCode) 】

2024-08-20 17:28

本文主要是介绍30. 串联所有单词的子串【 力扣(LeetCode) 】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、题目描述

给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串 长度相同。

s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。

例如,如果 words = [“ab”,“cd”,“ef”], 那么 “abcdef”, “abefcd”,“cdabef”, “cdefab”,“efabcd”, 和 “efcdab” 都是串联子串。 “acdbef” 不是串联子串,因为他不是任何 words 排列的连接。
返回所有串联子串在 s 中的开始索引。你可以以 任意顺序 返回答案。

二、测试用例

示例 1:

输入:s = "barfoothefoobarman", words = ["foo","bar"]
输出:[0,9]
解释:因为 words.length == 2 同时 words[i].length == 3,连接的子字符串的长度必须为 6。
子串 "barfoo" 开始位置是 0。它是 words 中以 ["bar","foo"] 顺序排列的连接。
子串 "foobar" 开始位置是 9。它是 words 中以 ["foo","bar"] 顺序排列的连接。
输出顺序无关紧要。返回 [9,0] 也是可以的。

示例 2:

输入:s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
输出:[]
解释:因为 words.length == 4 并且 words[i].length == 4,所以串联子串的长度必须为 16。
s 中没有子串长度为 16 并且等于 words 的任何顺序排列的连接。
所以我们返回一个空数组。

示例 3:

输入:s = "barfoofoobarthefoobarman", words = ["bar","foo","the"]
输出:[6,9,12]
解释:因为 words.length == 3 并且 words[i].length == 3,所以串联子串的长度必须为 9。
子串 "foobarthe" 开始位置是 6。它是 words 中以 ["foo","bar","the"] 顺序排列的连接。
子串 "barthefoo" 开始位置是 9。它是 words 中以 ["bar","the","foo"] 顺序排列的连接。
子串 "thefoobar" 开始位置是 12。它是 words 中以 ["the","foo","bar"] 顺序排列的连接。

提示:

1 <= s.length <= 104
1 <= words.length <= 5000
1 <= words[i].length <= 30
words[i] 和 s 由小写英文字母组成

三、解题思路

  1. 基本思路:
      多层滑动窗口
  2. 具体思路:
    • 定义:ans 用于存放答案;use 用于存放 words 中单词出现的频率;use_temp 表示在每一层滑动窗口中初始的单词频率,初始化为 uselen 表示每个单词长度;c 表示单词数量;n 表示字符串长度
    • 遍历层数:第 i 层表示从 i 个字符开始,由 len 个字符组成的单词序列,小于 len 长度则舍弃。【例如 len=3,字符串为 "abcdefghij" ,则第 1 层表示 bcdefghij 三个单词,第 2 层表示 cdefgh 两个单词】
    • 每层的滑动窗口:定义变量 startend 表示首单词和尾单词。每次变量该层的单词序列,在滑动窗口的尾部加入一个单词,判断该单词是否还有剩余的频率,有则频率 -1 ,如果为 0 ,则删去 ;没有则滑动窗口从头部开始舍弃单词,每舍弃一个单词,该单词频率 +1 ,一直丢弃到 尾部单词有空位 或 者滑动窗口为空 为止。一旦每层的单词频率 use_temp 为空,则表示所有单词都用到了,则把首单词的下标加入到答案中。
      use_temp 为空可以保证滑动窗口内所有单词都是由 words 的单词组成的,证明:如果不是,那么存在两种情况,一是出现了 words 里面没有出现的单词,二是出现了 words 里面有的单词,但是频率超了;
      • 对于第一种情况来说:出现了不存在的单词,use_temp 里面没有该单词的频率,就会进行从头部舍弃单词,一直舍弃到该单词有空位,而该单词有空位的情况是不可能满足的,所以会一直舍弃到滑动窗口为空为止,所以该单词也会被舍弃。
      • 对于第二种情况来说,一旦频率不够,就会进行舍弃,所以不可能会出现滑动窗口里面的单词频率超过的可能。】
    • 返回结果 ans

四、参考代码

时间复杂度: O ( n ∗ l e n ) \Omicron(n*len) O(nlen) 字符串长度 * 层数
空间复杂度: O ( c ∗ l e n ) \Omicron(c*len) O(clen) map 的空间

class Solution {
public:map<string, int> init(vector<string> words) {int n = words.size();map<string, int> ans;for (int i = 0; i < n; i++) ans[words[i]]++;return ans;}vector<int> findSubstring(string s, vector<string>& words) {int n = s.length();int c = words.size(), len = words[0].length();vector<int> ans;map<string, int> use = init(words);for (int i = 0; i < len; i++) {map<string, int> use_temp = use;for (int j = i, k = i; k < n;) {string end = s.substr(k, len);string start = s.substr(j, len);if (use_temp.count(end) == 1) {use_temp[end]--;if (use_temp[end] == 0)use_temp.erase(end);k += len;} else {while (start != end && j <= k) {use_temp[start]++;start = s.substr(j += len, len);}j += len;k += len;}if (use_temp.empty()) {ans.push_back(j);}}}return ans;}
};

这篇关于30. 串联所有单词的子串【 力扣(LeetCode) 】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1090706

相关文章

TP-Link PDDNS服将于务6月30日正式停运:用户需转向第三方DDNS服务

《TP-LinkPDDNS服将于务6月30日正式停运:用户需转向第三方DDNS服务》近期,路由器制造巨头普联(TP-Link)在用户群体中引发了一系列重要变动,上个月,公司发出了一则通知,明确要求所... 路由器厂商普联(TP-Link)上个月发布公告要求所有用户必须完成实名认证后才能继续使用普联提供的 D

使用Navicat工具比对两个数据库所有表结构的差异案例详解

《使用Navicat工具比对两个数据库所有表结构的差异案例详解》:本文主要介绍如何使用Navicat工具对比两个数据库test_old和test_new,并生成相应的DDLSQL语句,以便将te... 目录概要案例一、如图两个数据库test_old和test_new进行比较:二、开始比较总结概要公司存在多

在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码

《在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码》在MyBatis的XML映射文件中,trim元素用于动态添加SQL语句的一部分,处理前缀、后缀及多余的逗号或连接符,示... 在MyBATis的XML映射文件中,<trim>元素用于动态地添加SQL语句的一部分,例如SET或W

C#实现获得某个枚举的所有名称

《C#实现获得某个枚举的所有名称》这篇文章主要为大家详细介绍了C#如何实现获得某个枚举的所有名称,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... C#中获得某个枚举的所有名称using System;using System.Collections.Generic;usi

通过C#获取PDF中指定文本或所有文本的字体信息

《通过C#获取PDF中指定文本或所有文本的字体信息》在设计和出版行业中,字体的选择和使用对最终作品的质量有着重要影响,然而,有时我们可能会遇到包含未知字体的PDF文件,这使得我们无法准确地复制或修改文... 目录引言C# 获取PDF中指定文本的字体信息C# 获取PDF文档中用到的所有字体信息引言在设计和出

mysql-8.0.30压缩包版安装和配置MySQL环境过程

《mysql-8.0.30压缩包版安装和配置MySQL环境过程》该文章介绍了如何在Windows系统中下载、安装和配置MySQL数据库,包括下载地址、解压文件、创建和配置my.ini文件、设置环境变量... 目录压缩包安装配置下载配置环境变量下载和初始化总结压缩包安装配置下载下载地址:https://d

哈希leetcode-1

目录 1前言 2.例题  2.1两数之和 2.2判断是否互为字符重排 2.3存在重复元素1 2.4存在重复元素2 2.5字母异位词分组 1前言 哈希表主要是适合于快速查找某个元素(O(1)) 当我们要频繁的查找某个元素,第一哈希表O(1),第二,二分O(log n) 一般可以分为语言自带的容器哈希和用数组模拟的简易哈希。 最简单的比如数组模拟字符存储,只要开26个c

poj2406(连续重复子串)

题意:判断串s是不是str^n,求str的最大长度。 解题思路:kmp可解,后缀数组的倍增算法超时。next[i]表示在第i位匹配失败后,自动跳转到next[i],所以1到next[n]这个串 等于 n-next[n]+1到n这个串。 代码如下; #include<iostream>#include<algorithm>#include<stdio.h>#include<math.

poj3261(可重复k次的最长子串)

题意:可重复k次的最长子串 解题思路:求所有区间[x,x+k-1]中的最小值的最大值。求sa时间复杂度Nlog(N),求最值时间复杂度N*N,但实际复杂度很低。题目数据也比较水,不然估计过不了。 代码入下: #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstring

spoj705( 求不相同的子串个数)

题意:求串s的不同子串的个数 解题思路:任何子串都是某个后缀的前缀,对n个后缀排序,求某个后缀的前缀的个数,减去height[i](第i个后缀与第i-1 个后缀有相同的height[i]个前缀)。 代码如下: #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstrin