代码随想录算法训练营第九天 | KMP更精良总结

2024-01-08 04:20

本文主要是介绍代码随想录算法训练营第九天 | KMP更精良总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

字符串问题:寻找文本串S中是否存在模式串P

暴力法

时间复杂度O(n x m)
第1轮:指针i扫描文本串S、指针j扫描模式串P,同时从索引0开始向右扫描对比。直到S[i] != P[j],如下图过程(2)。
在这里插入图片描述
第2轮:i回到索引1、j仍回到索引0,如下图过程(3),同时开始向右扫描对比。若遇到S[i] != P[j],i回到索引2、j仍回到索引0。
重复若干轮,直到扫描完整个P,都保持S[i] == P[j],如下图过程(4),说明文本串S中存在模式串P。
在这里插入图片描述

KMP法

指针i扫描文本串S、指针j扫描模式串P,同时从索引0开始向右扫描对比。直到索引5,此时S[i] != P[j],如下图过程(1)。

此时,希望通过前缀表next[j-1]找到字符串P[0 – j-1]中的最大相等前后缀:

  • !!next[j-1] 的定义:表示在数组P[0 – j-1]中存在的最长相等前后缀的长度,假设next[j-1] = t,那么P[0 – t-1] == P[j-t – j-1]
  • !!这么做的目的:若能在P[0 – j-1]中找到最长相等前后缀(假设前缀长度=后缀长度=next[j-1]=t),此时P[0 – t-1] == P[j-t – j-1] == S[i-t – i-1],那么i就可以从索引5、j从索引t开始继续扫描,如下图过程(2);若未能找到最长相等前后缀,那么i从索引5、j从索引0继续扫描。
    在这里插入图片描述

求next数组

先看代码理解过程,不懂的继续看下面讲解。代码过程如下,

假设模式串P=“abxabcabxabx”

void getNext(int* next, const string& P) {	//模式串P/*j为前缀后一位置(如上面P中的字符c位置),前缀为P[0 -- j-1]="abxab"i为后缀后一位置(如上面P中的最后一个字符x位置),后缀为P[i-j -- i-1]="abxab"前后缀长度均为j,j在while循环中会变*/int j = 0;	//j为前缀后一位置,前缀从模式串首字符开始next[0] = 0;	//0的位置只能回退到0/*指针i遍历模式串P*/for(int i = 1; i < P.size(); i++) {	//i为后缀后一位置,因为后缀不包含首字母,所以从1开始/*前后缀后一位置不相同:j要向前回退,看前一位的前缀表的数值,就是要回退的下标,因为要找前面字符串的最长相等前后缀长度*//*j要一直回退,直到前后缀后一位置一致,即P[i]==P[j],此时P[i-1]==P[j-1]、P[i-2]==P[j-2]、...、P[0]==P[j-i]*/while (j > 0 && P[i] != P[j]) { // j要保证大于0,因为下面有取j-1作为数组下标的操作j = next[j - 1]; // 注意这里,是要找前一位的对应的回退位置。如果一直回退,只能退到next[0],故上面写j>0。}/*前后缀后一位置相同的情况*/if (P[i] == P[j]) { j++;   			}/*更新next数组的值*/next[i] = j;}
}

求next数组就是在用KMP,把P[0 – j]看成模式串、P[1 – i]看成文本串。每次求next[i],可看作模式串与文本串的一次匹配,在该过程中可用之前所求的next。①文本串一直是每次for循环+1,不会回退。②模式串有时可通过next数组的功能,跳过前几个字符进行比较。

在匹配过程中(即判断P[j]和P[i]是否相等,即while循环):无论P[j]是否等于P[i],P[0 – j-1]始终等于P[i-j – i-1]。但j的大小并非始终不变的,最开始j=next[i-1],即字符串P[0 – i-1]的最长相等前后缀长度;若不匹配则进入while循环,此时j=next[j-1];若仍不匹配,则继续递归,继续j=next[j-1]。

  • 若不匹配即P[j] != P[i],j就一直往回退,退到j=0或匹配P[j] == P[i] 为止。 回退过程属于递归过程,当不匹配回退一步时,此时j=next[j],继续匹配。若最终未匹配,那么j = 0,即next[i] = j = 0。
  • 若匹配即P[j] == P[i],由于前提条件P[0 – j-1] == P[i-j – i-1],可得P[0 – j] == P[i-j – i],那么字符串P[0 – i]的最长相等前后缀长度next[i] = j - 0 = i - (i - j) = j。

举例:模式串P=“abxabcabxabx”
当i=11、j=5时,P[j]=‘c’,P[i]=‘x’,匹配失败,虽然之前已经匹配成功abxab。此时,通过j=next[j-1]=2,使P[j]=‘x’=P[i],匹配成功。

整体代码

!!!在两份代码中,i扫描文本串,j扫描模式串

/*获取next数组*/
void getNext(int* next, const string& P) {	//模式串Pint j = 0;	next[0] = 0;for(int i = 1; i < P.size(); i++) {	//!!后缀,文本串/*前后缀后一位置不相同:j要向前回退,看前一位的前缀表的数值,就是要回退的下标*/while (j > 0 && P[i] != P[j]) { //!!前缀,模式串j = next[j - 1]; }/*前后缀后一位置相同的情况*/if (P[i] == P[j]) { j++;   			}/*更新next数组的值*/next[i] = j;}
}
/*文本串S中是否存在模式串P*/
int strStr(string S, string P) {	//文本串S、模式串P/*构建前缀表即next数组*/int next[P.size()];getNext(next, P);//指针i遍历文本串S,指针j遍历模式串Pint j = 0;for (int i = 0; i < S.size(); i++) {// 文本串/*当S[i]!=P[j]时,j要不断回退到下标为【前一个字符的前缀表的数值】的位置,直到S[i]==P[j]*/while(j > 0 && S[i] != P[j]) {	// 模式串j = next[j - 1];			}//若S[i]==P[j],两个指针同时右移if (S[i] == P[j]) {		j++;}// 当指针j遍历完模式串P,即在文本串S中找到第一个与模式串P相等的字符串,此时i指向该字符串最后一个字符的后一位置if (j == P.size() ) {	return (i - P.size() + 1);	//返回该字符串的首字符位置}}return -1;	// 若文本串S中不存在模式串P,则返回-1
}

KMP复杂度

n为文本串长度,m为模式串长度,因为在匹配的过程中,根据前缀表不断调整匹配的位置,可以看出匹配的过程是O(n),之前还要单独生成next数组,时间复杂度是O(m)。所以整个KMP算法的时间复杂度是O(n+m)的。空间复杂度O(m)。

这篇关于代码随想录算法训练营第九天 | KMP更精良总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/582296

相关文章

Kubernetes常用命令大全近期总结

《Kubernetes常用命令大全近期总结》Kubernetes是用于大规模部署和管理这些容器的开源软件-在希腊语中,这个词还有“舵手”或“飞行员”的意思,使用Kubernetes(有时被称为“... 目录前言Kubernetes 的工作原理为什么要使用 Kubernetes?Kubernetes常用命令总

python实现pdf转word和excel的示例代码

《python实现pdf转word和excel的示例代码》本文主要介绍了python实现pdf转word和excel的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、引言二、python编程1,PDF转Word2,PDF转Excel三、前端页面效果展示总结一

在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码

《在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码》在MyBatis的XML映射文件中,trim元素用于动态添加SQL语句的一部分,处理前缀、后缀及多余的逗号或连接符,示... 在MyBATis的XML映射文件中,<trim>元素用于动态地添加SQL语句的一部分,例如SET或W

使用C#代码计算数学表达式实例

《使用C#代码计算数学表达式实例》这段文字主要讲述了如何使用C#语言来计算数学表达式,该程序通过使用Dictionary保存变量,定义了运算符优先级,并实现了EvaluateExpression方法来... 目录C#代码计算数学表达式该方法很长,因此我将分段描述下面的代码片段显示了下一步以下代码显示该方法如

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

Python中实现进度条的多种方法总结

《Python中实现进度条的多种方法总结》在Python编程中,进度条是一个非常有用的功能,它能让用户直观地了解任务的进度,提升用户体验,本文将介绍几种在Python中实现进度条的常用方法,并通过代码... 目录一、简单的打印方式二、使用tqdm库三、使用alive-progress库四、使用progres

python多进程实现数据共享的示例代码

《python多进程实现数据共享的示例代码》本文介绍了Python中多进程实现数据共享的方法,包括使用multiprocessing模块和manager模块这两种方法,具有一定的参考价值,感兴趣的可以... 目录背景进程、进程创建进程间通信 进程间共享数据共享list实践背景 安卓ui自动化框架,使用的是

SpringBoot生成和操作PDF的代码详解

《SpringBoot生成和操作PDF的代码详解》本文主要介绍了在SpringBoot项目下,通过代码和操作步骤,详细的介绍了如何操作PDF,希望可以帮助到准备通过JAVA操作PDF的你,项目框架用的... 目录本文简介PDF文件简介代码实现PDF操作基于PDF模板生成,并下载完全基于代码生成,并保存合并P

SpringBoot基于MyBatis-Plus实现Lambda Query查询的示例代码

《SpringBoot基于MyBatis-Plus实现LambdaQuery查询的示例代码》MyBatis-Plus是MyBatis的增强工具,简化了数据库操作,并提高了开发效率,它提供了多种查询方... 目录引言基础环境配置依赖配置(Maven)application.yml 配置表结构设计demo_st

SpringCloud集成AlloyDB的示例代码

《SpringCloud集成AlloyDB的示例代码》AlloyDB是GoogleCloud提供的一种高度可扩展、强性能的关系型数据库服务,它兼容PostgreSQL,并提供了更快的查询性能... 目录1.AlloyDBjavascript是什么?AlloyDB 的工作原理2.搭建测试环境3.代码工程1.