字符串模式匹配(BF算法和KMP算法)

2024-08-29 17:48

本文主要是介绍字符串模式匹配(BF算法和KMP算法),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

字符串模式匹配:

在主串s中寻找子串t,若主串第i个下标开始的字符串同子串t完全相同,则返回下标i,若遍历完主串s未找到匹配,则返回-1。


BF(Brute Force)算法:

BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果,BF算法在每次字符不匹配时, 都要回溯到开始位置,时间开销较大,复杂度为O(length(s)*length(t))

KMP算法:

KMP算法解决了这个缺点,简单的说,KMP算法就是研究当字符串不匹配时,T应当回溯到什么位置,以避免多余的回溯和比较过程。利用已经部分匹配这个有效信息,保持主串S指针不回溯,通过修改子串T指针,让模式串尽量地移动到有效的位置。
因为在T的每一个位置都可能发生不匹配,因此通常使用一个int型的数组next来标志当T中的每个元素不匹配时,子串T指针应该回溯的位置。

关于next数组的推导问题,可以参考这篇文章

这里给出两种算法的实现程序:

#include "stdafx.h"
#include <iostream>
using namespace std;
namespace StringPattern
{//BF 算法的实现int stringPattern_BF(const char* s,int sLen, const char* t,int tLen){int i = 0, j = 0;while (i < sLen&&j<tLen){if (s[i] == t[j]){i++;j++;}else{i = i - j + 1;	//不匹配,主串下标前进一个位置j = 0;}}if (j == tLen)	return i-j;else return -1;}void getNext(const char* t,int *next){int j = 0,k=-1;next[0] = -1;int len = strlen(t);while (j < len-1){if ((k ==-1) || t[j] == t[k]){if (t[++j] == t[++k])	//当两个字符相等时后面的不匹配前面的当然不匹配,直接按照前面字符不匹配时处理next[j] = next[k];elsenext[j] = k;}elsek = next[k];}}int stringPattern_KMP(const char* s,int sLen, const char* t,int tLen){int *next = new int[tLen];getNext(t, next);int i=0, j=0;while (i < sLen&&j < tLen){if (j == -1 || s[i] == t[j]){i++;j++;}else{j = next[j];}}if (j == tLen)return i - j;else return -1;}void test(){char* s = "woaibeijingtiananmen";char* t = "ijing";cout << stringPattern_BF(s,strlen(s),t,strlen(t)) << endl;cout << stringPattern_KMP(s, strlen(s), t, strlen(t)) << endl;}
}int _tmain(int argc, _TCHAR* argv[])
{StringPattern::test();return 0;
}
运行结果:



这篇关于字符串模式匹配(BF算法和KMP算法)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1118542

相关文章

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

IDEA编译报错“java: 常量字符串过长”的原因及解决方法

《IDEA编译报错“java:常量字符串过长”的原因及解决方法》今天在开发过程中,由于尝试将一个文件的Base64字符串设置为常量,结果导致IDEA编译的时候出现了如下报错java:常量字符串过长,... 目录一、问题描述二、问题原因2.1 理论角度2.2 源码角度三、解决方案解决方案①:StringBui

C#从XmlDocument提取完整字符串的方法

《C#从XmlDocument提取完整字符串的方法》文章介绍了两种生成格式化XML字符串的方法,方法一使用`XmlDocument`的`OuterXml`属性,但输出的XML字符串不带格式,可读性差,... 方法1:通过XMLDocument的OuterXml属性,见XmlDocument类该方法获得的xm

JSON字符串转成java的Map对象详细步骤

《JSON字符串转成java的Map对象详细步骤》:本文主要介绍如何将JSON字符串转换为Java对象的步骤,包括定义Element类、使用Jackson库解析JSON和添加依赖,文中通过代码介绍... 目录步骤 1: 定义 Element 类步骤 2: 使用 Jackson 库解析 jsON步骤 3: 添

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

python修改字符串值的三种方法

《python修改字符串值的三种方法》本文主要介绍了python修改字符串值的三种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学... 目录第一种方法:第二种方法:第三种方法:在python中,字符串对象是不可变类型,所以我们没办法直接

JAVA中整型数组、字符串数组、整型数和字符串 的创建与转换的方法

《JAVA中整型数组、字符串数组、整型数和字符串的创建与转换的方法》本文介绍了Java中字符串、字符数组和整型数组的创建方法,以及它们之间的转换方法,还详细讲解了字符串中的一些常用方法,如index... 目录一、字符串、字符数组和整型数组的创建1、字符串的创建方法1.1 通过引用字符数组来创建字符串1.2

C#中字符串分割的多种方式

《C#中字符串分割的多种方式》在C#编程语言中,字符串处理是日常开发中不可或缺的一部分,字符串分割是处理文本数据时常用的操作,它允许我们将一个长字符串分解成多个子字符串,本文给大家介绍了C#中字符串分... 目录1. 使用 string.Split2. 使用正则表达式 (Regex.Split)3. 使用

Java中JSON字符串反序列化(动态泛型)

《Java中JSON字符串反序列化(动态泛型)》文章讨论了在定时任务中使用反射调用目标对象时处理动态参数的问题,通过将方法参数存储为JSON字符串并进行反序列化,可以实现动态调用,然而,这种方式容易导... 需求:定时任务扫描,反射调用目标对象,但是,方法的传参不是固定的。方案一:将方法参数存成jsON字