字符串的暴力匹配和KMP算法

2024-08-28 17:28

本文主要是介绍字符串的暴力匹配和KMP算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

//字符串的暴力匹配---------------------------------------------------------------------
//创建一个结构体
typedef struct String
{
    char* data;
    int len;
}String;
//字符串初始化
String* InitString()
{
    String* s = (String*)malloc(sizeof(String));
    s->data = NULL;
    s->len = 0;
    return s;
}
//字符串赋值
void stringAssign(String* s, const char* data)
{
    //判断是否有值
    if (s->data)
    {
        free(s->data);
    }
    //计算data中字符的长度
    int len = 0;
    const char* tmp = data;
    while (*tmp)
    {
        len++;
        tmp++;
    }
    //如果字符串为空
    if (len == 0)
    {
        s->data = NULL;
        s->len = 0;
    }
    //字符串拷贝赋值
    else
    {
        tmp = data;
        s->len = len;
        //开辟字符串内存,多开一个用来保存 \0 字符串结束
        s->data = (char*)malloc(sizeof(char) * (len + 1));
        //拷贝
        for (int i = 0; i < len; i++, tmp++)
        {
            s->data[i] = *tmp;
        }
    }
}
//字符串的暴力匹配
void forceMatch(String* master, String* sub)
{
    //创建两个变量作为下标访问两个字符串
    int pm = 0;
    int ps = 0;
    //两个字符串都未遇到字符串结束标志时,执行循环比较
    while (pm < master->len && ps < sub->len)
    {
        //当master字符串中的字符与sub字符串首元素相同时,二者同时往后迭代比较
        if (master->data[pm] == sub->data[ps])
        {
            pm++;
            ps++;
        }
        //否则,从master中字符的下一个位置开始下一轮比较
        //即pm-ps+1的位置开始比较
        else
        {
            pm = pm - ps + 1;
            ps = 0;
        }
    }
    //当ps走完整个sub字符串,说明匹配上了
    if (ps == sub->len)
    {
        printf("force match success\n");
    }
    else
    {
        printf("force match false\n");
    }

}
//字符串打印
void printString(String* s)
{
    for (int i = 0; i < s->len; i++)
    {
        printf(i == 0 ? "%c" : "->%c ", s->data[i]);
    }
    printf("\n");
}

int main()
{
    String* s = InitString();
    String* s1 = InitString();

    stringAssign(s, "hello");
    stringAssign(s1, "ele");

    printString(s);
    printString(s1);

    forceMatch(s, s1);

    return 0;
}
//字符串匹配的KMP算法------------------------------------------------------------------
//高效的模式匹配算法,不需要主串指针回溯,牺牲空间存储Next数组
// 更加智能的移动字符串,达到匹配效果
// next数组是:
//     当子串中字符与主串发生不匹配时,值对应索引的字符要移动到与主串不匹配的字符
//     对齐
// 
// next数组算法:
//     next的值=公共前后缀(相等字符个数) + 1,首元素为0,第二个元素为0+1
//         即相同字符个数0个,再+1
//     公共前后缀:abcd 前缀:a,ab,abc 后缀:d,cd,bcd
//     减少主串指针的移动,提高匹配效率
//创建一个结构体
typedef struct String
{
    char* data;
    int len;
}String;
//字符串初始化
String* InitString()
{
    String* s = (String*)malloc(sizeof(String));
    s->data = NULL;
    s->len = 0;
    return s;
}
//字符串赋值
void stringAssign(String* s, const char* data)
{
    //判断是否有值
    if (s->data)
    {
        free(s->data);
    }
    //计算data中字符的长度
    int len = 0;
    const char* tmp = data;
    while (*tmp)
    {
        len++;
        tmp++;
    }
    //如果字符串为空
    if (len == 0)
    {
        s->data = NULL;
        s->len = 0;
    }
    //字符串拷贝赋值
    else
    {
        tmp = data;
        s->len = len;
        //开辟字符串内存,多开一个用来保存 \0 字符串结束
        s->data = (char*)malloc(sizeof(char) * (len + 1));
        //拷贝
        for (int i = 0; i < len; i++, tmp++)
        {
            s->data[i] = *tmp;
        }
    }
}
//求出next数组-----------------
int* getNext(String* s)
{
    //给next数组开辟空间,与字符串元素个数相同
    int* next = (int*)malloc(sizeof(int) * s->len);
    int i = 0;//字符串的下标
    int j = -1;//next数组的公共前后缀的值
    //next数组首元素赋值,公共前后缀首元素的相同个数为-1
    next[i] = j;
    //首元素已赋值,访问下标次数-1
    while (i<s->len-1)
    {
        //当j == -1或者i下标所在字符前一个字符与j下标所在字符相同,二者同时往后迭代
        if (j == -1 || s->data[i] == s->data[j])
        {
            i++;
            j++;
            next[i] = j;
        }
        //否则,用i下标所在的元素与next[j]下标所在的元素进行比较,相同往后迭代
        // 或者直到j==-1,往后迭代
        else
        {
            j = next[j];
        }
    }
    return next;
}
//使用next数组,求解子串与主串匹配
void kmpMatch(String* master, String* sub,int* next)
{
    //创建两个变量作为下标访问两个字符串
    int pm = 0;
    int ps = 0;
    //两个字符串都未遇到字符串结束标志时,执行循环比较
    while (pm < master->len && ps < sub->len)
    {
        //当master字符串中的字符与sub字符串首元素相同时,二者同时往后迭代比较
        // 或者直到j==-1,往后迭代
        if (ps == -1 || master->data[pm] == sub->data[ps])
        {
            pm++;
            ps++;
        }
        //否则子串首元素移至主串pm下标所在位置,再次匹配
        else
        {
            ps = next[ps];
        }
    }
    //当ps走完整个sub字符串,说明匹配上了
    if (ps == sub->len)
    {
        printf("force match success\n");
    }
    else
    {
        printf("force match false\n");
    }
}
//打印next数组的值
void printNext(int* next, int len)
{
    for (int i = 0; i < len; i++)
    {
        printf(i == 0 ? "%d" : "->%d ", next[i]);
    }
    printf("\n");
}
//字符串打印
void printString(String* s)
{
    for (int i = 0; i < s->len; i++)
    {
        printf(i == 0 ? "%c" : "->%c ", s->data[i]);
    }
    printf("\n");
}


int main()
{
    String* s = InitString();
    String* s1 = InitString();

    stringAssign(s, "abababababaa");
    stringAssign(s1, "abc");
    printString(s);
    printString(s1);

    //子串的next数组
    int* next = getNext(s1);
    printNext(next, s1->len);

    kmpMatch(s, s1, next);
    return 0;
}

这篇关于字符串的暴力匹配和KMP算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1115410

相关文章

Java中字符串转时间与时间转字符串的操作详解

《Java中字符串转时间与时间转字符串的操作详解》Java的java.time包提供了强大的日期和时间处理功能,通过DateTimeFormatter可以轻松地在日期时间对象和字符串之间进行转换,下面... 目录一、字符串转时间(一)使用预定义格式(二)自定义格式二、时间转字符串(一)使用预定义格式(二)自

Nginx location匹配模式与规则详解

《Nginxlocation匹配模式与规则详解》:本文主要介绍Nginxlocation匹配模式与规则,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、环境二、匹配模式1. 精准模式2. 前缀模式(不继续匹配正则)3. 前缀模式(继续匹配正则)4. 正则模式(大

Java 正则表达式URL 匹配与源码全解析

《Java正则表达式URL匹配与源码全解析》在Web应用开发中,我们经常需要对URL进行格式验证,今天我们结合Java的Pattern和Matcher类,深入理解正则表达式在实际应用中... 目录1.正则表达式分解:2. 添加域名匹配 (2)3. 添加路径和查询参数匹配 (3) 4. 最终优化版本5.设计思

Java字符串操作技巧之语法、示例与应用场景分析

《Java字符串操作技巧之语法、示例与应用场景分析》在Java算法题和日常开发中,字符串处理是必备的核心技能,本文全面梳理Java中字符串的常用操作语法,结合代码示例、应用场景和避坑指南,可快速掌握字... 目录引言1. 基础操作1.1 创建字符串1.2 获取长度1.3 访问字符2. 字符串处理2.1 子字

一文详解如何在Python中从字符串中提取部分内容

《一文详解如何在Python中从字符串中提取部分内容》:本文主要介绍如何在Python中从字符串中提取部分内容的相关资料,包括使用正则表达式、Pyparsing库、AST(抽象语法树)、字符串操作... 目录前言解决方案方法一:使用正则表达式方法二:使用 Pyparsing方法三:使用 AST方法四:使用字

Java字符串处理全解析(String、StringBuilder与StringBuffer)

《Java字符串处理全解析(String、StringBuilder与StringBuffer)》:本文主要介绍Java字符串处理全解析(String、StringBuilder与StringBu... 目录Java字符串处理全解析:String、StringBuilder与StringBuffer一、St

openCV中KNN算法的实现

《openCV中KNN算法的实现》KNN算法是一种简单且常用的分类算法,本文主要介绍了openCV中KNN算法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录KNN算法流程使用OpenCV实现KNNOpenCV 是一个开源的跨平台计算机视觉库,它提供了各

Python中使用正则表达式精准匹配IP地址的案例

《Python中使用正则表达式精准匹配IP地址的案例》Python的正则表达式(re模块)是完成这个任务的利器,但你知道怎么写才能准确匹配各种合法的IP地址吗,今天我们就来详细探讨这个问题,感兴趣的朋... 目录为什么需要IP正则表达式?IP地址的基本结构基础正则表达式写法精确匹配0-255的数字验证IP地

MySQL更新某个字段拼接固定字符串的实现

《MySQL更新某个字段拼接固定字符串的实现》在MySQL中,我们经常需要对数据库中的某个字段进行更新操作,本文就来介绍一下MySQL更新某个字段拼接固定字符串的实现,感兴趣的可以了解一下... 目录1. 查看字段当前值2. 更新字段拼接固定字符串3. 验证更新结果mysql更新某个字段拼接固定字符串 -

Java String字符串的常用使用方法

《JavaString字符串的常用使用方法》String是JDK提供的一个类,是引用类型,并不是基本的数据类型,String用于字符串操作,在之前学习c语言的时候,对于一些字符串,会初始化字符数组表... 目录一、什么是String二、如何定义一个String1. 用双引号定义2. 通过构造函数定义三、St