字符串的暴力匹配和KMP算法

2024-08-28 17:28

本文主要是介绍字符串的暴力匹配和KMP算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

//字符串的暴力匹配---------------------------------------------------------------------
//创建一个结构体
typedef struct String
{
    char* data;
    int len;
}String;
//字符串初始化
String* InitString()
{
    String* s = (String*)malloc(sizeof(String));
    s->data = NULL;
    s->len = 0;
    return s;
}
//字符串赋值
void stringAssign(String* s, const char* data)
{
    //判断是否有值
    if (s->data)
    {
        free(s->data);
    }
    //计算data中字符的长度
    int len = 0;
    const char* tmp = data;
    while (*tmp)
    {
        len++;
        tmp++;
    }
    //如果字符串为空
    if (len == 0)
    {
        s->data = NULL;
        s->len = 0;
    }
    //字符串拷贝赋值
    else
    {
        tmp = data;
        s->len = len;
        //开辟字符串内存,多开一个用来保存 \0 字符串结束
        s->data = (char*)malloc(sizeof(char) * (len + 1));
        //拷贝
        for (int i = 0; i < len; i++, tmp++)
        {
            s->data[i] = *tmp;
        }
    }
}
//字符串的暴力匹配
void forceMatch(String* master, String* sub)
{
    //创建两个变量作为下标访问两个字符串
    int pm = 0;
    int ps = 0;
    //两个字符串都未遇到字符串结束标志时,执行循环比较
    while (pm < master->len && ps < sub->len)
    {
        //当master字符串中的字符与sub字符串首元素相同时,二者同时往后迭代比较
        if (master->data[pm] == sub->data[ps])
        {
            pm++;
            ps++;
        }
        //否则,从master中字符的下一个位置开始下一轮比较
        //即pm-ps+1的位置开始比较
        else
        {
            pm = pm - ps + 1;
            ps = 0;
        }
    }
    //当ps走完整个sub字符串,说明匹配上了
    if (ps == sub->len)
    {
        printf("force match success\n");
    }
    else
    {
        printf("force match false\n");
    }

}
//字符串打印
void printString(String* s)
{
    for (int i = 0; i < s->len; i++)
    {
        printf(i == 0 ? "%c" : "->%c ", s->data[i]);
    }
    printf("\n");
}

int main()
{
    String* s = InitString();
    String* s1 = InitString();

    stringAssign(s, "hello");
    stringAssign(s1, "ele");

    printString(s);
    printString(s1);

    forceMatch(s, s1);

    return 0;
}
//字符串匹配的KMP算法------------------------------------------------------------------
//高效的模式匹配算法,不需要主串指针回溯,牺牲空间存储Next数组
// 更加智能的移动字符串,达到匹配效果
// next数组是:
//     当子串中字符与主串发生不匹配时,值对应索引的字符要移动到与主串不匹配的字符
//     对齐
// 
// next数组算法:
//     next的值=公共前后缀(相等字符个数) + 1,首元素为0,第二个元素为0+1
//         即相同字符个数0个,再+1
//     公共前后缀:abcd 前缀:a,ab,abc 后缀:d,cd,bcd
//     减少主串指针的移动,提高匹配效率
//创建一个结构体
typedef struct String
{
    char* data;
    int len;
}String;
//字符串初始化
String* InitString()
{
    String* s = (String*)malloc(sizeof(String));
    s->data = NULL;
    s->len = 0;
    return s;
}
//字符串赋值
void stringAssign(String* s, const char* data)
{
    //判断是否有值
    if (s->data)
    {
        free(s->data);
    }
    //计算data中字符的长度
    int len = 0;
    const char* tmp = data;
    while (*tmp)
    {
        len++;
        tmp++;
    }
    //如果字符串为空
    if (len == 0)
    {
        s->data = NULL;
        s->len = 0;
    }
    //字符串拷贝赋值
    else
    {
        tmp = data;
        s->len = len;
        //开辟字符串内存,多开一个用来保存 \0 字符串结束
        s->data = (char*)malloc(sizeof(char) * (len + 1));
        //拷贝
        for (int i = 0; i < len; i++, tmp++)
        {
            s->data[i] = *tmp;
        }
    }
}
//求出next数组-----------------
int* getNext(String* s)
{
    //给next数组开辟空间,与字符串元素个数相同
    int* next = (int*)malloc(sizeof(int) * s->len);
    int i = 0;//字符串的下标
    int j = -1;//next数组的公共前后缀的值
    //next数组首元素赋值,公共前后缀首元素的相同个数为-1
    next[i] = j;
    //首元素已赋值,访问下标次数-1
    while (i<s->len-1)
    {
        //当j == -1或者i下标所在字符前一个字符与j下标所在字符相同,二者同时往后迭代
        if (j == -1 || s->data[i] == s->data[j])
        {
            i++;
            j++;
            next[i] = j;
        }
        //否则,用i下标所在的元素与next[j]下标所在的元素进行比较,相同往后迭代
        // 或者直到j==-1,往后迭代
        else
        {
            j = next[j];
        }
    }
    return next;
}
//使用next数组,求解子串与主串匹配
void kmpMatch(String* master, String* sub,int* next)
{
    //创建两个变量作为下标访问两个字符串
    int pm = 0;
    int ps = 0;
    //两个字符串都未遇到字符串结束标志时,执行循环比较
    while (pm < master->len && ps < sub->len)
    {
        //当master字符串中的字符与sub字符串首元素相同时,二者同时往后迭代比较
        // 或者直到j==-1,往后迭代
        if (ps == -1 || master->data[pm] == sub->data[ps])
        {
            pm++;
            ps++;
        }
        //否则子串首元素移至主串pm下标所在位置,再次匹配
        else
        {
            ps = next[ps];
        }
    }
    //当ps走完整个sub字符串,说明匹配上了
    if (ps == sub->len)
    {
        printf("force match success\n");
    }
    else
    {
        printf("force match false\n");
    }
}
//打印next数组的值
void printNext(int* next, int len)
{
    for (int i = 0; i < len; i++)
    {
        printf(i == 0 ? "%d" : "->%d ", next[i]);
    }
    printf("\n");
}
//字符串打印
void printString(String* s)
{
    for (int i = 0; i < s->len; i++)
    {
        printf(i == 0 ? "%c" : "->%c ", s->data[i]);
    }
    printf("\n");
}


int main()
{
    String* s = InitString();
    String* s1 = InitString();

    stringAssign(s, "abababababaa");
    stringAssign(s1, "abc");
    printString(s);
    printString(s1);

    //子串的next数组
    int* next = getNext(s1);
    printNext(next, s1->len);

    kmpMatch(s, s1, next);
    return 0;
}

这篇关于字符串的暴力匹配和KMP算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1115410

相关文章

C#数据结构之字符串(string)详解

《C#数据结构之字符串(string)详解》:本文主要介绍C#数据结构之字符串(string),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录转义字符序列字符串的创建字符串的声明null字符串与空字符串重复单字符字符串的构造字符串的属性和常用方法属性常用方法总结摘

Java实现时间与字符串互相转换详解

《Java实现时间与字符串互相转换详解》这篇文章主要为大家详细介绍了Java中实现时间与字符串互相转换的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、日期格式化为字符串(一)使用预定义格式(二)自定义格式二、字符串解析为日期(一)解析ISO格式字符串(二)解析自定义

SpringBoot实现MD5加盐算法的示例代码

《SpringBoot实现MD5加盐算法的示例代码》加盐算法是一种用于增强密码安全性的技术,本文主要介绍了SpringBoot实现MD5加盐算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习... 目录一、什么是加盐算法二、如何实现加盐算法2.1 加盐算法代码实现2.2 注册页面中进行密码加盐2.

Java时间轮调度算法的代码实现

《Java时间轮调度算法的代码实现》时间轮是一种高效的定时调度算法,主要用于管理延时任务或周期性任务,它通过一个环形数组(时间轮)和指针来实现,将大量定时任务分摊到固定的时间槽中,极大地降低了时间复杂... 目录1、简述2、时间轮的原理3. 时间轮的实现步骤3.1 定义时间槽3.2 定义时间轮3.3 使用时

python中字符串拼接的几种方法及优缺点对比详解

《python中字符串拼接的几种方法及优缺点对比详解》在Python中,字符串拼接是常见的操作,Python提供了多种方法来拼接字符串,每种方法有其优缺点和适用场景,以下是几种常见的字符串拼接方法,需... 目录1. 使用 + 运算符示例:优缺点:2. 使用&nbsjsp;join() 方法示例:优缺点:3

java字符串数字补齐位数详解

《java字符串数字补齐位数详解》:本文主要介绍java字符串数字补齐位数,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java字符串数字补齐位数一、使用String.format()方法二、Apache Commons Lang库方法三、Java 11+的St

C++字符串提取和分割的多种方法

《C++字符串提取和分割的多种方法》在C++编程中,字符串处理是一个常见的任务,尤其是在需要从字符串中提取特定数据时,本文将详细探讨如何使用C++标准库中的工具来提取和分割字符串,并分析不同方法的适用... 目录1. 字符串提取的基本方法1.1 使用 std::istringstream 和 >> 操作符示

C语言字符函数和字符串函数示例详解

《C语言字符函数和字符串函数示例详解》本文详细介绍了C语言中字符分类函数、字符转换函数及字符串操作函数的使用方法,并通过示例代码展示了如何实现这些功能,通过这些内容,读者可以深入理解并掌握C语言中的字... 目录一、字符分类函数二、字符转换函数三、strlen的使用和模拟实现3.1strlen函数3.2st

Java反转字符串的五种方法总结

《Java反转字符串的五种方法总结》:本文主要介绍五种在Java中反转字符串的方法,包括使用StringBuilder的reverse()方法、字符数组、自定义StringBuilder方法、直接... 目录前言方法一:使用StringBuilder的reverse()方法方法二:使用字符数组方法三:使用自

Golang中拼接字符串的6种方式性能对比

《Golang中拼接字符串的6种方式性能对比》golang的string类型是不可修改的,对于拼接字符串来说,本质上还是创建一个新的对象将数据放进去,主要有6种拼接方式,下面小编就来为大家详细讲讲吧... 目录拼接方式介绍性能对比测试代码测试结果源码分析golang的string类型是不可修改的,对于拼接字