字符串的暴力匹配和KMP算法

2024-08-28 17:28

本文主要是介绍字符串的暴力匹配和KMP算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

//字符串的暴力匹配---------------------------------------------------------------------
//创建一个结构体
typedef struct String
{
    char* data;
    int len;
}String;
//字符串初始化
String* InitString()
{
    String* s = (String*)malloc(sizeof(String));
    s->data = NULL;
    s->len = 0;
    return s;
}
//字符串赋值
void stringAssign(String* s, const char* data)
{
    //判断是否有值
    if (s->data)
    {
        free(s->data);
    }
    //计算data中字符的长度
    int len = 0;
    const char* tmp = data;
    while (*tmp)
    {
        len++;
        tmp++;
    }
    //如果字符串为空
    if (len == 0)
    {
        s->data = NULL;
        s->len = 0;
    }
    //字符串拷贝赋值
    else
    {
        tmp = data;
        s->len = len;
        //开辟字符串内存,多开一个用来保存 \0 字符串结束
        s->data = (char*)malloc(sizeof(char) * (len + 1));
        //拷贝
        for (int i = 0; i < len; i++, tmp++)
        {
            s->data[i] = *tmp;
        }
    }
}
//字符串的暴力匹配
void forceMatch(String* master, String* sub)
{
    //创建两个变量作为下标访问两个字符串
    int pm = 0;
    int ps = 0;
    //两个字符串都未遇到字符串结束标志时,执行循环比较
    while (pm < master->len && ps < sub->len)
    {
        //当master字符串中的字符与sub字符串首元素相同时,二者同时往后迭代比较
        if (master->data[pm] == sub->data[ps])
        {
            pm++;
            ps++;
        }
        //否则,从master中字符的下一个位置开始下一轮比较
        //即pm-ps+1的位置开始比较
        else
        {
            pm = pm - ps + 1;
            ps = 0;
        }
    }
    //当ps走完整个sub字符串,说明匹配上了
    if (ps == sub->len)
    {
        printf("force match success\n");
    }
    else
    {
        printf("force match false\n");
    }

}
//字符串打印
void printString(String* s)
{
    for (int i = 0; i < s->len; i++)
    {
        printf(i == 0 ? "%c" : "->%c ", s->data[i]);
    }
    printf("\n");
}

int main()
{
    String* s = InitString();
    String* s1 = InitString();

    stringAssign(s, "hello");
    stringAssign(s1, "ele");

    printString(s);
    printString(s1);

    forceMatch(s, s1);

    return 0;
}
//字符串匹配的KMP算法------------------------------------------------------------------
//高效的模式匹配算法,不需要主串指针回溯,牺牲空间存储Next数组
// 更加智能的移动字符串,达到匹配效果
// next数组是:
//     当子串中字符与主串发生不匹配时,值对应索引的字符要移动到与主串不匹配的字符
//     对齐
// 
// next数组算法:
//     next的值=公共前后缀(相等字符个数) + 1,首元素为0,第二个元素为0+1
//         即相同字符个数0个,再+1
//     公共前后缀:abcd 前缀:a,ab,abc 后缀:d,cd,bcd
//     减少主串指针的移动,提高匹配效率
//创建一个结构体
typedef struct String
{
    char* data;
    int len;
}String;
//字符串初始化
String* InitString()
{
    String* s = (String*)malloc(sizeof(String));
    s->data = NULL;
    s->len = 0;
    return s;
}
//字符串赋值
void stringAssign(String* s, const char* data)
{
    //判断是否有值
    if (s->data)
    {
        free(s->data);
    }
    //计算data中字符的长度
    int len = 0;
    const char* tmp = data;
    while (*tmp)
    {
        len++;
        tmp++;
    }
    //如果字符串为空
    if (len == 0)
    {
        s->data = NULL;
        s->len = 0;
    }
    //字符串拷贝赋值
    else
    {
        tmp = data;
        s->len = len;
        //开辟字符串内存,多开一个用来保存 \0 字符串结束
        s->data = (char*)malloc(sizeof(char) * (len + 1));
        //拷贝
        for (int i = 0; i < len; i++, tmp++)
        {
            s->data[i] = *tmp;
        }
    }
}
//求出next数组-----------------
int* getNext(String* s)
{
    //给next数组开辟空间,与字符串元素个数相同
    int* next = (int*)malloc(sizeof(int) * s->len);
    int i = 0;//字符串的下标
    int j = -1;//next数组的公共前后缀的值
    //next数组首元素赋值,公共前后缀首元素的相同个数为-1
    next[i] = j;
    //首元素已赋值,访问下标次数-1
    while (i<s->len-1)
    {
        //当j == -1或者i下标所在字符前一个字符与j下标所在字符相同,二者同时往后迭代
        if (j == -1 || s->data[i] == s->data[j])
        {
            i++;
            j++;
            next[i] = j;
        }
        //否则,用i下标所在的元素与next[j]下标所在的元素进行比较,相同往后迭代
        // 或者直到j==-1,往后迭代
        else
        {
            j = next[j];
        }
    }
    return next;
}
//使用next数组,求解子串与主串匹配
void kmpMatch(String* master, String* sub,int* next)
{
    //创建两个变量作为下标访问两个字符串
    int pm = 0;
    int ps = 0;
    //两个字符串都未遇到字符串结束标志时,执行循环比较
    while (pm < master->len && ps < sub->len)
    {
        //当master字符串中的字符与sub字符串首元素相同时,二者同时往后迭代比较
        // 或者直到j==-1,往后迭代
        if (ps == -1 || master->data[pm] == sub->data[ps])
        {
            pm++;
            ps++;
        }
        //否则子串首元素移至主串pm下标所在位置,再次匹配
        else
        {
            ps = next[ps];
        }
    }
    //当ps走完整个sub字符串,说明匹配上了
    if (ps == sub->len)
    {
        printf("force match success\n");
    }
    else
    {
        printf("force match false\n");
    }
}
//打印next数组的值
void printNext(int* next, int len)
{
    for (int i = 0; i < len; i++)
    {
        printf(i == 0 ? "%d" : "->%d ", next[i]);
    }
    printf("\n");
}
//字符串打印
void printString(String* s)
{
    for (int i = 0; i < s->len; i++)
    {
        printf(i == 0 ? "%c" : "->%c ", s->data[i]);
    }
    printf("\n");
}


int main()
{
    String* s = InitString();
    String* s1 = InitString();

    stringAssign(s, "abababababaa");
    stringAssign(s1, "abc");
    printString(s);
    printString(s1);

    //子串的next数组
    int* next = getNext(s1);
    printNext(next, s1->len);

    kmpMatch(s, s1, next);
    return 0;
}

这篇关于字符串的暴力匹配和KMP算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1115410

相关文章

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

IDEA编译报错“java: 常量字符串过长”的原因及解决方法

《IDEA编译报错“java:常量字符串过长”的原因及解决方法》今天在开发过程中,由于尝试将一个文件的Base64字符串设置为常量,结果导致IDEA编译的时候出现了如下报错java:常量字符串过长,... 目录一、问题描述二、问题原因2.1 理论角度2.2 源码角度三、解决方案解决方案①:StringBui

关于Gateway路由匹配规则解读

《关于Gateway路由匹配规则解读》本文详细介绍了SpringCloudGateway的路由匹配规则,包括基本概念、常用属性、实际应用以及注意事项,路由匹配规则决定了请求如何被转发到目标服务,是Ga... 目录Gateway路由匹配规则一、基本概念二、常用属性三、实际应用四、注意事项总结Gateway路由

C#从XmlDocument提取完整字符串的方法

《C#从XmlDocument提取完整字符串的方法》文章介绍了两种生成格式化XML字符串的方法,方法一使用`XmlDocument`的`OuterXml`属性,但输出的XML字符串不带格式,可读性差,... 方法1:通过XMLDocument的OuterXml属性,见XmlDocument类该方法获得的xm

JSON字符串转成java的Map对象详细步骤

《JSON字符串转成java的Map对象详细步骤》:本文主要介绍如何将JSON字符串转换为Java对象的步骤,包括定义Element类、使用Jackson库解析JSON和添加依赖,文中通过代码介绍... 目录步骤 1: 定义 Element 类步骤 2: 使用 Jackson 库解析 jsON步骤 3: 添

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

python修改字符串值的三种方法

《python修改字符串值的三种方法》本文主要介绍了python修改字符串值的三种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学... 目录第一种方法:第二种方法:第三种方法:在python中,字符串对象是不可变类型,所以我们没办法直接

JAVA中整型数组、字符串数组、整型数和字符串 的创建与转换的方法

《JAVA中整型数组、字符串数组、整型数和字符串的创建与转换的方法》本文介绍了Java中字符串、字符数组和整型数组的创建方法,以及它们之间的转换方法,还详细讲解了字符串中的一些常用方法,如index... 目录一、字符串、字符数组和整型数组的创建1、字符串的创建方法1.1 通过引用字符数组来创建字符串1.2

C#中字符串分割的多种方式

《C#中字符串分割的多种方式》在C#编程语言中,字符串处理是日常开发中不可或缺的一部分,字符串分割是处理文本数据时常用的操作,它允许我们将一个长字符串分解成多个子字符串,本文给大家介绍了C#中字符串分... 目录1. 使用 string.Split2. 使用正则表达式 (Regex.Split)3. 使用