【数据结构】KMP算法

2024-06-10 18:44

文章标签 算法数据结构 kmp

本文主要是介绍【数据结构】KMP算法，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1 KMP算法

KMP（Knuth-Morris-Pratt）算法是一种改进的字符串匹配算法，由D.E.Knuth、J.H.Morris和V.R.Pratt共同提出，用于在一个文本串（主串）中搜索一个词（模式串）的位置。KMP算法的关键在于当字符串匹配过程中出现字符不匹配时，能知道部分已经比较过的字符的信息，利用这些信息避免重新比较这些字符，从而提高算法的效率。

2 KMP算法实现

#include <stdio.h>  
#include <stdlib.h>  
#include <string.h>  // 构建部分匹配表（失败函数表）  
void computeLPSArray(char *pat, int M, int *lps) {  int len = 0; // 前缀后缀的最大长度  int i = 1;  lps[0] = 0; // lps[0]总是0  // 遍历模式串  while (i < M) {  if (pat[i] == pat[len]) {  len++;  lps[i] = len;  i++;  } else {  if (len != 0) {  len = lps[len - 1];  } else {  lps[i] = len;  i++;  }  }  }  
}  // KMP搜索算法  
int KMPSearch(char *pat, char *txt) {  int M = strlen(pat);  int N = strlen(txt);  // 创建lps数组  int *lps = (int *)malloc(sizeof(int) * M);  computeLPSArray(pat, M, lps);  int j = 0; // 模式串索引  for (int i = 0; i < N; i++) {  if (pat[j] == txt[i]) {  j++;  }  if (j == M) {  free(lps); // 释放lps数组内存  return i - j + 1; // 返回模式串在主串中首次出现的起始位置  }  // 如果模式串中当前字符不匹配，则j变为lps[j-1]  if (i < N && pat[j] != txt[i]) {  if (j != 0)  j = lps[j - 1];  else  i++;  }  }  free(lps); // 释放lps数组内存  return -1; // 没有找到模式串  
}  int main() {  char txt[] = "ABABDABACDABABCABAB";  char pat[] = "ABABCABAB";  int result = KMPSearch(pat, txt);  if (result == -1)  printf("Pattern not found\n");  else  printf("Pattern found at index: %d\n", result);  return 0;  
}