连续出现次数最多的子串—后缀数组

2024-06-18 13:18

本文主要是介绍连续出现次数最多的子串—后缀数组,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

求一个字符串中连续出现次数最多的子串

  http://blog.csdn.net/ysu108/article/details/7795479 讲解

  http://blog.csdn.net/imcdragon/article/details/6838565 代码

  面试宝典P237

 
基本算法描述:
例如字符串“abababc”,最多连续出现的为ab,连续出现三次。

要和求一个字符串中的最长重复子串区分开来,还是上面的字符串,那么最长的重复子串为abab。


求一个字符串中连续出现的次数最多的子串,首先生成后缀数组例如上面的字符串为:
abababc
bababc
ababc
babc
abc
bc
c
可以看出第一个后缀数组和第三个后缀数组的起始都为ab,第5个后缀数组也为ab。

可以看出规律来,一个字符串s,如果第一次出现在后缀数组i的前面,那么如果它重复出现,下一次出现应该在第i+len(s)个后缀数组的前面。

这个规律也不难看出。那么从头到尾按照这个规律搜索下不难得出结果

#include <iostream>
#include <string>
#include <vector>
#include <utility>
using namespace std;pair<int, string> fun(const string &str)
{vector<string> substrs;int maxcount = 1, count = 1;string substr;int i, len = str.length();for(i=0; i<len; ++i)/*生成后缀数组*/substrs.push_back(str.substr(i, len-i));		/*for(i=0; i<len; ++i)cout << substrs[i] << endl;*/for(i=0; i<len; ++i){	for(int j=i+1; j<len; ++j){count = 1;//当重复的字符串长度为(j-i)的时候,如果是连续出现的,//那么第j和第j+(j-i),j+2*(j-i)...个后缀数组前面为重复的字符串if(substrs[i].substr(0, j-i) == substrs[j].substr(0,j-i)){++count;for(int k=j+(j-i); k<len; k+=j-i)	{	//如果是连续出现的,那么第j和第j+(j-i),j+2*(j-i)...个后缀数组前面为重复的字符串if (substrs[i].substr(0,j-i) == substrs[k].substr(0, j-i))++count;elsebreak;}if(count > maxcount){maxcount = count;substr=substrs[i].substr(0, j-i);}}}}return make_pair(maxcount, substr);
}int main()
{pair<int, string> rs;string str="abcabcabcabcabcabbbb";rs = fun(str);cout << rs.second<<':'<<rs.first<<'\n';system("pause");return 0;
} 



              

这篇关于连续出现次数最多的子串—后缀数组的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1072099

相关文章

hdu2241(二分+合并数组)

题意:判断是否存在a+b+c = x,a,b,c分别属于集合A,B,C 如果用暴力会超时,所以这里用到了数组合并,将b,c数组合并成d,d数组存的是b,c数组元素的和,然后对d数组进行二分就可以了 代码如下(附注释): #include<iostream>#include<algorithm>#include<cstring>#include<stack>#include<que

poj2406(连续重复子串)

题意:判断串s是不是str^n,求str的最大长度。 解题思路:kmp可解,后缀数组的倍增算法超时。next[i]表示在第i位匹配失败后,自动跳转到next[i],所以1到next[n]这个串 等于 n-next[n]+1到n这个串。 代码如下; #include<iostream>#include<algorithm>#include<stdio.h>#include<math.

poj3261(可重复k次的最长子串)

题意:可重复k次的最长子串 解题思路:求所有区间[x,x+k-1]中的最小值的最大值。求sa时间复杂度Nlog(N),求最值时间复杂度N*N,但实际复杂度很低。题目数据也比较水,不然估计过不了。 代码入下: #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstring

spoj705( 求不相同的子串个数)

题意:求串s的不同子串的个数 解题思路:任何子串都是某个后缀的前缀,对n个后缀排序,求某个后缀的前缀的个数,减去height[i](第i个后缀与第i-1 个后缀有相同的height[i]个前缀)。 代码如下: #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstrin

hdu 1166 敌兵布阵(树状数组 or 线段树)

题意是求一个线段的和,在线段上可以进行加减的修改。 树状数组的模板题。 代码: #include <stdio.h>#include <string.h>const int maxn = 50000 + 1;int c[maxn];int n;int lowbit(int x){return x & -x;}void add(int x, int num){while

PTA求一批整数中出现最多的个位数字

作者 徐镜春 单位 浙江大学 给定一批整数,分析每个整数的每一位数字,求出现次数最多的个位数字。例如给定3个整数1234、2345、3456,其中出现最多次数的数字是3和4,均出现了3次。 输入格式: 输入在第1行中给出正整数N(≤1000),在第二行中给出N个不超过整型范围的非负整数,数字间以空格分隔。 输出格式: 在一行中按格式“M: n1 n2 ...”输出,其中M是最大次数,n

XTU 1233 n个硬币连续m个正面个数(dp)

题面: Coins Problem Description: Duoxida buys a bottle of MaiDong from a vending machine and the machine give her n coins back. She places them in a line randomly showing head face or tail face o

hdu 3065 AC自动机 匹配串编号以及出现次数

题意: 仍旧是天朝语题。 Input 第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。 接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。 在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。

C语言:柔性数组

数组定义 柔性数组 err int arr[0] = {0}; // ERROR 柔性数组 // 常见struct Test{int len;char arr[1024];} // 柔性数组struct Test{int len;char arr[0];}struct Test *t;t = malloc(sizeof(Test) + 11);strcpy(t->arr,

C 语言基础之数组

文章目录 什么是数组数组变量的声明多维数组 什么是数组 数组,顾名思义,就是一组数。 假如班上有 30 个同学,让你编程统计每个人的分数,求最高分、最低分、平均分等。如果不知道数组,你只能这样写代码: int ZhangSan_score = 95;int LiSi_score = 90;......int LiuDong_score = 100;int Zhou