POJ 3294 后缀数组:求不小于k个字符串中的最长子串

2024-06-08 23:32

本文主要是介绍POJ 3294 后缀数组:求不小于k个字符串中的最长子串,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

思路:先把所有的串连接成一个串,串写串之前用没出现过的字符隔开,然后求后缀;对height数组分组二分求得最长的公共前缀,公共前缀所在的串一定要是不同的,不然就不是所有串的公共前缀了,然后记下下标和长度即可。

刚开始理解错题意,然后不知道怎么写,然后看别人题解也不知道怎么意思,后面看了好久才知道题目意思理解错了。

时间四千多ms,别人才一百多ms,不知道别人怎么做的……

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<map>
#include<queue>
#include<set>
#include<cmath>
#include<bitset>
#define mem(a,b) memset(a,b,sizeof(a))
#define lson i<<1,l,mid
#define rson i<<1|1,mid+1,r
#define llson j<<1,l,mid
#define rrson j<<1|1,mid+1,r
#define INF 0x7fffffff
#define maxn 110010
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
void radix(int *str,int *a,int *b,int n,int m)
{static int count[maxn];mem(count,0);for(int i=0; i<n; i++) ++count[str[a[i]]];for(int i=1; i<=m; i++) count[i]+=count[i-1];for(int i=n-1; i>=0; i--) b[--count[str[a[i]]]]=a[i];
}
void suffix(int *str,int *sa,int n,int m) //倍增算法计算出后缀数组sa
{static int rank[maxn],a[maxn],b[maxn];for(int i=0; i<n; i++) rank[i]=i;radix(str,rank,sa,n,m);rank[sa[0]]=0;for(int i=1; i<n; i++)rank[sa[i]]=rank[sa[i-1]]+(str[sa[i]]!=str[sa[i-1]]);for(int i=0; 1<<i<n; i++){for(int j=0; j<n; j++){a[j]=rank[j]+1;b[j]=j+(1<<i)>=n?0:rank[j+(1<<i)]+1;sa[j]=j;}radix(b,sa,rank,n,n);radix(a,rank,sa,n,n);rank[sa[0]]=0;for(int j=1; j<n; j++)rank[sa[j]]=rank[sa[j-1]]+(a[sa[j-1]]!=a[sa[j]]||b[sa[j-1]]!=b[sa[j]]);}
}
void calcHeight(int *str,int *sa,int *h,int *rank,int n) //求出最长公共前缀数组h
{int k=0;h[0]=0;for(int i=0; i<n; i++) rank[sa[i]]=i;for(int i=0; i<n; i++){k=k==0?0:k-1;if(rank[i])while(str[i+k]==str[sa[rank[i]-1]+k]) k++;else k=0;h[rank[i]]=k;}
}
int a[maxn],sa[maxn],height[maxn],rank[maxn];
int v[maxn],vis[1002],r,n,len,j;
char s[1002];
bool judge(int m)
{int sum=0;mem(vis,0); vis[0]=1;if(!vis[v[sa[0]]]) sum++;vis[v[sa[0]]]=1;for(int i=1;i<len;i++){if(height[i]<m) sum=0,mem(vis,0),vis[0]=1;if(!vis[v[sa[i]]]) sum++;if(sum>n/2) return true;vis[v[sa[i]]]=1;}return false;
}
int binary()
{int ans=-1,mid,l=1;while(l<=r){mid=(l+r)>>1;if(judge(mid)) ans=mid,l=mid+1;else r=mid-1;}return ans;
}
void print(int st,int length)
{for(int i=st;i<st+length;i++)printf("%c",a[i]-5);puts("");
}
int main()
{//freopen("1.txt","r",stdin);bool flag=false;while(scanf("%d",&n)&&n){if(flag) puts("");else flag=true;len=r=j=0;for(int i=1;i<=n;i++){scanf("%s",s);int len1=strlen(s);if(r<len1) r=len1;//二分上限for(int k=0;k<len1;k++)a[len+k]=s[k]+5,v[len+k]=i;//v记录在哪个串中a[len+len1]=++j;//字符串中间用没出现过的字符隔开v[len+len1]=0;len=len+len1+1;}len--;if(n==1) printf("%s\n",s);else{suffix(a,sa,len,256);calcHeight(a,sa,height,rank,len);int length=binary();if(length==-1) puts("?");else{int sum=0,i;mem(vis,0);vis[0]=1;//标记中间间隔的字符已经访问过if(!vis[v[sa[0]]]) sum++;vis[v[sa[0]]]=1;for(i=1;i<len;i++){if(height[i]<length){if(sum>n/2) print(sa[i-1],length);sum=0,mem(vis,0),vis[0]=1;}if(!vis[v[sa[i]]]) sum++;vis[v[sa[i]]]=1;}if(sum>n/2) print(sa[i-1],length);}}}return 0;
}


这篇关于POJ 3294 后缀数组:求不小于k个字符串中的最长子串的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1043615

相关文章

hdu2241(二分+合并数组)

题意:判断是否存在a+b+c = x,a,b,c分别属于集合A,B,C 如果用暴力会超时,所以这里用到了数组合并,将b,c数组合并成d,d数组存的是b,c数组元素的和,然后对d数组进行二分就可以了 代码如下(附注释): #include<iostream>#include<algorithm>#include<cstring>#include<stack>#include<que

poj2406(连续重复子串)

题意:判断串s是不是str^n,求str的最大长度。 解题思路:kmp可解,后缀数组的倍增算法超时。next[i]表示在第i位匹配失败后,自动跳转到next[i],所以1到next[n]这个串 等于 n-next[n]+1到n这个串。 代码如下; #include<iostream>#include<algorithm>#include<stdio.h>#include<math.

poj3261(可重复k次的最长子串)

题意:可重复k次的最长子串 解题思路:求所有区间[x,x+k-1]中的最小值的最大值。求sa时间复杂度Nlog(N),求最值时间复杂度N*N,但实际复杂度很低。题目数据也比较水,不然估计过不了。 代码入下: #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstring

spoj705( 求不相同的子串个数)

题意:求串s的不同子串的个数 解题思路:任何子串都是某个后缀的前缀,对n个后缀排序,求某个后缀的前缀的个数,减去height[i](第i个后缀与第i-1 个后缀有相同的height[i]个前缀)。 代码如下: #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstrin

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO

hdu 2602 and poj 3624(01背包)

01背包的模板题。 hdu2602代码: #include<stdio.h>#include<string.h>const int MaxN = 1001;int max(int a, int b){return a > b ? a : b;}int w[MaxN];int v[MaxN];int dp[MaxN];int main(){int T;int N, V;s

poj 1511 Invitation Cards(spfa最短路)

题意是给你点与点之间的距离,求来回到点1的最短路中的边权和。 因为边很大,不能用原来的dijkstra什么的,所以用spfa来做。并且注意要用long long int 来存储。 稍微改了一下学长的模板。 stack stl 实现代码: #include<stdio.h>#include<stack>using namespace std;const int M

poj 3259 uva 558 Wormholes(bellman最短路负权回路判断)

poj 3259: 题意:John的农场里n块地,m条路连接两块地,w个虫洞,虫洞是一条单向路,不但会把你传送到目的地,而且时间会倒退Ts。 任务是求你会不会在从某块地出发后又回来,看到了离开之前的自己。 判断树中是否存在负权回路就ok了。 bellman代码: #include<stdio.h>const int MaxN = 501;//农场数const int

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];