本文主要是介绍POJ 3294 后缀数组+二分,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
你可能想知道为什么大多数外星生命形式类似于人类,不同的表面特征,如身高,颜色,皱纹,耳朵,眉毛等。几个人没有人类的相似性;这些通常具有几何或无定形形状,如立方体,油滑层或尘云。
答案是在星际迷航 - 下一代的第146集,题为追逐。事实证明,在绝大多数象限的生命形式最终与一个大片段的共同的DNA。
给定被表示为字母串的几个生命形式的DNA序列,您将找到由其中一半以上共享的最长子字符串。
输入
标准输入包含几个测试用例。每个测试用例开始于1≤n≤100,即生命形式的数量。 n行;每个包含代表生命形式的DNA序列的小写字母的字符串。每个DNA序列包含至少一个且不超过1000个字母。在最后一个测试用例之后包含0的行。
输出
对于每个测试用例,输出由一半以上生命形式共享的最长字符串。如果有很多,按字母顺序输出所有。如果没有至少有一个字母的解,输出“?”。在测试用例之间留下空行。
点击打开链接
题意:先是问你大于n/2个串的最长公共子串的长度,然后在这个长度的基础上,有多少子串是符合的,按字典序输出
思路:先将最长公共子串的长度求出来,然后再跑一遍,将长度符合的找出来输出就行了,PS:昨天晚上调了几个小时的bug,妹的根本就不需要自己排序,用后缀数组先符合的肯定是字典序最小的嘛,蠢死的节奏,还有就是对于每一组的前缀我们只要第一个,这个也只需要标记一下即可,后者想不到的话,我们可以在输出的时候去一下重,应该也可以还没有尝试,还有就是这道题目的相连的串之间添加的字符不能一样,不然可能会是因为添加的字符变成的最长公共子串,会影响结果
- #include <vector>
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
- #include <iostream>
- #include <algorithm>
- using namespace std;
- typedef long long ll;
- const int inf=0x3f3f3f3f;
- const int MAXN=110000;
- int wa[MAXN],wb[MAXN],wv[MAXN],ww[MAXN];
- int sa[MAXN],lcp[MAXN],Rank[MAXN],rank1[MAXN];
- int str1[MAXN];
- inline bool cmp(int *r,int a,int b,int len){
- return r[a]==r[b]&&r[a+len]==r[b+len];
- }
- void construct_sa(int *str,int n,int m){
- int i,j,p,*x=wa,*y=wb,*t;
- for(i=0;i<m;i++) ww[i]=0;
- for(i=0;i<n;i++) ww[x[i]=str[i]]++;
- for(i=1;i<m;i++) ww[i]+=ww[i-1];
- for(i=n-1;i>=0;i--) sa[--ww[x[i]]]=i;
- for(j=p=1;p<n;j<<=1,m=p){
- for(p=0,i=n-j;i<n;i++)
- y[p++]=i;
- for(i=0;i<n;i++){
- if(sa[i]>=j)
- y[p++]=sa[i]-j;
- }
- for(i=0;i<m;i++) ww[i]=0;
- for(i=0;i<n;i++) ww[wv[i]=x[y[i]]]++;
- for(i=1;i<m;i++) ww[i]+=ww[i-1];
- for(i=n-1;i>=0;i--) sa[--ww[wv[i]]]=y[i];
- for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1;i<n;i++)
- x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
- }
- }
- void construct_lcp(int n,int *str){
- for(int i=0;i<=n;i++) rank1[sa[i]]=i;
- int h=0;
- lcp[0]=0;
- for(int i=0;i<n;i++){
- int j=sa[rank1[i]-1];
- if(h>0) h--;
- for(;j+h<n&&i+h<n;h++) if(str[i+h]!=str[j+h]) break;
- lcp[rank1[i]-1]=h;
- }
- }
- int id[MAXN];
- vector<int>G;
- bool vis[1010];
- char str2[1010];
- int judge(int mid,int k,int n){
- memset(vis,0,sizeof(vis));
- int sum=0;
- for(int i=0;i<k;i++){
- if(lcp[i]<mid){
- if(sum==0) continue;
- memset(vis,0,sizeof(vis));sum=0;
- continue;
- }
- if(vis[id[sa[i]]]==0){
- vis[id[sa[i]]]=1;
- sum++;
- }
- if(vis[id[sa[i+1]]]==0){
- vis[id[sa[i+1]]]=1;
- sum++;
- }
- if(sum>n/2) return 1;
- }
- return 0;
- }
- void slove(int mid,int k,int n){
- memset(vis,0,sizeof(vis));
- int sum=0,cnt=0,flag=0;
- for(int i=0;i<k;i++){
- if(lcp[i]<mid){
- memset(vis,0,sizeof(vis));sum=0;flag=0;
- continue;
- }
- if(vis[id[sa[i]]]==0){
- vis[id[sa[i]]]=1;
- sum++;
- }
- if(vis[id[sa[i+1]]]==0){
- vis[id[sa[i+1]]]=1;
- sum++;
- }
- if(sum>n/2&&flag==0){
- G.push_back(sa[i]);
- cnt++;flag=1;
- }
- }
- for(int i=0;i<mid;i++) printf("%c",str1[G[0]+i]);
- printf("\n");
- for(int i=1;i<cnt;i++){
- if(G[i]==G[i-1]) continue;
- for(int j=0;j<mid;j++) printf("%c",str1[G[i]+j]);
- printf("\n");
- }
- }
- int main(){
- int n;
- while(scanf("%d",&n)!=-1){
- if(n==0) break;
- int k=0;G.clear();
- memset(str1,0,sizeof(str1));
- memset(id,-1,sizeof(id));
- for(int i=0;i<n;i++){
- scanf("%s",str2);
- int len=strlen(str2);
- for(int j=0;j<len;j++){
- str1[k]=str2[j];
- id[k++]=i;
- }
- if(i!=n-1) str1[k++]=150+i;
- }
- construct_sa(str1,k+1,1010);
- construct_lcp(k,str1);
- int le=0,ri=1010;
- while(ri-le>1){
- int mid=(le+ri)>>1;
- if(judge(mid,k,n)) le=mid;
- else ri=mid;
- }
- if(le==0) printf("?\n");
- else slove(le,k,n);
- printf("\n");
- }
- return 0;
- }
这篇关于POJ 3294 后缀数组+二分的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!