SPOJ694 SPOJ705 ——不同子串的总数

2024-06-22 18:58

本文主要是介绍SPOJ694 SPOJ705 ——不同子串的总数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

题意:给定字符串S,求S的不同子串的总数量。

求出SA数组与Height数组,每个子串必然是某个后缀的前缀。令S的长度为N,则后缀SA[i]可以贡献出N-SA[i]个前缀。但其中有Height[i]个与之前的是重复的,因此要减去。

另外,在套模板的时候,处理的字符串S实际上比源字符串多一个结束标记,因此计算出的不同子串数量比答案要多N(N为S的长度,非源的长度,实际上就是源长度加1)。

SPOJ694

//求不同子串的数量 
#include <cstdio>
#include <algorithm>
using namespace std;int const SIZE = 1005;
//分隔符,多串连接时需要用到,第0个为结束符,肯定用到
char const DELIMETER[] = {'#'};
int const DELIMETER_CNT = 1;
//字母表的字母个数
int const ALPHA_SIZE = DELIMETER_CNT + 128;
//char转int
inline int tr(char ch){if ( DELIMETER[0] == ch ) return 0;return ch;
}
//辅助数组,以下划线开头
int _wa[SIZE],_wb[SIZE],_wv[SIZE],_ws[SIZE];
//辅助函数
int _cmp(int const r[],int a,int b,int l){return r[a]==r[b]&&r[a+l]==r[b+l];}
//求后缀数组的倍增算法
//r: 源数组,且除r[n-1]外,其余r[i]>0
//n: r的长度
//m: r中的元素取值的上界,即任意r[i]<m
//sa:后缀数组,即结果
void da(int const r[],int n,int m,int sa[]){int i,j,p,*x=_wa,*y=_wb,*t;for(i=0;i<m;i++) _ws[i] = 0;for(i=0;i<n;i++) _ws[x[i] = r[i]]++;for(i=1;i<m;i++) _ws[i] += _ws[i-1];for(i=n-1;i>=0;i--) sa[--_ws[x[i]]]=i;for(j=1,p=1;p<n;j*=2,m=p){for(p=0,i=n-j;i<n;i++) y[p++]=i;for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;for(i=0;i<n;i++) _wv[i]=x[y[i]];for(i=0;i<m;i++) _ws[i]=0;for(i=0;i<n;i++) _ws[_wv[i]]++;for(i=1;i<m;i++) _ws[i] += _ws[i-1];for(i=n-1;i>=0;i--) sa[--_ws[_wv[i]]] = y[i];for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)x[sa[i]]=_cmp(y,sa[i-1],sa[i],j)?p-1:p++;}return;
}//计算rank数组与height数组
//r:  源数组
//sa: 后缀数组
//n:  源数组的长度
//rank: rank数组,即计算结果
//height: height数组,即计算结果
void calHeight(int const r[],int const sa[],int n,int rank[],int height[]){int i,j,k=0;for(i=1;i<n;i++) rank[sa[i]]=i;for(i=0;i<n-1;height[rank[i++]]=k)for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);return;
}void dispArray(int const a[],int n){for(int i=0;i<n;++i)printf("%d ",a[i]);printf("\n");
}int R[SIZE];
int SA[SIZE],Rank[SIZE],Height[SIZE];
int N,K;
char A[SIZE];
bool read(){scanf("%s",A);for(N=0;A[N];++N) R[N] = tr(A[N]);R[N++] = 0;return true;
}int proc(){da(R,N,ALPHA_SIZE,SA);calHeight(R,SA,N,Rank,Height);/*dispArray(R,N);dispArray(SA,N);dispArray(Rank,N);dispArray(Height,N);//*///查找不同的子串数量,即查找不同的前缀数量//每个后缀可以带入N-SA[i]个前缀,其中相同的有Height[i]个//最后的结束标记会带入N个,不应计入答案int r = -N;for(int i=0;i<N;++i) r += N - SA[i] - Height[i];return r;
}int main(){int nofkase;scanf("%d",&nofkase);while( nofkase-- ){read();printf("%d\n",proc());}return 0;
}

SPOJ705

//DC3算法在这里慢于倍增
//不同子串的个数 
#include <cstdio>
#include <algorithm>
using namespace std;int const SIZE = 50005;
//分隔符,多串连接时需要用到,第0个为结束符,肯定用到
char const DELIMETER[] = {'#'};
int const DELIMETER_CNT = 1;
//字母表的字母个数
int const ALPHA_SIZE = DELIMETER_CNT + 128;
//char转int
inline int tr(char ch){if ( DELIMETER[0] == ch ) return 0;return ch;
}
//辅助宏,以下划线开头
#define _F(x) ((x)/3+((x)%3==1?0:tb))
#define _G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)
//辅助数组,以下划线开头
int _wa[SIZE],_wb[SIZE],_wv[SIZE],_ws[SIZE];
//辅助函数
int _c0(int const r[],int a,int b){return r[a] == r[b]&& r[a+1] == r[b+1]&& r[a+2] == r[b+2];
}
int _c12(int k,int *r,int a,int b){if( 2 == k ) return r[a]<r[b] || ( r[a]==r[b]&&_c12(1,r,a+1,b+1) );return r[a]<r[b] || ( r[a]==r[b]&&_wv[a+1]<_wv[b+1] );
}
void _sort(int const r[],int *a,int *b,int n,int m){int i;for(i=0;i<n;i++) _wv[i] = r[a[i]];for(i=0;i<m;i++) _ws[i] = 0;for(i=0;i<n;i++) _ws[_wv[i]]++;for(i=1;i<m;i++) _ws[i] += _ws[i-1];for(i=n-1;i>=0;i--) b[--_ws[_wv[i]]] = a[i];return;
}
//后缀数组的dc3算法,使用此dc3算法一定要保证r与sa的最大长度不小于3倍原长度
//r: 源数组,且除r[n-1]外,其余r[i]>0
//n: r的长度
//m: r中的元素取值的上界,即任意r[i]<m
//sa:后缀数组,即结果
void dc3(int r[],int n,int m,int sa[]){int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p;r[n] = r[n+1] = 0;for(i=0;i<n;i++) if(i%3!=0) _wa[tbc++]=i;_sort(r+2,_wa,_wb,tbc,m);_sort(r+1,_wb,_wa,tbc,m);_sort(r,_wa,_wb,tbc,m);for(p=1,rn[_F(_wb[0])]=0,i=1;i<tbc;i++)rn[_F(_wb[i])] = _c0(r,_wb[i-1],_wb[i])?p-1:p++;if(p<tbc) dc3(rn,tbc,p,san);else for(i=0;i<tbc;i++) san[rn[i]]=i;for(i=0;i<tbc;i++) if(san[i]<tb) _wb[ta++] = san[i]*3;if(n%3==1) _wb[ta++]=n-1;_sort(r,_wb,_wa,ta,m);for(i=0;i<tbc;i++) _wv[_wb[i] = _G(san[i])] = i;for(i=0,j=0,p=0;i<ta&&j<tbc;p++)sa[p] = _c12(_wb[j]%3,r,_wa[i],_wb[j]) ? _wa[i++] : _wb[j++];for(;i<ta;p++) sa[p] = _wa[i++];for(;j<tbc;p++) sa[p] = _wb[j++];return;
}
//计算rank数组与height数组
//r:  源数组
//sa: 后缀数组
//n:  源数组的长度
//rank: rank数组,即计算结果
//height: height数组,即计算结果
void calHeight(int const r[],int const sa[],int n,int rank[],int height[]){int i,j,k=0;for(i=1;i<n;i++) rank[sa[i]]=i;for(i=0;i<n-1;height[rank[i++]]=k)for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);return;
}void dispArray(int const a[],int n){for(int i=0;i<n;++i)printf("%d ",a[i]);printf("\n");
}int R[SIZE*3],SA[SIZE*3];//3倍
int Rank[SIZE],Height[SIZE];
int N,K;
char A[SIZE];
bool read(){scanf("%s",A);for(N=0;A[N];++N) R[N] = tr(A[N]);R[N++] = 0;return true;
}int proc(){dc3(R,N,ALPHA_SIZE,SA);calHeight(R,SA,N,Rank,Height);/*dispArray(R,N);dispArray(SA,N);dispArray(Rank,N);dispArray(Height,N);//*///查找不同的子串数量,即查找不同的前缀数量//每个后缀可以带入N-SA[i]个前缀(N为带结束标记的长度),其中相同的有Height[i]个//最后的结束标记会带入N个,不应计入答案int r = -N;for(int i=0;i<N;++i) r += N - SA[i] - Height[i];return r;
}int main(){int nofkase;scanf("%d",&nofkase);while( nofkase-- ){read();printf("%d\n",proc());}return 0;
}

这篇关于SPOJ694 SPOJ705 ——不同子串的总数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1085140

相关文章

2. c#从不同cs的文件调用函数

1.文件目录如下: 2. Program.cs文件的主函数如下 using System;using System.Collections.Generic;using System.Linq;using System.Threading.Tasks;using System.Windows.Forms;namespace datasAnalysis{internal static

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

poj2406(连续重复子串)

题意:判断串s是不是str^n,求str的最大长度。 解题思路:kmp可解,后缀数组的倍增算法超时。next[i]表示在第i位匹配失败后,自动跳转到next[i],所以1到next[n]这个串 等于 n-next[n]+1到n这个串。 代码如下; #include<iostream>#include<algorithm>#include<stdio.h>#include<math.

poj3261(可重复k次的最长子串)

题意:可重复k次的最长子串 解题思路:求所有区间[x,x+k-1]中的最小值的最大值。求sa时间复杂度Nlog(N),求最值时间复杂度N*N,但实际复杂度很低。题目数据也比较水,不然估计过不了。 代码入下: #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstring

spoj705( 求不相同的子串个数)

题意:求串s的不同子串的个数 解题思路:任何子串都是某个后缀的前缀,对n个后缀排序,求某个后缀的前缀的个数,减去height[i](第i个后缀与第i-1 个后缀有相同的height[i]个前缀)。 代码如下: #include<iostream>#include<algorithm>#include<stdio.h>#include<math.h>#include<cstrin

uva 10061 How many zero's and how many digits ?(不同进制阶乘末尾几个0)+poj 1401

题意是求在base进制下的 n!的结果有几位数,末尾有几个0。 想起刚开始的时候做的一道10进制下的n阶乘末尾有几个零,以及之前有做过的一道n阶乘的位数。 当时都是在10进制下的。 10进制下的做法是: 1. n阶位数:直接 lg(n!)就是得数的位数。 2. n阶末尾0的个数:由于2 * 5 将会在得数中以0的形式存在,所以计算2或者计算5,由于因子中出现5必然出现2,所以直接一

速了解MySQL 数据库不同存储引擎

快速了解MySQL 数据库不同存储引擎 MySQL 提供了多种存储引擎,每种存储引擎都有其特定的特性和适用场景。了解这些存储引擎的特性,有助于在设计数据库时做出合理的选择。以下是 MySQL 中几种常用存储引擎的详细介绍。 1. InnoDB 特点: 事务支持:InnoDB 是一个支持 ACID(原子性、一致性、隔离性、持久性)事务的存储引擎。行级锁:使用行级锁来提高并发性,减少锁竞争

MyBatis 切换不同的类型数据库方案

下属案例例当前结合SpringBoot 配置进行讲解。 背景: 实现一个工程里面在部署阶段支持切换不同类型数据库支持。 方案一 数据源配置 关键代码(是什么数据库,该怎么配就怎么配) spring:datasource:name: test# 使用druid数据源type: com.alibaba.druid.pool.DruidDataSource# @需要修改 数据库连接及驱动u

linux中使用rust语言在不同进程之间通信

第一种:使用mmap映射相同文件 fn main() {let pid = std::process::id();println!(

PHP最长单一子串

<?php//方法一$s='abcccddddddcdefg';$max='';while($s!=''){$i=0; while($i<strlen($s) && $s[$i]==$s[0]) $i++;if ($i>strlen($max)){$max=substr($s,0,$i);} $s=substr($s,$i);}echo $m