2019湖南省赛 C.Distinct Substrings(哈希+二分,扩展KMP)

2024-04-15 23:32

本文主要是介绍2019湖南省赛 C.Distinct Substrings(哈希+二分,扩展KMP),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

思路:
串的最后加上i以后,实际上加上了 n + 1 n+1 n+1个串,我们要减去重复的子串个数。
假设串加上 i i i后,对于长度为 m i d mid mid的后缀发生重复,那么对于长度为 1... m i d − 1 1...mid-1 1...mid1的后缀也会发生重复,所以要判断有 m i d mid mid个重复子串,实际就是判断新串长度为 m i d mid mid的后缀和旧串某个长度为 m i d mid mid的后缀发生重复。这个过程具有单调性,所以可
以哈希+二分写。

判断长度为 m i d mid mid,且以 i i i为结尾的后缀是否在原串中发生重复,除了用哈希,还要对每个数建立个邻接表定位其出现的位置,以此减少复杂度。

u p d : upd: upd:
按照上面的解法,实质上是求新串与旧串某个前缀的最大公共后缀,将串反一下,问题就变成了求新串与旧串所有后缀的最大公共前缀,这就成了扩展KMP裸题了。

ps:在牛客上这题内存不稳定,算好的5e6的int数组前面几次超内存,后面再交就A了,很迷。

哈希+二分

#include <cstdio>
#include <cstring>
#include <iostream>
#include <cstdlib>
#include <cmath>
#include <algorithm>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
const int maxn = 1e6 + 7;
const int mod = 1e9 + 7;
const ll Base = 7537;
int n,m;
int head[maxn],nex[maxn];
int h[maxn],base[maxn];
int p[maxn];int get(int l,int r) {return ((h[r] - 1ll * h[l - 1] * base[r - l + 1] % mod) % mod + mod) % mod;
}bool check(int mid,int x) {int h1 = get(n + 1 - mid + 1,n + 1);for(int i = head[x];i && i >= mid;i = nex[i]) {int h2 = get(i - mid + 1,i);if(h1 == h2) return true;}return false;
}int main() {p[0] = 1;base[0] = 1;for(int i = 1;i < maxn;i++) {p[i] = 1ll * p[i - 1] * 3 % mod;base[i] = 1ll * base[i - 1] * Base % mod;}while(~scanf("%d%d",&n,&m)) {for(int i = 1;i <= m;i++) {head[i] = 0;}for(int i = 1;i <= n;i++) {int x;scanf("%d",&x);h[i] = (1ll * h[i - 1] * Base % mod + x) % mod;nex[i] = head[x];head[x] = i;}ll ans = 0;for(int i = 1;i <= m;i++) {h[n + 1] = (1ll * h[n] * Base % mod + i) % mod;int l = 0,r = n,res = 0;if(!head[i]) {res = 0;} else {while(l <= r) {int mid = (l + r) >> 1;if(check(mid,i)) {l = mid + 1;res = mid;} else {r = mid - 1;}}}ans ^= 1ll * p[i] * (n + 1 - res) % mod;}printf("%lld\n",ans);}return 0;
}

扩展KMP写法

#include <cstdio>
#include <cstring>
#include <iostream>
#include <cstdlib>
#include <cmath>
#include <algorithm>
#include <vector>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
const int maxn = 1e6 + 3;
const int mod = 1e9 + 7;
int n, m, z[maxn],p[maxn];
int a[maxn],head[maxn],nex[maxn];inline void Z() {for (int i = 1; i <= n; i++) z[i] = 0;z[1] = n;for (int i = 2, l = 0, r = 0; i <= n; i++) {if (i <= r) z[i] = min(z[i-l+1], r - i + 1);while (i + z[i] <= n && a[i+z[i]] == a[z[i]+1]) ++z[i];if (i + z[i] - 1 > r) l = i, r = i + z[i] - 1;}
}int main() {p[0] = 1;for(int i = 1;i < maxn;i++) {p[i] = 1ll * p[i - 1] * 3 % mod;}while(~scanf("%d%d",&n,&m)) {for(int i = 1;i <= m;i++) {head[i] = 0;}for(int i = 1;i <= n;i++) {scanf("%d",&a[i]);}reverse(a + 1, a + 1 + n);for(int i = 1;i <= n;i++) {nex[i] = head[a[i]];head[a[i]] = i;}Z();z[n + 1] = 0;ll ans = 0;for(int i = 1;i <= m;i++) {int now = i;int mx = 0;for(int j = head[now];j;j = nex[j]) {mx = max(mx,z[j + 1] + 1);}
//            printf("%d: %d\n",i,mx);ans ^= 1ll * p[i] * (n + 1 - mx) % mod;}printf("%lld\n",ans);}return 0;
}

这篇关于2019湖南省赛 C.Distinct Substrings(哈希+二分,扩展KMP)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/907232

相关文章

哈希leetcode-1

目录 1前言 2.例题  2.1两数之和 2.2判断是否互为字符重排 2.3存在重复元素1 2.4存在重复元素2 2.5字母异位词分组 1前言 哈希表主要是适合于快速查找某个元素(O(1)) 当我们要频繁的查找某个元素,第一哈希表O(1),第二,二分O(log n) 一般可以分为语言自带的容器哈希和用数组模拟的简易哈希。 最简单的比如数组模拟字符存储,只要开26个c

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu2241(二分+合并数组)

题意:判断是否存在a+b+c = x,a,b,c分别属于集合A,B,C 如果用暴力会超时,所以这里用到了数组合并,将b,c数组合并成d,d数组存的是b,c数组元素的和,然后对d数组进行二分就可以了 代码如下(附注释): #include<iostream>#include<algorithm>#include<cstring>#include<stack>#include<que

hdu2289(简单二分)

虽说是简单二分,但是我还是wa死了  题意:已知圆台的体积,求高度 首先要知道圆台体积怎么求:设上下底的半径分别为r1,r2,高为h,V = PI*(r1*r1+r1*r2+r2*r2)*h/3 然后以h进行二分 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#includ

usaco 1.3 Prime Cryptarithm(简单哈希表暴搜剪枝)

思路: 1. 用一个 hash[ ] 数组存放输入的数字,令 hash[ tmp ]=1 。 2. 一个自定义函数 check( ) ,检查各位是否为输入的数字。 3. 暴搜。第一行数从 100到999,第二行数从 10到99。 4. 剪枝。 代码: /*ID: who jayLANG: C++TASK: crypt1*/#include<stdio.h>bool h

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

BUUCTF靶场[web][极客大挑战 2019]Http、[HCTF 2018]admin

目录   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 [web][HCTF 2018]admin 考点:弱密码字典爆破 四种方法:   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 访问环境 老规矩,我们先查看源代码

poj 2976 分数规划二分贪心(部分对总体的贡献度) poj 3111

poj 2976: 题意: 在n场考试中,每场考试共有b题,答对的题目有a题。 允许去掉k场考试,求能达到的最高正确率是多少。 解析: 假设已知准确率为x,则每场考试对于准确率的贡献值为: a - b * x,将贡献值大的排序排在前面舍弃掉后k个。 然后二分x就行了。 代码: #include <iostream>#include <cstdio>#incl

poj 3104 二分答案

题意: n件湿度为num的衣服,每秒钟自己可以蒸发掉1个湿度。 然而如果使用了暖炉,每秒可以烧掉k个湿度,但不计算蒸发了。 现在问这么多的衣服,怎么烧事件最短。 解析: 二分答案咯。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <c

poj 3258 二分最小值最大

题意: 有一些石头排成一条线,第一个和最后一个不能去掉。 其余的共可以去掉m块,要使去掉后石头间距的最小值最大。 解析: 二分石头,最小值最大。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <c