POJ2406 power strings——哈希/KMP

2024-02-04 11:58
文章标签 哈希 kmp strings power poj2406

本文主要是介绍POJ2406 power strings——哈希/KMP,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

题目传送门
题目大意:
给定若干个长度 ≤ 106 10 6 的字符串,询问每个字符串最多是由多少个相同的子字符串重复连接而成的。如: ababab a b a b a b 则最多有 3 3 ab 连接而成。

样例输入:
abcd
aaaa
ababab
. //当读入为.时结束程序
样例输出
1
4
3


这道题是一道有趣的题,有两种思路,第一种是哈希。
我们考虑哈希的过程,就以 ababab a b a b a b 为例,则整个串的哈希值为(我的乘数是233)
233(233(233(233(233a+b)+a)+b)+a)+b 233 ∗ ( 233 ∗ ( 233 ∗ ( 233 ∗ ( 233 ∗ a + b ) + a ) + b ) + a ) + b
这是最基础的哈希过程,我们把它拆开,就成了下式:
(a2335+b2334)+(a2333+b2332)+(a233+b) ( a ∗ 233 5 + b ∗ 233 4 ) + ( a ∗ 233 3 + b ∗ 233 2 ) + ( a ∗ 233 + b )
我们考虑 ab a b 的哈希值,为 a233+b a ∗ 233 + b ,设 ab a b 的哈希值为 x x ,则整个串的哈希值为x2334+x2332+x2330
其实就是 x x 乘以一个等比数列,而这个数列为1,233l,2332l233Ll其中 l l 为我们要求的字串的长度,L为大串的长度,根据等比数列公式,这个数列的和是 1pL1pl 1 − p L 1 − p l ,所以枚举 l l ,并求出当前串的哈希值,如果其乘以左边的数等于大串的哈希值,那么我们要找的就是这个字串。(由于pl会很大,所以这道题要使用乘法逆元)

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#define MD 1000000007
#define ll long long
using namespace std;
char s[1000005];
ll l,a,b,lst,bin[1000005];
ll pows(ll a,ll b){ll base=1;while(b){if(b&1) base=base*a%MD;a=a*a%MD;b/=2;}return base;
}
int main()
{bin[0]=1;for(ll i=1;i<=1000000;i++) bin[i]=bin[i-1]*233%MD;while(~scanf("%s",s+1)){if(s[1]=='.') break;l=strlen(s+1);lst=0;a=0;b=0;for(ll i=1;i<=l;i++) a=(a*233+s[i])%MD;for(ll i=l;i>=1;i--){if(l%i) continue;for(ll j=lst+1;j<=l/i;j++) b=(b*233+s[j])%MD;lst=(l/i);ll x=b;x=x*(bin[l]-1+MD)%MD;x=x*pows(bin[l/i]-1,MD-2)%MD;if(x==a){printf("%d\n",i);break;}}}return 0;
}

第二种方法十分巧妙,运用的是KMP算法。首先我们求出这个字符串的 next n e x t 。我们考虑 next n e x t 的性质,如果一个长为 L L 字符串被一个小字符串分成m条,那么它的 next n e x t 是多少? Lm1m L ∗ m − 1 m ,我们因为 next n e x t 是它最长的不等于自己的相同的前缀和后缀。因为不等于自己,又要最长,所以只能乘以 m1m m − 1 m ,所以如果真的能被分成 m m 条,那么Lnxt[L]整除 L L ,并且答案就是LLnxt[L]

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
char s[1000005];
int nxt[1000005],l;
void getnext(){int k=-1,j=0;nxt[0]=-1;while(j<l){if(k==-1||s[k]==s[j]){k++;j++;nxt[j]=k;}else k=nxt[k];}
}
int main()
{while(~scanf("%s",s)){if(s[0]=='.') break;l=strlen(s);getnext();printf("%d\n",l%(l-nxt[l])?1:l/(l-nxt[l]));}return 0;
}

这篇关于POJ2406 power strings——哈希/KMP的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/677415

相关文章

哈希leetcode-1

目录 1前言 2.例题  2.1两数之和 2.2判断是否互为字符重排 2.3存在重复元素1 2.4存在重复元素2 2.5字母异位词分组 1前言 哈希表主要是适合于快速查找某个元素(O(1)) 当我们要频繁的查找某个元素,第一哈希表O(1),第二,二分O(log n) 一般可以分为语言自带的容器哈希和用数组模拟的简易哈希。 最简单的比如数组模拟字符存储,只要开26个c

poj2406(连续重复子串)

题意:判断串s是不是str^n,求str的最大长度。 解题思路:kmp可解,后缀数组的倍增算法超时。next[i]表示在第i位匹配失败后,自动跳转到next[i],所以1到next[n]这个串 等于 n-next[n]+1到n这个串。 代码如下; #include<iostream>#include<algorithm>#include<stdio.h>#include<math.

usaco 1.3 Prime Cryptarithm(简单哈希表暴搜剪枝)

思路: 1. 用一个 hash[ ] 数组存放输入的数字,令 hash[ tmp ]=1 。 2. 一个自定义函数 check( ) ,检查各位是否为输入的数字。 3. 暴搜。第一行数从 100到999,第二行数从 10到99。 4. 剪枝。 代码: /*ID: who jayLANG: C++TASK: crypt1*/#include<stdio.h>bool h

codeforces535D:Tavas and Malekas(KMP)

(i-1 , i)有重合的时候 ,从第i位开始的子串必须是模式串的前缀。 而同时,从第i位开始的子串本来就已经是模式串的后缀了。 typedef long long LL ;const int maxn = 1000008 ;int next[maxn] ;void getnext(char s[]){int len = strlen(s) ;next[0] = -1 ;i

fzu 2275 Game KMP

Problem 2275 Game Time Limit: 1000 mSec    Memory Limit : 262144 KB  Problem Description Alice and Bob is playing a game. Each of them has a number. Alice’s number is A, and Bob’s number i

哈希表的底层实现(1)---C++版

目录 哈希表的基本原理 哈希表的优点 哈希表的缺点 应用场景 闭散列法 开散列法 开放定值法Open Addressing——线性探测的模拟实现 超大重点部分评析 链地址法Separate Chaining——哈希桶的模拟实现 哈希表(Hash Table)是一种数据结构,它通过将键(Key)映射到值(Value)的方式来实现快速的数据存储与查找。哈希表的核心概念是哈希

Spark MLlib模型训练—聚类算法 PIC(Power Iteration Clustering)

Spark MLlib模型训练—聚类算法 PIC(Power Iteration Clustering) Power Iteration Clustering (PIC) 是一种基于图的聚类算法,用于在大规模数据集上进行高效的社区检测。PIC 算法的核心思想是通过迭代图的幂运算来发现数据中的潜在簇。该算法适用于处理大规模图数据,特别是在社交网络分析、推荐系统和生物信息学等领域具有广泛应用。Spa

哈希表的封装和位图

文章目录 2 封装2.1 基础框架2.2 迭代器(1)2.3 迭代器(2) 3. 位图3.1 问题引入3.2 左移和右移?3.3 位图的实现3.4 位图的题目3.5 位图的应用 2 封装 2.1 基础框架 文章 有了前面map和set封装的经验,容易写出下面的代码 // UnorderedSet.h#pragma once#include "HashTable.h"

【408数据结构】散列 (哈希)知识点集合复习考点题目

苏泽  “弃工从研”的路上很孤独,于是我记下了些许笔记相伴,希望能够帮助到大家    知识点 1. 散列查找 散列查找是一种高效的查找方法,它通过散列函数将关键字映射到数组的一个位置,从而实现快速查找。这种方法的时间复杂度平均为(

PHP: 深入了解一致性哈希

前言 随着memcache、redis以及其它一些内存K/V数据库的流行,一致性哈希也越来越被开发者所了解。因为这些内存K/V数据库大多不提供分布式支持(本文以redis为例),所以如果要提供多台redis server来提供服务的话,就需要解决如何将数据分散到redis server,并且在增减redis server时如何最大化的不令数据重新分布,这将是本文讨论的范畴。 取模算法 取模运