AC自动机 - 多模式串的匹配运用 --- HDU 3065

2024-09-05 17:32

本文主要是介绍AC自动机 - 多模式串的匹配运用 --- HDU 3065,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

病毒侵袭持续中 

Problem's Link:http://acm.hdu.edu.cn/showproblem.php?pid=3065


 

Mean: 

analyse:

 AC自动机的运用.

这一题需要将模式串都存储下来,还有就是base的取值一定要弄清楚,由于这题的模式串都是大写字母所以我们可以通过剪枝来加速。

Time complexity:o(n)+o(ml) 

 

Source code:

// Memory   Time
// 1347K     0MS
// by : Snarl_jsb
// 2014-09-30-21.00
#include<algorithm>
#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<iostream>
#include<vector>
#include<queue>
#include<stack>
#include<map>
#include<string>
#include<climits>
#include<cmath>
#define LL long long
using namespace std;

char backup [ 1002 ][ 53 ];
int res [ 1002 ];
const int N = 1010;
char str [ 2000010 ];
struct node
{
    node * next [ 26 ];     //  每个结点都对应26个字母的指针
    node * fail;     //      失配指针
    int count;       //
    int num;
    node()       //  构造函数初始化
    {
        for( int i = 0; i < 26; i ++)
            next [ i ] = NULL;
        count = 0;
        num = 0;
        fail = NULL;
    }
} * q [ 50 *N ];
node * root;
int head , tail;

void Insert( char * str , int num) //   插入单词.相当于构建一个Trie树
{
    node *p = root;
    int i = 0 , index;
    while( str [ i ])
    {
        index = str [ i ] - 'A'; //  转化为相对数字来存
        if(p -> next [ index ] == NULL) // 该字母未插入过
           p -> next [ index ] = new node();     //  为该字母申请一个结点
       p = p -> next [ index ];     //   移至下一个
        i ++;
    }
   p -> count ++;     //      记录该结点的单词总共插入的次数
   p -> num = num;
}
void build_ac_automation( node * root)         //      bfs建立fail指针
{
    root -> fail = NULL;
    q [ tail ++ ] = root;
    while( head < tail) {
        node * temp = q [ head ++ ];
        node *p = NULL;
        for( int i = 0; i < 26; i ++) {
            if( temp -> next [ i ] != NULL) {
                if( temp == root) temp -> next [ i ] -> fail = root;
                else {
                   p = temp -> fail;
                    while(p != NULL) {
                        if(p -> next [ i ] != NULL) {
                            temp -> next [ i ] -> fail = p -> next [ i ];
                            break;
                        }
                       p = p -> fail;
                    }
                    if(p == NULL) temp -> next [ i ] -> fail = root;
                }
                q [ tail ++ ] = temp -> next [ i ];
            }
        }
    }
}

int Query( node * root)       //  匹配 + 统计
{
    int i = 0 , cnt = 0 , index;
    node *p = root;
    while( str [ i ])
    {
        index = str [ i ] - 'A';
        if( index < 0|| index > 25)   ///这个地方要特别注意,由于病毒只包含大写字母,所以这儿需要剪枝,不剪枝的话其他地方加判断也可以过
        {
           p = root;
            i ++;
            continue;
        }
        while(p -> next [ index ] == NULL && p != root) //前缀是相同的,所以不管哪个指针走到了count不为0的结点上,那么该结点所代表的单词就匹配成功
           p = p -> fail; //失配情况下,p指针指向p->fail.(相当于KMP的next数组)
       p = p -> next [ index ]; //由于现在所在的位置是父节点,所以需要向下移动一个位置
        if(p == NULL)
           p = root; //如果匹配失败,移动到root,重新开始匹配
        node * temp = p; //
        while( temp != root && temp -> count > 0)   //统计--如果匹配成功,那么count>1,表示该结点代表的单词数量;否则表示该结点没有单词
        {
//            cnt += temp->count; //统计该单词出现的次数
            res [ temp -> num ] ++;   //每次回溯都会加1
//            temp->count = -1;   //!!!!!!!!!!!!!!!!!(如果要重复统计,请讲这句去掉)!!!!!!!!标记为-1,表示该单词已经加入了cnt中
            temp = temp -> fail; //判断整条链上的匹配情况
        }
        i ++;
    }
    return cnt;
}

int main()
{
    int n , m;
    while( cin >>n)
    {
        head = tail = 0;     //  清零
        root = new node();       //  申请新的root结点
        memset( backup , 0 , sizeof( backup));
        memset( res , 0 , sizeof( res));
        for( int i = 1; i <=n; ++ i)
        {
            scanf( "%s" , str);
            strcpy( backup [ i ], str);
            Insert( str , i);
        }
        build_ac_automation( root);
        scanf( "%s" , str);
        Query( root);
        for( int i = 1; i <=n; ++ i)
        {
            if( res [ i ])
            {
                printf( "%s: %d \n " , backup [ i ], res [ i ]);
            }
        }
    }
    return 0;
}

 

这篇关于AC自动机 - 多模式串的匹配运用 --- HDU 3065的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1139611

相关文章

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

在JS中的设计模式的单例模式、策略模式、代理模式、原型模式浅讲

1. 单例模式(Singleton Pattern) 确保一个类只有一个实例,并提供一个全局访问点。 示例代码: class Singleton {constructor() {if (Singleton.instance) {return Singleton.instance;}Singleton.instance = this;this.data = [];}addData(value)

usaco 1.3 Mixing Milk (结构体排序 qsort) and hdu 2020(sort)

到了这题学会了结构体排序 于是回去修改了 1.2 milking cows 的算法~ 结构体排序核心: 1.结构体定义 struct Milk{int price;int milks;}milk[5000]; 2.自定义的比较函数,若返回值为正,qsort 函数判定a>b ;为负,a<b;为0,a==b; int milkcmp(const void *va,c

poj 3974 and hdu 3068 最长回文串的O(n)解法(Manacher算法)

求一段字符串中的最长回文串。 因为数据量比较大,用原来的O(n^2)会爆。 小白上的O(n^2)解法代码:TLE啦~ #include<stdio.h>#include<string.h>const int Maxn = 1000000;char s[Maxn];int main(){char e[] = {"END"};while(scanf("%s", s) != EO

hdu 2093 考试排名(sscanf)

模拟题。 直接从教程里拉解析。 因为表格里的数据格式不统一。有时候有"()",有时候又没有。而它也不会给我们提示。 这种情况下,就只能它它们统一看作字符串来处理了。现在就请出我们的主角sscanf()! sscanf 语法: #include int sscanf( const char *buffer, const char *format, ... ); 函数sscanf()和

hdu 2602 and poj 3624(01背包)

01背包的模板题。 hdu2602代码: #include<stdio.h>#include<string.h>const int MaxN = 1001;int max(int a, int b){return a > b ? a : b;}int w[MaxN];int v[MaxN];int dp[MaxN];int main(){int T;int N, V;s

hdu 1754 I Hate It(线段树,单点更新,区间最值)

题意是求一个线段中的最大数。 线段树的模板题,试用了一下交大的模板。效率有点略低。 代码: #include <stdio.h>#include <string.h>#define TREE_SIZE (1 << (20))//const int TREE_SIZE = 200000 + 10;int max(int a, int b){return a > b ? a :

hdu 1166 敌兵布阵(树状数组 or 线段树)

题意是求一个线段的和,在线段上可以进行加减的修改。 树状数组的模板题。 代码: #include <stdio.h>#include <string.h>const int maxn = 50000 + 1;int c[maxn];int n;int lowbit(int x){return x & -x;}void add(int x, int num){while

hdu 3790 (单源最短路dijkstra)

题意: 每条边都有长度d 和花费p,给你起点s 终点t,要求输出起点到终点的最短距离及其花费,如果最短距离有多条路线,则输出花费最少的。 解析: 考察对dijkstra的理解。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstrin

hdu 2489 (dfs枚举 + prim)

题意: 对于一棵顶点和边都有权值的树,使用下面的等式来计算Ratio 给定一个n 个顶点的完全图及它所有顶点和边的权值,找到一个该图含有m 个顶点的子图,并且让这个子图的Ratio 值在所有m 个顶点的树中最小。 解析: 因为数据量不大,先用dfs枚举搭配出m个子节点,算出点和,然后套个prim算出边和,每次比较大小即可。 dfs没有写好,A的老泪纵横。 错在把index在d