• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            AC自動機模板題——HDU2222

            Posted on 2011-10-19 19:47 Mato_No1 閱讀(970) 評論(0)  編輯 收藏 引用 所屬分類: 字符串匹配
            具體題目見HDU2222,其實就是一個裸的多串匹配的問題(給出一個主串和N個子串,求出幾個子串在主串中出現(xiàn)過)。

            我真是太沙茶了……這么水的題目調(diào)了N久,找了N位神犇幫我看代碼,最終才找出來BUG……

            易疵點:
            (1)本題的子串是可以相同的,此時Trie的每個結(jié)點要設(shè)一個mul值,表示該結(jié)點對應(yīng)的字符串在所有子串中重復的次數(shù),另外,不要為了省空間把mul定義成char型,有可能所有的字符串全相同,因此需要定義成int(事實證明不會爆空間),這是本沙茶被折磨了這么久的主要原因
            (2)Trie采用靜態(tài)存儲,0號結(jié)點作為空結(jié)點(NULL),因此真正的結(jié)點編號從1開始,另外root一般都是1號結(jié)點;
            (3)注意在建立自動機以及匹配的時候,所有要沿fail上溯的地方,其邊界都是0(NULL,注意不是root)或者找到一個有對應(yīng)子結(jié)點的結(jié)點。注意到0還沒有找到的處理方法:在建立自動機的時候,將T[j]置為root;在匹配的時候,將x置為root;

            代碼(模板)(那些標了Attention的地方都是易疵的):
            #include <iostream>
            #include 
            <stdio.h>
            #include 
            <string>
            using namespace std;
            using std::string;
            #define re(i, n) for (int i=0; i<n; i++)
            #define root 1
            const int MAXN = 500001, MAXLEN = 1000001, SZ = 26, INF = ~0U >> 2;
            struct node {
                
            int mul, ch[SZ], fail;    //Attention
            } T[MAXN];
            int N, Q[MAXN], res;
            string s0, A;
            char tmp[MAXLEN], tmp0[51];
            void ins()
            {
                
            int len = s0.length(), x = root, c;
                re(i, len) {
                    c 
            = s0[i] - 97;
                    
            if (!T[x].ch[c]) {T[x].ch[c] = ++N; T[N].mul = 0; re(j, SZ) T[N].ch[j] = 0;}
                    x 
            = T[x].ch[c];
                }
                T[x].mul
            ++;
            }
            void mkf()
            {
                Q[
            0= root; T[root].fail = 0;
                
            int i, j, x;
                
            for (int front=0, rear=0; front<=rear; front++) {
                    i 
            = Q[front];
                    re(k, SZ) 
            if (j = T[i].ch[k]) {
                        x 
            = T[i].fail;
                        
            while (x && !T[x].ch[k]) x = T[x].fail;        //Attention
                        if (x) T[j].fail = T[x].ch[k]; else T[j].fail = root;    //Attention
                        Q[++rear] = j;
                    }
                }
            }
            void solve()
            {
                
            int len = A.length(), x = root, y, c; res = 0;
                re(i, len) {
                    c 
            = A[i] - 97;
                    
            while (x && !T[x].ch[c]) x = T[x].fail;    //Attention
                    if (!x) x = root; else x = T[x].ch[c];    //Attention
                    y = x;
                    
            while (y) {res += T[y].mul; T[y].mul = 0; y = T[y].fail;}      //Attention
                }
            }
            int main()
            {
                
            int tests, n;
                scanf(
            "%d"&tests);
                re(testno, tests) {
                    N 
            = 1; T[root].mul = 0; re(i, SZ) T[root].ch[i] = 0;
                    scanf(
            "%d"&n); getchar();
                    re(i, n) {
                        gets(tmp0);
                        s0 
            = tmp0;
                        ins();
                    }
                    gets(tmp);
                    A 
            = tmp;
                    mkf();
                    solve();
                    printf(
            "%d\n", res);
                }
                
            return 0;
            }

            【2011年10月19日】今天發(fā)現(xiàn)了匹配過程中的一個可優(yōu)化的地方:對于一個點x以及它的所有返回結(jié)點(這里把所有沿著x的失敗指針不斷上溯直到root路徑上的結(jié)點都稱為返回結(jié)點),由于不可重復計數(shù),可以將它們的mul值置為原來mul值的相反數(shù)(-mul),而不是0,表示該結(jié)點已經(jīng)統(tǒng)計過。這樣在下一次y的上溯過程中一旦發(fā)現(xiàn)一個mul值為負的點就不用繼續(xù)上溯了,因為上面的點一定也已經(jīng)統(tǒng)計過了。
            當然,這僅限于單主串,如果是多主串則需要在每次匹配之前把Trie樹中所有結(jié)點的mul值(如果是負數(shù)的的話)全部重新取反。為了節(jié)省時間,可以在匹配過程中把所有統(tǒng)計過的(mul值改為負數(shù)的)結(jié)點全部放進一個輔助的隊列里,然后取反時只要處理隊列中的結(jié)點就行了。

            加入該優(yōu)化后的代碼(solve部分):
            void solve()
            {
                
            int len = A.length(), x = root, y, c; res = 0;
                re(i, len) {
                    c 
            = A[i] - 97;
                    
            while (x && !T[x].ch[c]) x = T[x].fail;
                    
            if (!x) x = root; else x = T[x].ch[c];
                    y 
            = x;
                    
            while (y && T[y].mul >= 0) {res += T[y].mul; T[y].mul = -T[y].mul; y = T[y].fail;}
                }
            }

            下面是優(yōu)化的實測結(jié)果(第一個為優(yōu)化后的,第二個為優(yōu)化前的),可以看出,該優(yōu)化的力度很大。
            久久久久无码精品国产不卡| 国产精品青草久久久久婷婷 | 色综合久久无码中文字幕| 无码乱码观看精品久久| 国产精品亚洲综合专区片高清久久久 | 色天使久久综合网天天| 久久久国产99久久国产一| 亚洲七七久久精品中文国产| 久久人人爽人人爽人人片AV东京热 | 久久96国产精品久久久| …久久精品99久久香蕉国产 | 99久久成人18免费网站| 日韩精品久久久久久| 国产伊人久久| 久久狠狠爱亚洲综合影院| 五月丁香综合激情六月久久| 久久天天躁狠狠躁夜夜网站| 91精品国产高清久久久久久io| 国产91色综合久久免费分享| 国产精品成人久久久久三级午夜电影| 久久精品成人免费国产片小草| 无码乱码观看精品久久| 久久亚洲欧美国产精品| 国产99久久久国产精免费| 亚洲日韩欧美一区久久久久我 | 久久久噜噜噜久久中文字幕色伊伊| 无码人妻少妇久久中文字幕 | 国内精品久久久久久中文字幕| 亚洲国产综合久久天堂| 日韩人妻无码精品久久久不卡 | 久久99精品久久久久久 | 久久精品成人欧美大片 | 久久久综合九色合综国产| 一级a性色生活片久久无少妇一级婬片免费放 | 久久这里只有精品视频99| 99精品久久精品一区二区| 久久99精品国产一区二区三区| 久久午夜免费视频| AAA级久久久精品无码区| 亚洲婷婷国产精品电影人久久| 国产精品久久永久免费|