青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

icecream

我的代碼備份!

AC 自動機算法詳解(轉)

首先簡要介紹一下AC自動機:Aho-Corasick automation,該算法在1975年產生于貝爾實驗室,是著名的多模匹配算法之一。一個常見的例子就是給出n個單詞,再給出一段包含m個字符的文章,讓你找出有多少個單詞在文章里出現過。要搞懂AC自動機,先得有模式樹(字典樹)Trie和KMP模式匹配算法的基礎知識。AC自動機算法分為3步:構造一棵Trie樹,構造失敗指針和模式匹配過程。
     如果你對KMP算法和了解的話,應該知道KMP算法中的next函數(shift函數或者fail函數)是干什么用的。KMP中我們用兩個指針i和j分別表示,A[i-j+ 1..i]與B[1..j]完全相等。也就是說,i是不斷增加的,隨著i的增加j相應地變化,且j滿足以A[i]結尾的長度為j的字符串正好匹配B串的前 j個字符,當A[i+1]≠B[j+1],KMP的策略是調整j的位置(減小j值)使得A[i-j+1..i]與B[1..j]保持匹配且新的B[j+1]恰好與A[i+1]匹配,而next函數恰恰記錄了這個j應該調整到的位置。同樣AC自動機的失敗指針具有同樣的功能,也就是說當我們的模式串在Tire上進行匹配時,如果與當前節點的關鍵字不能繼續匹配的時候,就應該去當前節點的失敗指針所指向的節點繼續進行匹配。
      看下面這個例子:給定5個單詞:say she shr he her,然后給定一個字符串yasherhs。問一共有多少單詞在這個字符串中出現過。我們先規定一下AC自動機所需要的一些數據結構,方便接下去的編程。
1 const int kind = 26;
2 struct node{  
3      node *fail;       //失敗指針
4      node *next[kind]; //Tire每個節點的個子節點(最多個字母)
5     int count;        //是否為該單詞的最后一個節點
6      node(){           //構造函數初始化
7          fail=NULL;
8          count=0;
9          memset(next,NULL,sizeof(next));
10      }
11 }*q[500001];          //隊列,方便用于bfs構造失敗指針
12 char keyword[51];     //輸入的單詞
13 char str[1000001];    //模式串
14 int head,tail;        //隊列的頭尾指針

有了這些數據結構之后,就可以開始編程了:
    首先,將這5個單詞構造成一棵Tire,如圖-1所示。

 

1 void insert(char *str,node *root){
2      node *p=root;
3     int i=0,index;  
4     while(str[i]){
5          index=str[i]-'a';
6         if(p->next[index]==NULL) p->next[index]=new node();  
7          p=p->next[index];
8          i++;
9      }
10      p->count++;     //在單詞的最后一個節點count+1,代表一個單詞
11 }

在構造完這棵Tire之后,接下去的工作就是構造下失敗指針。構造失敗指針的過程概括起來就一句話:設這個節點上的字母為C,沿著他父親的失敗指針走,直到走到一個節點,他的兒子中也有字母為C的節點。然后把當前節點的失敗指針指向那個字母也為C的兒子。如果一直走到了root都沒找到,那就把失敗指針指向root。具體操作起來只需要:先把root加入隊列(root的失敗指針指向自己或者NULL),這以后我們每處理一個點,就把它的所有兒子加入隊列,隊列為空。

1 void build_ac_automation(node *root){
2     int i;
3      root->fail=NULL;
4      q[head++]=root;
5     while(head!=tail){
6          node *temp=q[tail++];
7          node *p=NULL;
8         for(i=0;i<26;i++){
9             if(temp->next[i]!=NULL){
10                 if(temp==root) temp->next[i]->fail=root;                 
11                 else{
12                      p=temp->fail;
13                     while(p!=NULL){  
14                         if(p->next[i]!=NULL){
15                              temp->next[i]->fail=p->next[i];
16                             break;
17                          }
18                          p=p->fail;
19                      }
20                     if(p==NULL) temp->next[i]->fail=root;
21                  }
22                  q[head++]=temp->next[i];  
23              }
24          }   
25      }
26 }

    從代碼觀察下構造失敗指針的流程:對照圖-2來看,首先root的fail指針指向NULL,然后root入隊,進入循環。第1次循環的時候,我們需要處理2個節點:root->next[‘h’-‘a’](節點h) 和 root->next[‘s’-‘a’](節點s)。把這2個節點的失敗指針指向root,并且先后進入隊列,失敗指針的指向對應圖-2中的(1),(2)兩條虛線;第2次進入循環后,從隊列中先彈出h,接下來p指向h節點的fail指針指向的節點,也就是root;進入第13行的循環后,p=p->fail也就是p=NULL,這時退出循環,并把節點e的fail指針指向root,對應圖-2中的(3),然后節點e進入隊列;第3次循環時,彈出的第一個節點a的操作與上一步操作的節點e相同,把a的fail指針指向root,對應圖-2中的(4),并入隊;第4次進入循環時,彈出節點h(圖中左邊那個),這時操作略有不同。在程序運行到14行時,由于p->next[i]!=NULL(root有h這個兒子節點,圖中右邊那個),這樣便把左邊那個h節點的失敗指針指向右邊那個root的兒子節點h,對應圖-2中的(5),然后h入隊。以此類推:在循環結束后,所有的失敗指針就是圖-2中的這種形式。

   最后,我們便可以在AC自動機上查找模式串中出現過哪些單詞了。匹配過程分兩種情況:(1)當前字符匹配, 表示從當前節點沿著樹邊有一條路徑可以到達目標字符,此時只需沿該路徑走向下一個節點繼續匹配即可,目標字符串指針移向下個字符繼續匹配;(2)當前字符 不匹配,則去當前節點失敗指針所指向的字符繼續匹配,匹配過程隨著指針指向root結束。重復這2個過程中的任意一個,直到模式串走到結尾為止。
1 int query(node *root){
2     int i=0,cnt=0,index,len=strlen(str);
3      node *p=root;  
4     while(str[i]){  
5          index=str[i]-'a';  
6         while(p->next[index]==NULL && p!=root) p=p->fail;
7          p=p->next[index];
8          p=(p==NULL)?root:p;
9          node *temp=p;
10         while(temp!=root && temp->count!=-1){
11              cnt+=temp->count;
12              temp->count=-1;
13              temp=temp->fail;
14          }
15          i++;                 
16      }    
17     return cnt;
18 }
    對照圖-2,看一下模式匹配這個詳細的流程,其中模式串為yasherhs。對于i=0,1。Trie中沒有對應的路徑,故不做任何操作;i=2,3,4 時,指針p走到左下節點e。因為節點e的count信息為1,所以cnt+1,并且講節點e的count值設置為-1,表示改單詞已經出現過了,防止重復 計數,最后temp指向e節點的失敗指針所指向的節點繼續查找,以此類推,最后temp指向root,退出while循環,這個過程中count增加了 2。表示找到了2個單詞she和he。當i=5時,程序進入第5行,p指向其失敗指針的節點,也就是右邊那個e節點,隨后在第6行指向r節點,r節點的 count值為1,從而count+1,循環直到temp指向root為止。最后i=6,7時,找不到任何匹配,匹配過程結束。

posted on 2009-04-28 19:31 icecream 閱讀(449) 評論(0)  編輯 收藏 引用 所屬分類: String


只有注冊用戶登錄后才能發表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


My Links

Blog Stats

常用鏈接

留言簿

隨筆分類

隨筆檔案

文章分類

ACMER

搜索

最新評論

閱讀排行榜

評論排行榜

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美亚洲日本网站| 一区二区三区在线视频免费观看 | 国产精品久久久久aaaa九色| 裸体歌舞表演一区二区| 欧美性大战久久久久| 欧美电影免费观看| 韩国在线一区| 欧美亚洲免费高清在线观看| 亚洲在线黄色| 欧美二区不卡| 欧美高潮视频| 亚洲国产成人久久| 欧美在线视频二区| 久久精品导航| 国产亚洲欧美一区在线观看 | 老妇喷水一区二区三区| 久久成人国产精品| 国产日韩精品一区二区浪潮av| 99综合在线| 亚洲天堂久久| 国产精品swag| 中国成人黄色视屏| 亚洲自拍偷拍网址| 国产精品成人一区二区三区吃奶| 亚洲精品欧洲| 亚洲深夜福利视频| 欧美性做爰猛烈叫床潮| 一本久久综合亚洲鲁鲁五月天 | 亚洲国产成人不卡| 久久在线免费| 欧美激情亚洲另类| 亚洲免费精品| 欧美日韩专区| 亚洲欧美日韩在线高清直播| 欧美专区中文字幕| 国产一区在线免费观看| 久久久久久日产精品| 欧美大片在线观看| 亚洲美洲欧洲综合国产一区| 欧美日韩视频在线一区二区| 亚洲午夜在线观看| 久久国产精品久久久久久| 国产原创一区二区| 欧美xx视频| 一区二区三区四区五区视频| 欧美一进一出视频| 国色天香一区二区| 欧美gay视频| 亚洲天堂网在线观看| 欧美中文字幕| 亚洲欧洲免费视频| 国产精品欧美一区二区三区奶水| 午夜精品在线观看| 亚洲国产高清一区| 亚洲午夜免费视频| 韩国精品久久久999| 欧美精品1区2区| 亚洲欧美日韩一区| 亚洲二区在线观看| 欧美影片第一页| 亚洲黑丝在线| 国产日产亚洲精品系列| 免费在线观看一区二区| 亚洲综合精品自拍| 欧美激情视频给我| 欧美一级成年大片在线观看| 91久久精品美女高潮| 国产精品女人网站| 美女网站在线免费欧美精品| 一本色道久久综合亚洲精品小说 | 日韩网站在线看片你懂的| 欧美综合激情网| 亚洲日本欧美日韩高观看| 国产美女一区| 欧美日韩一本到| 久久综合九色九九| 亚洲综合精品自拍| 亚洲精选成人| 欧美大片91| 久久精品国产免费观看| 亚洲一区在线看| 亚洲人成网站精品片在线观看| 国产欧美日本在线| 欧美三级电影大全| 免费观看成人www动漫视频| 亚洲摸下面视频| 亚洲精品视频在线观看网站| 欧美阿v一级看视频| 午夜精品福利电影| 亚洲一区中文| 99国产精品私拍| 亚洲国产成人精品久久久国产成人一区| 国产精品美女在线| 欧美三级资源在线| 欧美精品在线免费播放| 久久久高清一区二区三区| 亚洲一区在线免费观看| 99成人精品| 日韩午夜精品视频| 亚洲精品美女91| 亚洲国产导航| 亚洲国产老妈| 亚洲国产精品日韩| 亚洲国产视频一区| 亚洲国产一区二区精品专区| 欧美激情一级片一区二区| 免费在线观看一区二区| 久久久久五月天| 久久欧美中文字幕| 久久尤物视频| 免费成人av| 欧美电影在线| 最新亚洲一区| 日韩亚洲欧美一区| 99精品国产高清一区二区 | 亚洲国产人成综合网站| 亚洲国产精品一区制服丝袜| 亚洲高清自拍| 99re热这里只有精品免费视频| 亚洲乱码国产乱码精品精天堂 | 亚洲精品国产精品久久清纯直播 | 久久青青草综合| 久久综合九色欧美综合狠狠| 麻豆精品视频在线观看| 欧美激情综合| 亚洲狼人精品一区二区三区| 日韩一级成人av| 午夜精品久久久久久久99水蜜桃| 午夜精品国产精品大乳美女| 久久国产精品99国产| 免费h精品视频在线播放| 欧美激情中文字幕乱码免费| 欧美网站在线观看| 国产三区精品| 亚洲精品久久久久| 亚洲女人av| 免费看亚洲片| 一本久道久久综合婷婷鲸鱼| 亚洲影音先锋| 欧美成人xxx| 国产精品视频yy9099| 亚洲国产成人不卡| 亚洲调教视频在线观看| 久久久久一区二区三区四区| 亚洲国产美女久久久久| 亚洲性视频网站| 麻豆av一区二区三区| 国产精品乱码久久久久久| 国产香蕉久久精品综合网| 亚洲人妖在线| 久久成人人人人精品欧| 亚洲国产高清在线| 亚洲欧美伊人| 欧美日韩成人综合| 精品盗摄一区二区三区| 亚洲天堂男人| 欧美插天视频在线播放| 中文在线资源观看网站视频免费不卡 | 午夜亚洲激情| 欧美精品激情blacked18| 国产一区自拍视频| 亚洲深夜福利网站| 亚洲大片精品永久免费| 午夜精品福利视频| 欧美久久久久久久久久| 国内综合精品午夜久久资源| 亚洲线精品一区二区三区八戒| 欧美xart系列高清| 亚洲欧美自拍偷拍| 欧美午夜激情在线| 亚洲精品免费看| 女同性一区二区三区人了人一| 午夜国产精品视频| 欧美涩涩网站| 亚洲精品一二| 欧美国产高潮xxxx1819| 久久精品99国产精品日本 | 欧美极品影院| 在线视频观看日韩| 久久色在线播放| 亚洲欧美日韩综合国产aⅴ| 欧美日韩三级一区二区| 亚洲日本视频| 亚洲电影免费| 免费亚洲婷婷| 亚洲欧洲日韩在线| 美日韩精品免费观看视频| 午夜精品999| 国产欧美视频在线观看| 亚洲欧美激情四射在线日 | 亚洲国产综合视频在线观看| 久久综合九色综合欧美就去吻| 国内精品视频一区| 久久久7777| 久久成人综合视频| 国产一区日韩一区| 久久综合伊人77777麻豆| 久久国产手机看片| 黄色一区二区三区四区| 久久久久久亚洲综合影院红桃|