• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-341  評論-2670  文章-0  trackbacks-0
                算法的具體說明可以看這里

                今天花了一個晚上完成并測試了從NFA到DFA的代碼。NFA到DFA的主要過程就是構造出一個等價于NFA的狀態機,使得從任何一個狀態出去的狀態轉換都不具有相同的條件。這個約束就是“確定性”的含義,給定一個狀態和一個輸入,最多只能跳轉到一個目標狀態。于是知道了這個過程,代碼就很好寫了:

              1         Automaton::Ref NfaToDfa(Automaton::Ref source, IGroup<State*, State*>& dfaStateMap)
              2         {
              3             Automaton::Ref target=new Automaton;
              4             Group<Transition*, Transition*> nfaTransitions;
              5             CopyFrom(target->captureNames.Wrap(), source->captureNames.Wrap());
              6             State* startState=target->NewState();
              7             target->startState=startState;
              8             dfaStateMap.Add(startState, source->startState);
              9 
             10             for(int i=0;i<target->states.Count();i++)
             11             {
             12                 State* currentState=target->states[i].Obj();
             13                 nfaTransitions.Clear();
             14 
             15                 //對該DFA狀態的所有等價NFA狀態進行遍歷
             16                 const IReadonlyList<State*>& nfaStates=dfaStateMap[currentState];
             17                 for(int j=0;j<nfaStates.Count();j++)
             18                 {
             19                     State* nfaState=nfaStates[j];
             20                     //對每一個NFA狀態的所有轉換進行遍歷
             21                     for(int k=0;k<nfaState->transitions.Count();k++)
             22                     {
             23                         Transition* nfaTransition=nfaState->transitions[k];
             24                         //檢查該NFA轉換類型是否已經具有已經被記錄
             25                         Transition* transitionClass=0;
             26                         for(int l=0;l<nfaTransitions.Keys().Count();l++)
             27                         {
             28                             Transition* key=nfaTransitions.Keys()[l];
             29                             if(AreEqual(key, nfaTransition))
             30                             {
             31                                 transitionClass=key;
             32                                 break;
             33                             }
             34                         }
             35                         //不存在則創建一個轉換類型
             36                         if(transitionClass==0)
             37                         {
             38                             transitionClass=nfaTransition;
             39                         }
             40                         //注冊轉換
             41                         nfaTransitions.Add(transitionClass, nfaTransition);
             42                     }
             43                 }
             44 
             45                 //遍歷所有種類的NFA轉換
             46                 for(int j=0;j<nfaTransitions.Count();j++)
             47                 {
             48                     const IReadonlyList<Transition*>& transitionSet=nfaTransitions.GetByIndex(j);
             49                     //對所有轉換的NFA目標狀態集合進行排序
             50                     SortedList<State*> transitionTargets;
             51                     for(int l=0;l<transitionSet.Count();l++)
             52                     {
             53                         State* nfaState=transitionSet[l]->target;
             54                         if(!transitionTargets.Contains(nfaState))
             55                         {
             56                             transitionTargets.Add(nfaState);
             57                         }
             58                     }
             59                     //判斷轉換類的所有轉換的NFA目標狀態組成的集合是否已經有一個對應的DFA狀態
             60                     State* dfaState=0;
             61                     for(int k=0;k<dfaStateMap.Count();k++)
             62                     {
             63                         //將DFA的等價NFA狀態集合進行排序
             64                         SortedList<State*> relativeStates;
             65                         CopyFrom(relativeStates.Wrap(), dfaStateMap.GetByIndex(k));
             66                         //比較兩者是否相等
             67                         if(relativeStates.Count()==transitionTargets.Count())
             68                         {
             69                             bool equal=true;
             70                             for(int l=0;l<relativeStates.Count();l++)
             71                             {
             72                                 if(relativeStates[l]!=transitionTargets[l])
             73                                 {
             74                                     equal=false;
             75                                     break;
             76                                 }
             77                             }
             78                             if(equal)
             79                             {
             80                                 dfaState=dfaStateMap.Keys()[k];
             81                                 break;
             82                             }
             83                         }
             84                     }
             85                     //不存在等價DFA狀態則創建一個
             86                     if(!dfaState)
             87                     {
             88                         dfaState=target->NewState();
             89                         for(int k=0;k<transitionTargets.Count();k++)
             90                         {
             91                             dfaStateMap.Add(dfaState, transitionTargets[k]);
             92                             if(transitionTargets[k]->finalState)
             93                             {
             94                                 dfaState->finalState=true;
             95                             }
             96                         }
             97                     }
             98                     //將該轉換復制到新狀態機里
             99                     Transition* transitionClass=nfaTransitions.Keys()[j];
            100                     Transition* newTransition=target->NewTransition(currentState, dfaState);
            101                     newTransition->capture=transitionClass->capture;
            102                     newTransition->index=transitionClass->index;
            103                     newTransition->range=transitionClass->range;
            104                     newTransition->type=transitionClass->type;
            105                 }
            106             }
            107 
            108             return target;
            109         }

                這里頻繁使用了Group和IGroup作為數據結構來計算。Group是一個多對多映射,也就是說Group<K, V>的內部結構等價于Map<K, List<V>>。從NFA到DFA轉換的同時,這個函數還記錄了每一個DFA對象所對應的NFA對象集合。

                接下來就要分兩步走了,第一個先做純匹配的正則表達式,然后接著做貪婪匹配(包含捕獲、預查和指向捕獲的匹配等高級功能)。根據Vczh Library++2.0的經驗,純匹配的正則表達式用來實現詞法分析器的時候,不亞于純手寫的詞法分析器,這一點令他的應用范圍變廣。
            posted on 2009-11-03 08:34 陳梓瀚(vczh) 閱讀(2728) 評論(8)  編輯 收藏 引用 所屬分類: VL++3.0開發紀事

            評論:
            # re: Vczh Library++3.0之正則表達式引擎(從NFA到DFA) 2009-11-03 22:49 | 白開水
            看到這個文章,突然感覺很懷念,真正把我編程帶入門的文章。

            轉眼就兩年了。

            正則表達式引擎到了后面效率可能會卡在內存的吞吐上,一般的PC配置(這個一般我也不太確定),極限應該在30MB/S.

            這個東西熱愛計算機編程的人都該嘗試去做下。非常考基本功。基本的數據結構,stack, avl tree, map, bit-vector, list都有牽涉,而算法那塊也逃不出一般算法書的經典算法部分,編譯原理也有部分涉及。假如你是個學生,又不知道該做點啥,那么這個東西,你該試著做做。

              回復  更多評論
              
            # re: Vczh Library++3.0之正則表達式引擎(從NFA到DFA)[未登錄] 2009-11-04 07:06 | L.S.Winson
            話說你寫這NFA到DFA轉換寫了多少次了。。。。我都覺得寫這算法寫得麻木了。。。
            怎么又把你的VL重寫么?  回復  更多評論
              
            # re: Vczh Library++3.0之正則表達式引擎(從NFA到DFA) 2009-11-04 20:57 | 陳梓瀚(vczh)
            @L.S.Winson
            嗯,這個前面說過了,因為有重大升級,所以全部重寫。  回復  更多評論
              
            # re: Vczh Library++3.0之正則表達式引擎(從NFA到DFA) 2009-11-04 20:57 | 陳梓瀚(vczh)
            @白開水
            我也很懷念之前你那個正則表達式啊,嘿嘿  回復  更多評論
              
            # re: Vczh Library++3.0之正則表達式引擎(從NFA到DFA) 2009-11-06 16:17 | zblc
            @白開水
            啊 你就是傳說中的vczh的徒弟~收我為徒吧~  回復  更多評論
              
            # re: Vczh Library++3.0之正則表達式引擎(從NFA到DFA) 2009-11-07 05:16 | 陳梓瀚(vczh)
            # re: Vczh Library++3.0之正則表達式引擎(從NFA到DFA) 2009-11-08 01:12 | v.k
            囧, 怎么你的徒弟走上C#了  回復  更多評論
              
            # re: Vczh Library++3.0之正則表達式引擎(從NFA到DFA) 2009-11-08 07:35 | 陳梓瀚(vczh)
            @v.k
            人總是要多學點的  回復  更多評論
              
            久久亚洲精品国产精品| 日产精品99久久久久久| 国产精品热久久无码av| 99久久精品免费国产大片| 精品人妻伦九区久久AAA片69| 麻豆国内精品久久久久久| 久久99久国产麻精品66| 久久国产乱子精品免费女| 香蕉99久久国产综合精品宅男自 | 久久精品国产2020| 久久AV高清无码| 久久国产亚洲精品| 国产精品99久久久久久宅男| 无码人妻久久一区二区三区蜜桃| 国产精品久久久福利| 久久亚洲精品成人无码网站| 国产精品成人久久久久久久| 久久精品亚洲中文字幕无码麻豆 | 久久精品麻豆日日躁夜夜躁| 久久播电影网| 9999国产精品欧美久久久久久| 国内精品人妻无码久久久影院导航| 9191精品国产免费久久| 久久久精品人妻一区二区三区蜜桃 | 久久乐国产综合亚洲精品| 欧美日韩中文字幕久久伊人| 久久水蜜桃亚洲av无码精品麻豆| 欧美午夜A∨大片久久| 精品久久久久久无码人妻蜜桃| MM131亚洲国产美女久久| 国产毛片欧美毛片久久久| 伊人久久国产免费观看视频| 久久综合成人网| 久久久久亚洲AV无码去区首| 国产精品成人99久久久久 | 狠狠色婷婷综合天天久久丁香 | 国产成人精品久久亚洲高清不卡 国产成人精品久久亚洲高清不卡 国产成人精品久久亚洲 | 欧洲成人午夜精品无码区久久| 无码国内精品久久综合88 | 色综合久久久久无码专区| 精品久久人人爽天天玩人人妻|