• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-19  評(píng)論-21  文章-0  trackbacks-0
            一. 簡(jiǎn)介

                該正則表達(dá)式暫時(shí)能識(shí)別 *,|,(,)等特殊符號(hào),如(a|b)*abc。不過(guò)擴(kuò)展到其他符號(hào)(如?)也相對(duì)比較容易,修改NFA中的構(gòu)建規(guī)則即可。

            二. 引擎的構(gòu)建

                該正則表達(dá)式引擎的構(gòu)建以《Compilers Principles,Techniques & Tools》3.7節(jié)為依據(jù),暫時(shí)只能識(shí)別*,|,(,)這幾個(gè)特殊的字符,其工作過(guò)程為:構(gòu)建NFA -> 根據(jù)NFA構(gòu)建DFA -> 用DFA匹配。

            1. 構(gòu)建NFA
            該NFA的構(gòu)建以2條基本規(guī)則和3條組合規(guī)則為基礎(chǔ),采用歸納的思想構(gòu)建而成。
            1)2條基本的規(guī)則是:
            a. 以一個(gè)空值ε構(gòu)建一個(gè)NFA

            b. 以一個(gè)字符a構(gòu)建一個(gè)NFA

            2) 3條組合規(guī)則是:
            a. r = s | t (其中s和t都是NFA)

            b. r = s t(其中s和t都是NFA)

            c. r = s *(其中s為NFA)

            3) 如果需要識(shí)別如”?”等特殊符號(hào),則可再加一些組合規(guī)則。

            在具體的程序中,可以以下面的BNF為結(jié)構(gòu)來(lái)實(shí)現(xiàn)。(具體見(jiàn)源程序regexp.cpp)

            -> r '|' s | r
            -> s t | s
            -> a '*' | a
            -> token | '(' r ')' | ε   

            2. 構(gòu)建DFA
            主要是求ε閉包的過(guò)程,從一個(gè)集合的ε閉包轉(zhuǎn)移到一個(gè)集合的ε閉包。
            以a*c為例,其N(xiāo)FA圖如下所示(用dot畫(huà)的)

            為例:
            起始結(jié)點(diǎn)3的ε閉包集為 A = {3,1,4}
            A遇上字母a的轉(zhuǎn)移為MOV(A,a) = { 2 },其ε閉包集為B = { 2,1,4 }
            A遇上字母c的轉(zhuǎn)移為MOV(A,c) = { 6 },其ε閉包集為B = { 6 }
            同理可求出其他轉(zhuǎn)移集合,最后得到的DFA如下所示:

            3. 匹配
            每匹配成功一個(gè)字符則DFA移動(dòng)到下個(gè)相應(yīng)的結(jié)點(diǎn)。

            三. 改進(jìn)

            1. 如龍書(shū)中所說(shuō),有時(shí)候模擬NFA而不是直接構(gòu)建DFA可能達(dá)到更好的效果。
            2. 每次匹配不成功都需要回溯,這個(gè)地方也可以借鑒KMP算法(不過(guò)KMP對(duì)此好像有點(diǎn)不適用)
            3. 其他改進(jìn)方法可以看看《柔性字符串匹配》和龍書(shū)《Compilers Principles,Techniques & Tools》3.7節(jié)。

            四. 代碼下載

            svn checkout http://regexp.googlecode.com/svn/trunk/ regexp-read-only

            regexp.rar
            posted on 2010-06-17 20:50 hex108 閱讀(703) 評(píng)論(2)  編輯 收藏 引用 所屬分類(lèi): Program

            評(píng)論:
            # re: 構(gòu)建正則表達(dá)式引擎 2010-06-18 18:23 | 木頭奎
            發(fā)現(xiàn)一處代碼問(wèn)題:
            NFA *construct_nfa_and(NFA *s,NFA *t)函數(shù)體里面,
            delete( t->get_head() ); //釋放t的頭結(jié)點(diǎn)
            這句話
            應(yīng)該放到s->set_tail( t->get_tail() );的后面去

            VC6下測(cè)試發(fā)現(xiàn)的。  回復(fù)  更多評(píng)論
              
            # re: 構(gòu)建正則表達(dá)式引擎 2010-06-18 21:01 | hex108
            @木頭奎
            謝謝! 剛改正了呵  回復(fù)  更多評(píng)論
              
            久久精品国产99久久无毒不卡| 狠狠精品久久久无码中文字幕| 国产精品久久久久久久久| 国产一区二区三区久久| 久久av免费天堂小草播放| 2020久久精品亚洲热综合一本| 欧美一区二区三区久久综| 国产精品久久久久久久久久免费| 欧美精品福利视频一区二区三区久久久精品| 久久精品国产99国产精品亚洲| 日本久久久精品中文字幕| 亚洲AV无码久久精品蜜桃| 99久久精品国产综合一区| 久久性生大片免费观看性| 精品国产一区二区三区久久久狼| 久久久青草青青国产亚洲免观| 日韩人妻无码精品久久免费一 | 亚洲午夜精品久久久久久浪潮| 成人久久免费网站| 九九久久精品无码专区| 色欲久久久天天天综合网| 色悠久久久久久久综合网| 欧美伊香蕉久久综合类网站| 亚洲精品无码久久久久去q| 久久久久久国产a免费观看不卡| 久久久久久亚洲Av无码精品专口| 亚洲精品无码久久久久AV麻豆| 久久精品国产久精国产| 久久天堂AV综合合色蜜桃网 | 久久久久AV综合网成人| 亚洲欧美久久久久9999| 久久精品亚洲男人的天堂| 久久99精品综合国产首页| 久久精品中文闷骚内射| 亚洲日韩中文无码久久| 日韩人妻无码一区二区三区久久99| 91久久精品无码一区二区毛片| 国产成人综合久久综合| 精品熟女少妇av免费久久| 亚洲AV成人无码久久精品老人| 无码国内精品久久人妻|