• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-91  評論-137  文章-0  trackbacks-0
            《面向組合子的一些測試》 進一步完善代碼,制作出詞法分析器.

            我們首先需要一個Fail基類,他有一個純虛函數(shù)Parser.
            1 class Fail
            2 {
            3 public:
            4     virtual NWString Parser(NWString& input)=0;
            5 };
            Parser的輸入為要分析的字符串,輸出為分析完成后剩余的字符串.

            然后我們需要一個Ch和一個Str分別用來分析單個字符和一個字符串.
             1 class Ch : public Fail
             2 {
             3 public:
             4     Ch(WCHAR _value) : value(_value){}
             5 
             6     NWString Parser(NWString& input);
             7 
             8     WCHAR Value();
             9 protected:
            10     WCHAR value; // 待匹配串
            11 };
            12 
            13 class Str : public Fail
            14 {
            15 public:
            16     Str(NWString _value) : value(_value){}
            17 
            18     NWString Parser(NWString& input);
            19 protected:
            20     NWString value; // 待匹配串
            21 };

            然后是Seq,Alt和Any,分別表示組合,選擇和循環(huán).
             1 class Seq : public Fail
             2 {
             3 public:
             4     Seq(const NAutoPtr<Fail>& _left,const NAutoPtr<Fail>& _right) : left(_left),right(_right){}
             5 
             6     NWString Parser(NWString& input);
             7 protected:
             8     NAutoPtr<Fail> left;
             9     NAutoPtr<Fail> right;
            10 };
            11 
            12 class Alt : public Fail
            13 {
            14 public:
            15     Alt(const NAutoPtr<Fail>& _left,const NAutoPtr<Fail>& _right) : left(_left),right(_right){}
            16 
            17     NWString Parser(NWString& input);
            18 protected:
            19     NAutoPtr<Fail> left;
            20     NAutoPtr<Fail> right;
            21 };
            22 
            23 class Any : public Fail
            24 {
            25 public:
            26     Any(const NAutoPtr<Fail>& _left,const int _count) : left(_left),count(_count){}
            27 
            28     NWString Parser(NWString& input);
            29 protected:
            30     NAutoPtr<Fail> left;
            31     int count;
            32 };

            最后我們需要一個Node類型來存放以上這幾類對象.
             1 class Node
             2 {
             3 public:
             4     Node(){}
             5     Node(const NAutoPtr<Fail>& _left) : left(_left){}
             6 
             7     friend NAutoPtr<Node> operator+(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
             8     friend NAutoPtr<Node> operator|(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
             9     friend NAutoPtr<Node> operator-(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
            10 
            11     static NAutoPtr<Node> OnceMore(NAutoPtr<Node> node);
            12     static NAutoPtr<Node> More(NAutoPtr<Node> node);
            13     static NAutoPtr<Node> NewCh(WCHAR input);
            14     static NAutoPtr<Node> NewStr(NWString input);
            15 
            16     NWString Parser(NWString& input);
            17 
            18     NAutoPtr<Fail>& Value();
            19 protected:
            20     NAutoPtr<Fail> left;
            21 };
            下面來分析一下Node里的函數(shù):
            +:對應(yīng)于Seq,用于將兩個Node連接起來.
            |:對應(yīng)與Alt,用于選擇兩個Node.
            -:只有l(wèi)eft和right的Value()都是NAutoPtr<Ch>時才可使用,內(nèi)部有類型轉(zhuǎn)換,表示從哪個字符到哪個字符.
            OnceMore:重復(fù)1次及以上.
            More:重復(fù)0次以上.
            NewCh:生成一個NAutoPtr<Ch>的Node對象.
            NewStr:生成一個NAutoPtr<Str>的Node對象.

            下面我們需要4個宏.
            1 #define ONCEMORE(N)                    Node::OnceMore(N)
            2 #define MORE(N)                        Node::More(N)
            3 #define NEWCH(N)                    Node::NewCh(N)
            4 #define NEWSTR(N)                    Node::NewStr(N)
            這4個宏僅為了輸入方便

            然后我們來測試一下:
            1     NAutoPtr<Node> Symbol = ONCEMORE(NEWCH('_'| NEWCH('a'- NEWCH('z')) | (NEWCH('A'- NEWCH('Z'))
            2         + MORE(NEWCH('_'| (NEWCH('0'- NEWCH('9')) | (NEWCH('a'- NEWCH('z')) | (NEWCH('A'- NEWCH('Z')));
            3     NAutoPtr<Node> Number = ONCEMORE(NEWCH('0'- NEWCH('9'));
            4     NAutoPtr<Node> Real = Number + NEWCH('.'+ Number;
            相信對正則表達式有一定認識的同學已經(jīng)知道這3條語句分別對應(yīng)于什么正則表達式.
            Symbol->[_a-zA-Z]+[_0-9a-zA-Z]*
            Number->[0-9]+
            Real->[0-9]+.[0-9]+

            定義一個待分析的字符串.
            1     NWString str = L"abcce_fg123.459agetr";

            對其分析.
            1     wprintf(L"%s\n",str);
            2     wprintf(L"%s\n",Symbol->Parser(str));
            3     wprintf(L"%s\n",Real->Parser(str));
            4     wprintf(L"%s\n",Symbol->Parser(str));

            分析結(jié)果.
            1 abcce_fg123.459agetr
            2 123.459agetr
            3 agetr
            4 

            因為沒有考慮分析效率問題,所以使用NWString作為輸入和輸出,在實際使用中可用LPTSTR來代替NWString,同時修改響應(yīng)代碼.
            最后給出源代碼
            posted on 2011-01-26 22:11 lwch 閱讀(2431) 評論(9)  編輯 收藏 引用 所屬分類: NScript

            評論:
            # re: 使用面向組合子算法寫詞法分析器 2011-01-27 10:46 | 陳梓瀚(vczh)
            嗯,就快達到四則運算分析器的目標了。你知道你這么做的話在讓Node遞歸的時候可能還有些問題你沒考慮到,譬如說

            A = a | B
            B = b | A

            你如何在B還沒有被=的時候就能用它呢,恩恩。

            話說回來,你TM的基類竟然是Fail……  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-27 14:44 | lwch
            @陳梓瀚(vczh)
            這個問題還真沒考慮過..惰性計算的確不是一件容易的事情..
            但這個作為詞法分析器已經(jīng)足夠  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-27 16:29 | 陳梓瀚(vczh)
            @lwch
            詞法分析器用DFA才是最快的,用這個慢死了。而且那玩意兒也不是惰性計算……  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 12:36 | ooseven
            速度慢還不是最大的問題,最大的問題是用這個算法你需要自己開發(fā)算法進行狀態(tài)數(shù)的優(yōu)化,難度很高的。如果不優(yōu)化的話,稍微復(fù)雜一點的正則文法,可能需要好幾萬個Node,比如你用這個作為basic語言的后臺詞法分析引擎試試?
              回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 14:11 | 陳梓瀚(vczh)
            @ooseven
            壓縮狀態(tài)的算法已經(jīng)很成熟的啦,不用怕  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 14:27 | lwch
            @陳梓瀚(vczh)
            Node是在運行時生成的,要壓縮的話還得遍歷一遍..  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 16:46 | 陳梓瀚(vczh)
            @lwch
            那你實現(xiàn)的好一點就好了。一個詞法分析器出來也就那么幾百個狀態(tài)吧,便利一次非常快。  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-29 00:31 | ooseven
            @陳梓瀚(vczh)
            太樂觀了,一個沒有經(jīng)過壓縮的basic語言的詞法分析狀態(tài)估計有好幾萬個,單單生成就得好一會兒
              回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-29 04:01 | 陳梓瀚(vczh)
            @ooseven
            不可能,你有很多投機取巧用來壓縮狀態(tài)的算法沒做。我出來的一直都只有幾百個。不過其實我介紹這個算法的文章也在我的置頂里面,你可以去看看。我在做編譯器的時候這些狀態(tài)也是運行時產(chǎn)生的。我那個nativex跟basic可以比吧,也有那么多復(fù)雜的token。基本上構(gòu)造狀態(tài)機的時候瞬間就搞定了,根本無法感受他的時間,更不存在你所說的“好一會兒”。顯然還是實現(xiàn)的問題。  回復(fù)  更多評論
              
            久久久久久久久66精品片| 国产精品美女久久久久久2018| 久久久久精品国产亚洲AV无码| 三级片免费观看久久| 国产精品美女久久久久AV福利| 国产99久久久国产精品~~牛| av国内精品久久久久影院| 狠狠色丁香久久婷婷综合五月| 国内精品久久久久影院优| 久久99热只有频精品8| 国内精品久久久久久野外| 精品欧美一区二区三区久久久| 亚洲精品国产自在久久| 久久狠狠高潮亚洲精品| 国产精品免费久久| 欧美日韩中文字幕久久久不卡 | 久久影院综合精品| 国内精品人妻无码久久久影院| 久久精品国产99久久无毒不卡| 久久99毛片免费观看不卡| 伊人热人久久中文字幕| 久久国产精品成人影院| 久久精品国产半推半就| 久久夜色撩人精品国产| 99精品国产在热久久| 中文字幕久久久久人妻| 久久久受www免费人成| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 精品久久一区二区| 色综合合久久天天给综看| 一本一本久久A久久综合精品 | 中文字幕精品久久久久人妻| 奇米影视7777久久精品人人爽| 久久精品中文字幕久久| 亚洲精品无码久久久久去q | 久久99精品久久久大学生| 99国产欧美精品久久久蜜芽| 麻豆国内精品久久久久久| 久久久久久亚洲精品成人| 久久亚洲高清综合| 久久99国产精品久久|