• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-91  評論-137  文章-0  trackbacks-0
            《面向組合子的一些測試》 進(jìn)一步完善代碼,制作出詞法分析器.

            我們首先需要一個Fail基類,他有一個純虛函數(shù)Parser.
            1 class Fail
            2 {
            3 public:
            4     virtual NWString Parser(NWString& input)=0;
            5 };
            Parser的輸入為要分析的字符串,輸出為分析完成后剩余的字符串.

            然后我們需要一個Ch和一個Str分別用來分析單個字符和一個字符串.
             1 class Ch : public Fail
             2 {
             3 public:
             4     Ch(WCHAR _value) : value(_value){}
             5 
             6     NWString Parser(NWString& input);
             7 
             8     WCHAR Value();
             9 protected:
            10     WCHAR value; // 待匹配串
            11 };
            12 
            13 class Str : public Fail
            14 {
            15 public:
            16     Str(NWString _value) : value(_value){}
            17 
            18     NWString Parser(NWString& input);
            19 protected:
            20     NWString value; // 待匹配串
            21 };

            然后是Seq,Alt和Any,分別表示組合,選擇和循環(huán).
             1 class Seq : public Fail
             2 {
             3 public:
             4     Seq(const NAutoPtr<Fail>& _left,const NAutoPtr<Fail>& _right) : left(_left),right(_right){}
             5 
             6     NWString Parser(NWString& input);
             7 protected:
             8     NAutoPtr<Fail> left;
             9     NAutoPtr<Fail> right;
            10 };
            11 
            12 class Alt : public Fail
            13 {
            14 public:
            15     Alt(const NAutoPtr<Fail>& _left,const NAutoPtr<Fail>& _right) : left(_left),right(_right){}
            16 
            17     NWString Parser(NWString& input);
            18 protected:
            19     NAutoPtr<Fail> left;
            20     NAutoPtr<Fail> right;
            21 };
            22 
            23 class Any : public Fail
            24 {
            25 public:
            26     Any(const NAutoPtr<Fail>& _left,const int _count) : left(_left),count(_count){}
            27 
            28     NWString Parser(NWString& input);
            29 protected:
            30     NAutoPtr<Fail> left;
            31     int count;
            32 };

            最后我們需要一個Node類型來存放以上這幾類對象.
             1 class Node
             2 {
             3 public:
             4     Node(){}
             5     Node(const NAutoPtr<Fail>& _left) : left(_left){}
             6 
             7     friend NAutoPtr<Node> operator+(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
             8     friend NAutoPtr<Node> operator|(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
             9     friend NAutoPtr<Node> operator-(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
            10 
            11     static NAutoPtr<Node> OnceMore(NAutoPtr<Node> node);
            12     static NAutoPtr<Node> More(NAutoPtr<Node> node);
            13     static NAutoPtr<Node> NewCh(WCHAR input);
            14     static NAutoPtr<Node> NewStr(NWString input);
            15 
            16     NWString Parser(NWString& input);
            17 
            18     NAutoPtr<Fail>& Value();
            19 protected:
            20     NAutoPtr<Fail> left;
            21 };
            下面來分析一下Node里的函數(shù):
            +:對應(yīng)于Seq,用于將兩個Node連接起來.
            |:對應(yīng)與Alt,用于選擇兩個Node.
            -:只有l(wèi)eft和right的Value()都是NAutoPtr<Ch>時才可使用,內(nèi)部有類型轉(zhuǎn)換,表示從哪個字符到哪個字符.
            OnceMore:重復(fù)1次及以上.
            More:重復(fù)0次以上.
            NewCh:生成一個NAutoPtr<Ch>的Node對象.
            NewStr:生成一個NAutoPtr<Str>的Node對象.

            下面我們需要4個宏.
            1 #define ONCEMORE(N)                    Node::OnceMore(N)
            2 #define MORE(N)                        Node::More(N)
            3 #define NEWCH(N)                    Node::NewCh(N)
            4 #define NEWSTR(N)                    Node::NewStr(N)
            這4個宏僅為了輸入方便

            然后我們來測試一下:
            1     NAutoPtr<Node> Symbol = ONCEMORE(NEWCH('_'| NEWCH('a'- NEWCH('z')) | (NEWCH('A'- NEWCH('Z'))
            2         + MORE(NEWCH('_'| (NEWCH('0'- NEWCH('9')) | (NEWCH('a'- NEWCH('z')) | (NEWCH('A'- NEWCH('Z')));
            3     NAutoPtr<Node> Number = ONCEMORE(NEWCH('0'- NEWCH('9'));
            4     NAutoPtr<Node> Real = Number + NEWCH('.'+ Number;
            相信對正則表達(dá)式有一定認(rèn)識的同學(xué)已經(jīng)知道這3條語句分別對應(yīng)于什么正則表達(dá)式.
            Symbol->[_a-zA-Z]+[_0-9a-zA-Z]*
            Number->[0-9]+
            Real->[0-9]+.[0-9]+

            定義一個待分析的字符串.
            1     NWString str = L"abcce_fg123.459agetr";

            對其分析.
            1     wprintf(L"%s\n",str);
            2     wprintf(L"%s\n",Symbol->Parser(str));
            3     wprintf(L"%s\n",Real->Parser(str));
            4     wprintf(L"%s\n",Symbol->Parser(str));

            分析結(jié)果.
            1 abcce_fg123.459agetr
            2 123.459agetr
            3 agetr
            4 

            因為沒有考慮分析效率問題,所以使用NWString作為輸入和輸出,在實際使用中可用LPTSTR來代替NWString,同時修改響應(yīng)代碼.
            最后給出源代碼
            posted on 2011-01-26 22:11 lwch 閱讀(2430) 評論(9)  編輯 收藏 引用 所屬分類: NScript

            評論:
            # re: 使用面向組合子算法寫詞法分析器 2011-01-27 10:46 | 陳梓瀚(vczh)
            嗯,就快達(dá)到四則運算分析器的目標(biāo)了。你知道你這么做的話在讓Node遞歸的時候可能還有些問題你沒考慮到,譬如說

            A = a | B
            B = b | A

            你如何在B還沒有被=的時候就能用它呢,恩恩。

            話說回來,你TM的基類竟然是Fail……  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-27 14:44 | lwch
            @陳梓瀚(vczh)
            這個問題還真沒考慮過..惰性計算的確不是一件容易的事情..
            但這個作為詞法分析器已經(jīng)足夠  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-27 16:29 | 陳梓瀚(vczh)
            @lwch
            詞法分析器用DFA才是最快的,用這個慢死了。而且那玩意兒也不是惰性計算……  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 12:36 | ooseven
            速度慢還不是最大的問題,最大的問題是用這個算法你需要自己開發(fā)算法進(jìn)行狀態(tài)數(shù)的優(yōu)化,難度很高的。如果不優(yōu)化的話,稍微復(fù)雜一點的正則文法,可能需要好幾萬個Node,比如你用這個作為basic語言的后臺詞法分析引擎試試?
              回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 14:11 | 陳梓瀚(vczh)
            @ooseven
            壓縮狀態(tài)的算法已經(jīng)很成熟的啦,不用怕  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 14:27 | lwch
            @陳梓瀚(vczh)
            Node是在運行時生成的,要壓縮的話還得遍歷一遍..  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 16:46 | 陳梓瀚(vczh)
            @lwch
            那你實現(xiàn)的好一點就好了。一個詞法分析器出來也就那么幾百個狀態(tài)吧,便利一次非常快。  回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-29 00:31 | ooseven
            @陳梓瀚(vczh)
            太樂觀了,一個沒有經(jīng)過壓縮的basic語言的詞法分析狀態(tài)估計有好幾萬個,單單生成就得好一會兒
              回復(fù)  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-29 04:01 | 陳梓瀚(vczh)
            @ooseven
            不可能,你有很多投機(jī)取巧用來壓縮狀態(tài)的算法沒做。我出來的一直都只有幾百個。不過其實我介紹這個算法的文章也在我的置頂里面,你可以去看看。我在做編譯器的時候這些狀態(tài)也是運行時產(chǎn)生的。我那個nativex跟basic可以比吧,也有那么多復(fù)雜的token。基本上構(gòu)造狀態(tài)機(jī)的時候瞬間就搞定了,根本無法感受他的時間,更不存在你所說的“好一會兒”。顯然還是實現(xiàn)的問題。  回復(fù)  更多評論
              
            成人国内精品久久久久影院| 国产精品美女久久久网AV| 久久香综合精品久久伊人| 久久成人影院精品777| 欧美精品一区二区久久| 欧美日韩精品久久免费| 久久国产精品-久久精品| 尹人香蕉久久99天天拍| 2021少妇久久久久久久久久| 伊人久久精品影院| 久久久久综合网久久| 国产精品乱码久久久久久软件 | 一本色综合久久| 国产精品欧美久久久天天影视| 久久久无码精品午夜| 久久婷婷久久一区二区三区| 欧美精品九九99久久在观看| 爱做久久久久久| 精品久久一区二区| 亚洲国产精品无码久久| 亚洲乱码日产精品a级毛片久久| 狠狠色丁香婷综合久久| 久久久噜噜噜久久中文福利| 伊人 久久 精品| 青青久久精品国产免费看| 国产精品亚洲美女久久久| 97久久超碰成人精品网站| 国产成人无码精品久久久性色| 久久嫩草影院免费看夜色| 亚洲狠狠久久综合一区77777| 日韩人妻无码精品久久免费一 | 亚洲国产精品久久电影欧美| 久久久久久青草大香综合精品 | 久久久噜噜噜www成人网| 97久久婷婷五月综合色d啪蜜芽 | 精品免费久久久久久久| 亚洲国产另类久久久精品黑人| 99久久免费国产精品特黄| 一本色综合久久| 精品久久久久久无码不卡| 久久亚洲精品无码VA大香大香|