• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-91  評論-137  文章-0  trackbacks-0
            《面向組合子的一些測試》 進一步完善代碼,制作出詞法分析器.

            我們首先需要一個Fail基類,他有一個純虛函數Parser.
            1 class Fail
            2 {
            3 public:
            4     virtual NWString Parser(NWString& input)=0;
            5 };
            Parser的輸入為要分析的字符串,輸出為分析完成后剩余的字符串.

            然后我們需要一個Ch和一個Str分別用來分析單個字符和一個字符串.
             1 class Ch : public Fail
             2 {
             3 public:
             4     Ch(WCHAR _value) : value(_value){}
             5 
             6     NWString Parser(NWString& input);
             7 
             8     WCHAR Value();
             9 protected:
            10     WCHAR value; // 待匹配串
            11 };
            12 
            13 class Str : public Fail
            14 {
            15 public:
            16     Str(NWString _value) : value(_value){}
            17 
            18     NWString Parser(NWString& input);
            19 protected:
            20     NWString value; // 待匹配串
            21 };

            然后是Seq,Alt和Any,分別表示組合,選擇和循環.
             1 class Seq : public Fail
             2 {
             3 public:
             4     Seq(const NAutoPtr<Fail>& _left,const NAutoPtr<Fail>& _right) : left(_left),right(_right){}
             5 
             6     NWString Parser(NWString& input);
             7 protected:
             8     NAutoPtr<Fail> left;
             9     NAutoPtr<Fail> right;
            10 };
            11 
            12 class Alt : public Fail
            13 {
            14 public:
            15     Alt(const NAutoPtr<Fail>& _left,const NAutoPtr<Fail>& _right) : left(_left),right(_right){}
            16 
            17     NWString Parser(NWString& input);
            18 protected:
            19     NAutoPtr<Fail> left;
            20     NAutoPtr<Fail> right;
            21 };
            22 
            23 class Any : public Fail
            24 {
            25 public:
            26     Any(const NAutoPtr<Fail>& _left,const int _count) : left(_left),count(_count){}
            27 
            28     NWString Parser(NWString& input);
            29 protected:
            30     NAutoPtr<Fail> left;
            31     int count;
            32 };

            最后我們需要一個Node類型來存放以上這幾類對象.
             1 class Node
             2 {
             3 public:
             4     Node(){}
             5     Node(const NAutoPtr<Fail>& _left) : left(_left){}
             6 
             7     friend NAutoPtr<Node> operator+(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
             8     friend NAutoPtr<Node> operator|(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
             9     friend NAutoPtr<Node> operator-(const NAutoPtr<Node>& left,const NAutoPtr<Node>& right);
            10 
            11     static NAutoPtr<Node> OnceMore(NAutoPtr<Node> node);
            12     static NAutoPtr<Node> More(NAutoPtr<Node> node);
            13     static NAutoPtr<Node> NewCh(WCHAR input);
            14     static NAutoPtr<Node> NewStr(NWString input);
            15 
            16     NWString Parser(NWString& input);
            17 
            18     NAutoPtr<Fail>& Value();
            19 protected:
            20     NAutoPtr<Fail> left;
            21 };
            下面來分析一下Node里的函數:
            +:對應于Seq,用于將兩個Node連接起來.
            |:對應與Alt,用于選擇兩個Node.
            -:只有left和right的Value()都是NAutoPtr<Ch>時才可使用,內部有類型轉換,表示從哪個字符到哪個字符.
            OnceMore:重復1次及以上.
            More:重復0次以上.
            NewCh:生成一個NAutoPtr<Ch>的Node對象.
            NewStr:生成一個NAutoPtr<Str>的Node對象.

            下面我們需要4個宏.
            1 #define ONCEMORE(N)                    Node::OnceMore(N)
            2 #define MORE(N)                        Node::More(N)
            3 #define NEWCH(N)                    Node::NewCh(N)
            4 #define NEWSTR(N)                    Node::NewStr(N)
            這4個宏僅為了輸入方便

            然后我們來測試一下:
            1     NAutoPtr<Node> Symbol = ONCEMORE(NEWCH('_'| NEWCH('a'- NEWCH('z')) | (NEWCH('A'- NEWCH('Z'))
            2         + MORE(NEWCH('_'| (NEWCH('0'- NEWCH('9')) | (NEWCH('a'- NEWCH('z')) | (NEWCH('A'- NEWCH('Z')));
            3     NAutoPtr<Node> Number = ONCEMORE(NEWCH('0'- NEWCH('9'));
            4     NAutoPtr<Node> Real = Number + NEWCH('.'+ Number;
            相信對正則表達式有一定認識的同學已經知道這3條語句分別對應于什么正則表達式.
            Symbol->[_a-zA-Z]+[_0-9a-zA-Z]*
            Number->[0-9]+
            Real->[0-9]+.[0-9]+

            定義一個待分析的字符串.
            1     NWString str = L"abcce_fg123.459agetr";

            對其分析.
            1     wprintf(L"%s\n",str);
            2     wprintf(L"%s\n",Symbol->Parser(str));
            3     wprintf(L"%s\n",Real->Parser(str));
            4     wprintf(L"%s\n",Symbol->Parser(str));

            分析結果.
            1 abcce_fg123.459agetr
            2 123.459agetr
            3 agetr
            4 

            因為沒有考慮分析效率問題,所以使用NWString作為輸入和輸出,在實際使用中可用LPTSTR來代替NWString,同時修改響應代碼.
            最后給出源代碼
            posted on 2011-01-26 22:11 lwch 閱讀(2430) 評論(9)  編輯 收藏 引用 所屬分類: NScript

            評論:
            # re: 使用面向組合子算法寫詞法分析器 2011-01-27 10:46 | 陳梓瀚(vczh)
            嗯,就快達到四則運算分析器的目標了。你知道你這么做的話在讓Node遞歸的時候可能還有些問題你沒考慮到,譬如說

            A = a | B
            B = b | A

            你如何在B還沒有被=的時候就能用它呢,恩恩。

            話說回來,你TM的基類竟然是Fail……  回復  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-27 14:44 | lwch
            @陳梓瀚(vczh)
            這個問題還真沒考慮過..惰性計算的確不是一件容易的事情..
            但這個作為詞法分析器已經足夠  回復  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-27 16:29 | 陳梓瀚(vczh)
            @lwch
            詞法分析器用DFA才是最快的,用這個慢死了。而且那玩意兒也不是惰性計算……  回復  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 12:36 | ooseven
            速度慢還不是最大的問題,最大的問題是用這個算法你需要自己開發算法進行狀態數的優化,難度很高的。如果不優化的話,稍微復雜一點的正則文法,可能需要好幾萬個Node,比如你用這個作為basic語言的后臺詞法分析引擎試試?
              回復  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 14:11 | 陳梓瀚(vczh)
            @ooseven
            壓縮狀態的算法已經很成熟的啦,不用怕  回復  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 14:27 | lwch
            @陳梓瀚(vczh)
            Node是在運行時生成的,要壓縮的話還得遍歷一遍..  回復  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-28 16:46 | 陳梓瀚(vczh)
            @lwch
            那你實現的好一點就好了。一個詞法分析器出來也就那么幾百個狀態吧,便利一次非???。  回復  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-29 00:31 | ooseven
            @陳梓瀚(vczh)
            太樂觀了,一個沒有經過壓縮的basic語言的詞法分析狀態估計有好幾萬個,單單生成就得好一會兒
              回復  更多評論
              
            # re: 使用面向組合子算法寫詞法分析器 2011-01-29 04:01 | 陳梓瀚(vczh)
            @ooseven
            不可能,你有很多投機取巧用來壓縮狀態的算法沒做。我出來的一直都只有幾百個。不過其實我介紹這個算法的文章也在我的置頂里面,你可以去看看。我在做編譯器的時候這些狀態也是運行時產生的。我那個nativex跟basic可以比吧,也有那么多復雜的token?;旧蠘嬙鞝顟B機的時候瞬間就搞定了,根本無法感受他的時間,更不存在你所說的“好一會兒”。顯然還是實現的問題。  回復  更多評論
              
            亚洲成色999久久网站| 粉嫩小泬无遮挡久久久久久| 久久99亚洲综合精品首页| 久久久久久国产精品美女| 久久精品中文字幕大胸| 麻豆一区二区99久久久久| 99热精品久久只有精品| 一本久道久久综合狠狠爱| 99久久精品免费看国产免费| 少妇无套内谢久久久久| 91精品国产高清久久久久久91| 久久精品一本到99热免费| 日本精品久久久中文字幕| 少妇久久久久久久久久| 香蕉aa三级久久毛片| 国产精品亚洲美女久久久| 成人国内精品久久久久一区| 亚洲日韩欧美一区久久久久我| 国产一级做a爰片久久毛片| 久久亚洲日韩看片无码| 久久一区二区免费播放| 日本福利片国产午夜久久| 久久国产免费观看精品3| 久久人妻无码中文字幕| 国产精品一区二区久久精品涩爱| 91性高湖久久久久| 99国产欧美久久久精品蜜芽| 亚洲中文久久精品无码ww16| 久久综合久久性久99毛片| 久久综合欧美成人| 精品久久久久久久| 国产成年无码久久久久毛片| 亚洲av日韩精品久久久久久a| 伊人久久大香线蕉AV一区二区| 精品国产综合区久久久久久| 婷婷综合久久狠狠色99h| 狠狠狠色丁香婷婷综合久久五月| WWW婷婷AV久久久影片| 国产精品久久久久天天影视| 国产精品久久久久久一区二区三区| 精品久久久久久国产|