• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 31  文章 - 128  trackbacks - 0
            <2025年5月>
            27282930123
            45678910
            11121314151617
            18192021222324
            25262728293031
            1234567

            常用鏈接

            留言簿(5)

            隨筆分類(38)

            隨筆檔案(31)

            收藏夾(4)

            College

            High School

            最新隨筆

            搜索

            •  

            積分與排名

            • 積分 - 55886
            • 排名 - 407

            最新評論

            • 1.?re: [yc]詳解link
            • 面試的時候面試官就問過我什么是編譯和鏈接,我說編譯就是把代碼文件生成目標文件,鏈接就是把目標文件生成可執行文件,他說不對,又問我什么是動態鏈接,還問我預編譯都做什么處理。。。都在這里找到了答案!!!!
            • --王至乾
            • 2.?re: [yc]詳解link
            • @劉偉
              我是說博主,不是叫你啊
            • --溪流
            • 3.?re: [yc]詳解link
            • 誰是石老師,我不是哈@溪流
            • --劉偉
            • 4.?re: [yc]詳解link
            • 石老師?我是溪流~
            • --溪流
            • 5.?re: [yc]詳解link
            • 期待樓主下文啊,多謝樓主了
            • --劉偉

            閱讀排行榜

            評論排行榜

                最近為了解析SQL語法,懷著試一試的心態去翻了翻boost的spirit庫,因為該庫的文檔的簡介里寫著LL parser framework  represents parsers directly as EBNF grammars in inlined C++。看著framework這個詞自然覺得這個庫很牛B,試用了一下果然如此。
                所謂EBNF即擴展巴克斯范式,是一種描述Context-Free Language的文法。在目前常見的非自然語言中,大部分都可以用EBNF表示。例如:
                  group  ::='('exp
            ')'
                  factor ::=integer|
            group
                  term   ::=factor(('*'factor)|('/'factor
            ))*
                  exp    ::=term(('+'term)|('-'term
            ))*
            這是一個整數表達式的EBNF。該段描述用spirit在C++中的實現則是:
               

               rule<> group, factor, term, exp;
               group  
            = '(' >> exp >> ')';
               factor 
            = int_p | group;
               term   
            = factor >> *(('*' >> factor) | ('/' >> factor));
               exp    
            = term >> *(('+' >> term) | ('-' >> term));

            這里使用=代替::=, 用>>代替空格連接。并且由于C++語法所限,EBNF中后置的*在spirit中改為前置。
            等式左邊的單詞被稱為一個rule,等式右邊為rule的定義。我們可以看出一個group是一個exp加上一對括號,一個factor是一個整數或者一個group,一個term是一個或多個factor用*/連接,一個exp是一個或多個term用+-連接。處于最頂端的exp可以據此識別出以下表達式
               

               12345
               
            -12345
               
            +12345
               
            1 + 2
               
            1 * 2
               
            1/2 + 3/4
               
            1 + 2 + 3 + 4
               
            1 * 2 * 3 * 4
               (
            1 + 2* (3 + 4)
               (
            -1 + 2* (3 + -4)
               
            1 + ((6 * 200- 20/ 6
               (
            1 + (2 + (3 + (4 + 5))))

                得到一個rule之后,我們就可以用 parse函數對一個串進行識別了。例如
                     

                     parse( " (1 + (2 + (3 + (4 + 5)))) " , exp);


            該函數返回一個結構parse_info,可以通過訪問其中的full成員來判斷是否成功識別,也可以訪問stop成員來獲知失敗的位置。這里要特別提一點,關于各個符號之間的空格,spirit的文檔的正文說的是給parse再傳一個參數space_p,通知parse跳過所有的空格,然而在FAQ中又提到,如果使用以上方法定義rule,第三個參數傳space_p會失敗。原因是使用rule默認定義的規則被稱為character level parsing,即字符級別解析,而parse的第3個參數僅適用于phrase level parsing,即語法級別解析。要使用第3個參數可以有幾種方法。
                  1。在parse的第二個參數直接傳入一個EBNF表達式,不創建rule對象。
                     

                        parse( " hello world " * anychar_p, space_p);  


                  2。以rule<phrase_scanner_t>創建rule。
                     

                        rule < phrase_scanner_t >  exp; 

            注意雖然可以用這兩個辦法屏蔽空格,但是這樣可能完全改變EBNF文法的語義,尤其是在語言本身需要識別空格的時候。對于這種情況,可以不使用第三個參數,并在需要出現空格的地方加上space_p,或者+space_p及*space_p,其中+和*分別表示后面的符號連續出現一次以上和0次以上。例如一個以空格分隔的整數列表可以寫成int_p >> *(+space_p >> int_p)
               如上使用parse可以識別一個串,但并不能做更多的操作,例如將語法里的各個成分提取出來。對于這樣的需求,可以通過actor實現。下面是使用actor的一個簡單例子
               

               bool
               parse_numbers(
            char const* str, vector<double>& v)
               
            {
                  
            return parse(str,

               
            //  Begin grammar
                  (
                     real_p[push_back_a(v)] 
            >> *(',' >> real_p[push_back_a(v)])
                  )
                  ,
                  
            //  End grammar
                  space_p).full;
               }

            注意到real_p后面的[],中括號里面是一個仿函數(函數指針或者函數對象),該仿函數具有如下調用型別
               

               void operator()(IterT first, IterT last) const;
               
            void operator()(NumT val) const;
               
            void operator()(CharT ch) const;


            一旦spase發現了匹配real_p的子串,就會調用該functor。不同的rule可能會對應不同的調用型別。
            第一個型別針對一般規則,first和last為兩個指向字符的迭代器(一般為char*),匹配的子串為[first, last)
            第二個型別針對數字型規則,如real_p和int_p, 參數val是一個數字類型。
            第三個性別針對單字符型規則,如space_p, 參數ch是一個字符類型。
            real_p[push_back_a(v)]中的push_back_a是一個spirit已經定義好的functor,它會將匹配好的內容依照匹配到的時間順序調用v的push_back函數加入到v中。

               到此spirit的常用功能就都介紹完了。要詳細深入了解可以參考spirit的文檔。

            最后在題一個注意要點。spirit的各種EBNF連接都是指針連接,因此才能在expression被賦值前就在group的定義里面使用。所以在使用EBNF的時候一定要小心不要將局部變量的rule提供給全局或者類成員變量使用,例如:
               

               class A
               
            {
                  rule
            <> s;
                  A()
                  
            {
                     rule
            <> r = int_p | hex_p;

                     s 
            = r >> *(+space_p >> r); //error, r destructed after return 
                  }

               }
            ;

            如果真想使用局部作用域,可以在局部的rule前面加上static.

            posted on 2005-12-18 12:02 shifan3 閱讀(7121) 評論(5)  編輯 收藏 引用 所屬分類: templateBoostC++

            FeedBack:
            # re: boost::spirit初體驗 2005-12-18 20:22 Windreamer Is Not DREAMER
            贊,華麗的石老師
            沒想到spirit竟然這么厲害??
            看來我真得系統的把Boost好好看一遍,走馬觀花的看一圈真是暴殄天物啊

            順便來踩踩地方~~~~~~~
            沙發~~~~~~~~~~~~~~~~~~  回復  更多評論
              
            # re: boost::spirit初體驗 2006-02-15 20:02 firestorm
            我現在也在為一個oracle sql的簡單解析重組而煩惱!考慮使用lex和yacc,但是時間不太允許,想找個免費的數據庫的源碼看看,發現都不是很好用的哪種。
            郁悶~  回復  更多評論
              
            # re: boost::spirit初體驗 2006-09-13 19:51 manzheng

            不懂,但還是re一下

            ~~~~~~~~~  回復  更多評論
              
            # re: [yc]boost::spirit初體驗 2007-12-25 17:18 aaaaaaaaaa
            英文閱讀太累,看到這個感覺沒那么冷了~~~~~  回復  更多評論
              
            # re: [yc]boost::spirit初體驗 2007-12-25 17:20 aaaaaaaaaa
            英文終究還是要看的,但有類似這種中文介紹做預習,感覺好多了,再頂~~~~~~  回復  更多評論
              
            久久久久久久国产免费看| 狠狠狠色丁香婷婷综合久久俺| 久久天天躁狠狠躁夜夜2020| 综合久久一区二区三区| 人人狠狠综合久久88成人| 嫩草影院久久国产精品| 亚洲AV伊人久久青青草原| 久久精品国产99久久久| 久久精品国产一区二区三区不卡 | 久久久无码精品亚洲日韩京东传媒| 久久精品国产清自在天天线 | 欧美国产精品久久高清| 久久久久亚洲av无码专区喷水| 办公室久久精品| 亚洲精品国产美女久久久| 久久久久久国产精品无码下载| 久久久噜噜噜久久中文福利| 日韩美女18网站久久精品 | 久久久久国色AV免费看图片| 久久99国产综合精品| 久久精品国产久精国产一老狼| 99久久精品国产一区二区| 国产情侣久久久久aⅴ免费| 亚洲国产成人久久综合区| 国产精品免费看久久久香蕉| 97久久超碰国产精品2021| 久久www免费人成看片| 久久综合色区| 久久影院亚洲一区| 久久久久亚洲AV成人网人人软件| 国产精品天天影视久久综合网| 亚洲精品白浆高清久久久久久| 亚洲人成网站999久久久综合| 久久激情五月丁香伊人| 久久精品成人欧美大片| 久久精品国产精品亚洲下载| 久久综合欧美成人| 久久久久国产视频电影| 精品欧美一区二区三区久久久| 精品久久久久久久久久久久久久久| 91精品国产91久久久久久蜜臀|