青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

tommy

It's hard to tell the world we live in is either a reality or a dream
posts - 52, comments - 17, trackbacks - 0, articles - 0
  C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

C++ 程序員需要面對的最復雜的任務之一就是在一段合理的時間期限內編寫一個解析器。在為 SQL 或 C++ 這類成熟的語言開發編譯器時,使用 GNU Flex/Bison 或 ANTLR 解析器生成程序通常是不錯的選擇;但是對于使用更簡單的 Backus Naur Form(BNF)的語法,這些工具陡峭的學習曲線并不總是物有所值。另一種替代選擇是使用標準 Linux® 發行版附帶的正則表達式庫或 Boost regex 或 tokenizer 庫,但是它們不能根據日漸復雜的語法進行良好擴展。

  本文介紹了來自 Boost 的高可擴展性 Spirit 解析器框架。該解析器生成程序遵循 Extended Backus Naur Form (EBNF) 規范并使用 C++ 編寫,可以顯著縮短開發時間。要進一步閱讀,請查看詳細的 Spirit 文檔。

  安裝 Spirit

  您可以從 Boost 的 Web 站點免費下載 Spirit 框架(參見 參考資料 小節)。在開始使用 Spirit 進行開發之前,需注意以下事項:

  必須在源代碼中包含 頭文件。該頭文件將大量使用元模板編程和仿函數(functor)。本文的所有代碼均使用 g++-3.4.4 進行編譯。確保使用支持 C++ 特性的編譯器。

  部分 Spirit 框架在內部使用來自 Boost 的正則表達式庫,在已安裝的代碼庫中檢查 regex.h 頭文件。

  確保 Boost 安裝的根目錄位于編譯器的 include 搜索路徑中。

  Spirit 是一個只包括頭文件的庫,因此在鏈接時不需要任何額外的庫。但是 regex 是一個例外。要將 regex 源代碼只作為頭文件包含,可在代碼中使用預處理器指令 define BOOST_SPIRIT_NO_REGEX_LIB。

  第一個 Spirit 項目

  如果提供一個隨機的單詞列表,您的第一個 Spirit 項目將使用 C++ 風格列出列表中 Hello World(即 Hello 和 World 兩詞在輸入流中連在一起出現)出現的次數。參見清單 1;清單 2 顯示了輸出。

  清單 1. 列出單詞 Hello World 在輸入流中出現的次數

#define BOOST_SPIRIT_NO_REGEX_LIB
#include "regex.h"
#include "spirit.hpp"
#include "boost/spirit/actor.hpp"
using namespace boost::spirit;
const string input = "This Hello World program using Spirit counts the number of
Hello World occurrences in the input";
int main
 {
 int count = 0;
 parse (input.c_str,
     *(str_p("Hello World") [ increment_a(count) ]
      |
      anychar_p)
    );
 cout << count >> endl;
 return 0;
 }

  Spirit 框架的強大在于它為大量基本類型提供了內置解析器,包括單獨的字符、數字和字符串。更復雜的解析器通常都使用這些內置解析器對象創建。在 清單 1 中,str_p 和 anychar_p 都是 Spirit 中預定義的解析器 —— str_p 匹配它所提供的字符串(在此為 Hello World)并成功調用 increment_a 例程將計數加 1。anychar_p 是另一個預定義解析器,它可以匹配任何字符。

  讓我們看一看 parse 函數,它實際上是 Spirit 框架中最重要的例程。它接受一個輸入流和一個語法,并在內部通過語法運行此輸入流。在本例中,輸入流來自 input.c_str,而 str_p 和 anychar_p 為語法提供語義。如果熟悉解析的話,將很快就明白 parse 函數的第二個參數相當于提供了一個 BNF。

  其他預定義的 Spirit 解析器

  考慮符合以下模式的解析器: 。您需要根據從該字符串提取的數據填充 Employee 數據結構。下面是一個典型的字符串:"Alex 8 9.2 Jim 91 5.6"。

  Spirit 為字符串(alpha_p)、整數(int_p)、和實數(real_p)預定義了解析器。因此,可以認為 parse 例程應該使用以下語法調用:parse(input.c_str, alpha_p >> int_p >> real_p)。這里的邏輯是 parse 將在輸入流中首先查找一個字符串,然后查找整數,最后查找一個實數。這樣可行嗎?行不通。清單 2 展示了可以解析數據的可行代碼片段。

  清單 2. 使用 alpha_p、int_p 和 real_p 預定義解析器

#define BOOST_SPIRIT_NO_REGEX_LIB
#include "regex.h"
#include "spirit.hpp"
#include "boost/spirit/actor/assign_actor.hpp"
using namespace std;
using namespace boost::spirit;
const string input = "Alex 8 9.2 Jim 91 5.6";
typedef struct {
 string name;
 int  idcode;
 float rating;
} Employee;
int main
 {
 string name;
 int idcode;
 float rating;
 int status = parse (input.c_str,
           *((+alpha_p) [assign_a(name)] >> ' ' >>
            int_p[assign_a(idcode)] >> ' ' >>
            real_p[assign_a(rating)] >> !blank_p)
    ).full;
 cout << status << endl;
 return 0;
 }

  初始調用失敗有以下幾個原因:

  alpha_p 解析了單個的字符。要解析字符,必須使用 +alpha_p(這類似于 EBNF + 操作符,表示一個或多個字符,不同的是 Spirit 在前面而不是后面使用它)。

  使用空格分隔字符串、整數和實數。必須解釋這種行為??梢酝ㄟ^兩種方式實現:使用 ' ';或者使用 blank_p 預定義解析器,這更好,它同時解釋了空格和制表符。

  下面是修改后的解析調用:

    parse(input.c_str, *((+alpha_p) >> ' ' >> int_p >> ' ' >> real_p) >> !blank_p);

  第二個參數嚴格匹配一個非字母和數字組成的字符串,該字符串后面依次為空格、整數、另一個空格,最后是一個實數。當解析器達到實數后,它將查找一個空格/制表符,并重新開始匹配序列或終止。! 操作符表示空格/制表符出現了 0 次或 1 次。* 操作符表示該序列出現了 0 次或 1 次,并因此匹配一個空字符串。

  顯然,第二個字符串與傳統解析器使用的潛在語法規則之間存在直接聯系。下面是針對當前需求的典型語法規則:

:S -> (ALPHA INT REAL)*

  ALPHA、INT 和 REAL 通常由 lexer 提供。例如,INT 被定義為 (0-9)+??梢允褂?Spirit 合并這些步驟。

  如何診斷錯誤?

  如果解析器出現了錯誤,可以使用幾種方法診斷2錯誤。最簡單的檢驗方法是測試 parse 方法返回的數據結構。返回的數據結構被稱為 parse_info,而 hit 字段表示解析是否成功完成。清單 3 展示了來自 Boost 源代碼的 parse_info 結構。

  清單 3. 解析方法返回的 parse_info 結構

  template
  struct parse_info
  {
    IteratorT  stop; // points to final parse position
    bool    hit;    // true when parsing is successful
    bool    full;   // when the parser consumed all the input
    std::size_t length; // number of characters consumed by parser
    parse_info(
      IteratorT const& stop_ = IteratorT,
      bool hit_ = false,
      bool full_ = false,
      std::size_t length_ = 0)
    : stop(stop_)
    , hit(hit_)
    , full(full_)
    , length(length_) {}
    template
    parse_info(ParseInfoT const& pi)
    : stop(pi.stop)
    , hit(pi.hit)
    , full(pi.full)
    , length(pi.length) {}
  };

  Spirit 操作符及其語義

  Spirit 附帶了一些預定義的操作符。表 1 總結了這些操作符及其語義。后面的示例將使用這些操作符。

  表 1. Spirit 操作符及其語義

操作符語義
x >> y匹配 x 然后匹配 y
x | y匹配 x 或 y
x & y匹配 x 和 y
x – y匹配 x 但不匹配 y
x ^ y匹配 x 或 y,但不同時匹配兩者
*x對 x 匹配 0 次或多次
+x對 x 匹配 1 次或多次
!x對 x 匹配 0 次或 1 次
( x )匹配 x;用于基于優先權的分組
x [ function expression ]如果匹配了 x,執行函數/仿函數
x % y對 x 匹配 1 次或多次,使用 y 分隔

  了解到目前為止所開發的內容之后,現在可以開始定義 C 風格的浮點數語法。清單 4 展示了 BNF。

  清單 4. 用于浮點數的 BNF

    Real-Number : Fractional-Part (Exponent-Part)?
Fractional-Part : (DIGIT)* DOT (DIGIT)+
               |
               (DIGIT)+ DOT
Exponent-Part : ('e'|'E') ('+'|'-')? (DIGIT)+
DIGIT : ['0'-'9']
DOT : '.'

  清單 5 提供了等效的 Spirit 語法。

  清單 5. 浮點數的 Spirit 語法,與清單 4 的 BNF 等效

    Real-Number = Fractional-Part >> ! Exponent-Part
             | +digit_p >> Exponent-Part
             ;
Fractional-Part = *digit_p >> '.' >> +digit_p
              | +digit_p >> '.'
              ;
Exponent-Part =  ('e' | 'E') >> !('+' | '-') >> +digit_p;

  可以看到,Spirit 上下文中的 Y = A >> B 與解析器上下文的 Y : A B 相同,其中 A 和 B 可以是末端,也可以是非末端。注意,用戶并不需要為此類瑣碎的操作定義語法:Spirit 已經提供了預定義的 parser real_p 來解析實數。

  Spirit 中的預定義解析器

  Spirit 框架的靈活性源于它為常見處理提供了眾多預定義解析器。表 2 提供了包含其中一些解析器的列表。

  表 2. Spirit 中的一些預定義解析器

解析器語義
ch_p匹配一個單個的字符。
range_p匹配從低/高字符對中創建的一組字符中的單個字符。例如,range_p('a', 'z') 匹配 a 和 z 之間的所有字符。
anychar_p匹配任何單個的字符,包括 NULL 終端符 。
str_p匹配一個字符串:例如 str_p("mystring") 匹配字符串 mystring。
blank_p匹配空白和制表符組成的連續序列。
space_p類似于 blank_p,但它還匹配返回字符和換行字符。
digit_p匹配一個數字。
upper_p匹配任何大寫字符。
nothing_p診斷工具;從不匹配任何內容并且總是失敗。

  Spirit 指令

  本節討論 Spirit 的另一個強大特性 —— 指令。Pascal 和 VHDL 等大小寫敏感語言中的 lexer 要復雜一些,因為它們必須解析 begin 和 BEGin 等內容并為解析器生成相同的標記。Spirit 使用 parser directives 解決這個問題。例如,預定義指令 as_lower_d 將輸入流轉換為小寫(參見清單 6)。

  清單 6. 使用 as_lower_d 指令進行大小寫敏感的解析

#define BOOST_SPIRIT_NO_REGEX_LIB
#include "regex.h"
#include "spirit.hpp"
#include "boost/spirit/actor/assign_actor.hpp"
using namespace std;
using namespace boost::spirit;
const string input = "THis iS a ranDOm sTRInG";
int main
 {
 string val;
 int status = parse (input.c_str,
           as_lower_d[str_p ("this is a random string")
             [assign_a(val)] ]).full;
 cout << status << endl;
 cout << val << endl;
 return 0;
 }

  清單 6 的輸出為 1, THis iS a ranDOm sTRInG。必須理解解析器與解析器指令之間的差異,后者僅修改附帶的解析器的行為,實際上擴充了該解析器的策略。

  Spirit 提供了其他預定義解析器的指令和一些編寫解析器的方法。讓我們看一下 longest_d 解析器指令。考慮清單 7 并猜猜它的輸出是什么。

  清單 7. 使用模糊的語法進行解析

#define BOOST_SPIRIT_NO_REGEX_LIB
#include "regex.h"
#include "spirit.hpp"
#include "boost/spirit/actor/assign_actor.hpp"
using namespace std;
using namespace boost::spirit;
const string input = "20245.1";
int main
 {
 int val;
 int status = parse (input.c_str, int_p[assign_a(val)] | real_p).full;
 cout << status << " " << val << endl;
 return 0;
 }

  清單 7 的輸出是 0 20245。為什么會這樣?顯然,解析期間整個輸入緩沖區都沒有被使用,因此 status 為 0。為了理解這一點,需要注意 Spirit 是如何解析的:為示例規則 S : R1 | R2 | .. | RN 提供多個替代選擇,左邊的內容獲得最大優先權。這類似于 C/C++ 處理條件的方式:在表達式 if (x && y) 中,如果 x 為真,則不計算 y。這種行為有助于保持工具的處理速度。

  在本例中,int_p 匹配 20245 —— 但是在這之后它遇到了一個點字符,并且沒有處理它的規則。因此,解析器退出。

  解決方法是對語法規則的所有可用的替代內容進行重新分組,但是手動重新分組很容易出錯。更好的方法是使用 longest_d 指令,該指令將嘗試匹配消耗輸入流的最大長度的規則。清單 8 展示了修改后的 parse 例程調用。

  清單 8. 使用 longest_d 預定義的解析器指令

 int status = parse (input.c_str,
           longest_d [int_p | real_p[assign_a(val)] ]
    ).full;

  通過這一修改,輸出現在變為 1 20245.1。

  使用 Spirit 開發完備的語法

  本節將討論使用 Spirit 框架設計一組用戶定義的語法規則。要設計自己的語法,Spirit 要求執行以下操作:

  創建一個從預定義 grammar 類繼承而來的派生類。grammar 類是一個模板類,被其派生類 DerivedT 和上下文類 ContextT 參數化。語法類的聲明如下所示:template<<br />     typename DerivedT,
    typename ContextT = parser_context<> >
  struct grammar;

  您設計的派生類必須有一個名為 definition(可以不修改此名)的嵌套的模板類/結構。definition 類有以下特性:

  它是類型名為 ScannerT 的模板類。

  語法規則在其構造函數中定義。構造函數被作為引用傳遞給實際的語法 self。

  必須提供名為 start 的成員函數,它表示 start 規則。

  清單 9 展示了用戶定義語法的基本框架。

  清單 9. 用戶定義的語法類的基本框架

  struct my-grammar : public grammar
  {
    template
    struct definition
    {
      rule startRule;
      definition(my-grammar const& self) { /* define grammar rules here */ }
      rule const& start const { return startRule; }
    };
  };

  假設您希望支持清單 10 所示的簡單語法,該語法部分解析 C/C++ 枚舉。

  清單 10. C/C++ 枚舉的簡單語法

    enum_specifIEr : ENUM '{' enumerator_list '}'
    | ENUM IDENTIFIER '{' enumerator_list '}'
    | ENUM IDENTIFIER
    ;
enumerator_list : enumerator
    | enumerator_list ',' enumerator
    ;
enumerator : IDENTIFIER
    ;
ENUM: "enum";
IDENTIFIER: ['a'..'z']+;

  清單 11 展示了相應的 Spirit 代碼。程序的輸出為 1,表示成功完成解析。

  清單 11. 解析 C/C++ 枚舉的 Spirit 代碼

#define BOOST_SPIRIT_NO_REGEX_LIB
#include "regex.h"
#include "spirit.hpp"
#include "boost/spirit/actor/assign_actor.hpp"
using namespace std;
using namespace boost::spirit;
struct my_enum : public grammar
  {
  template
   struct definition
    {
    definition(my_enum const& self)
     {
     enum_specifier = enum_p >> '{' >> enum_list >> '}';
     enum_p = str_p("enum");
     enum_list = +id_p >> *(',' >> +id_p);
     id_p = range_p('a','z');
     }
     rule enum_specifier, enum_p, enum_list, id_p;
     rule const& start const { return enum_specifier; }
    };
  };
string input = "enum { ah, bk }";
int main
 {
 my_enum e;
 int status = parse(input.c_str, e, space_p).hit;
 cout << status << endl;
 return 0;
 }

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美精品系列| 男男成人高潮片免费网站| 欧美午夜精品久久久| 欧美第十八页| 欧美精品v日韩精品v国产精品| 欧美成人自拍视频| 欧美人与性禽动交情品 | 麻豆免费精品视频| 久久久人人人| 欧美极品欧美精品欧美视频| 欧美成人午夜激情| 欧美午夜精品久久久久久浪潮 | 韩国一区电影| 最新日韩中文字幕| 亚洲一区视频| 久久久久一区二区| 亚洲黄页一区| 亚洲午夜久久久| 久久久亚洲高清| 欧美日本亚洲韩国国产| 欧美日韩美女在线| 国产免费观看久久| 在线观看国产日韩| 一本大道久久a久久精品综合| 欧美一区二区啪啪| 欧美福利视频在线| 亚洲主播在线观看| 久久亚洲精选| 国产乱码精品| 在线亚洲精品| 欧美韩日一区二区| 亚洲欧美大片| 欧美日韩伦理在线| 亚洲电影观看| 欧美一级视频| 99re6热在线精品视频播放速度| 欧美在现视频| 国产精品高潮视频| 亚洲电影在线播放| 欧美一区影院| 一区二区欧美在线| 免费成人美女女| 国产中文一区二区三区| 亚洲天堂成人在线视频| 亚洲第一中文字幕在线观看| 欧美亚洲网站| 国产伦理一区| 亚洲一区在线直播| 亚洲精品视频在线观看免费| 久久天堂国产精品| 国内精品久久久久久久影视麻豆| 亚洲欧美一区二区三区久久| 99热这里只有精品8| 欧美精品尤物在线| 亚洲精品乱码| 最新国产精品拍自在线播放| 欧美刺激午夜性久久久久久久| 亚洲高清资源| 麻豆av一区二区三区| 性感少妇一区| 国产一区二区三区自拍| 久久精品盗摄| 久久高清免费观看| 国语自产偷拍精品视频偷| 欧美伊人久久久久久久久影院 | 欧美成人中文| 久久字幕精品一区| 91久久夜色精品国产九色| 欧美国产三级| 欧美激情第一页xxx| 亚洲伦理中文字幕| 日韩视频不卡| 欧美亚一区二区| 午夜在线精品偷拍| 性xx色xx综合久久久xx| 国内成+人亚洲| 欧美黄色视屏| 欧美激情第10页| 亚洲一区二区视频在线| 亚洲毛片一区| 国产精品久久中文| 久久精品日产第一区二区| 小处雏高清一区二区三区| 国模精品一区二区三区| 亚洲国产精品精华液2区45 | 欧美成人伊人久久综合网| 一区二区三区福利| 性伦欧美刺激片在线观看| 国际精品欧美精品| 亚洲精品黄色| 国产精品少妇自拍| 欧美bbbxxxxx| 欧美视频中文在线看| 久久精品伊人| 99国内精品久久| 午夜在线视频观看日韩17c| 亚洲国产一区在线| 亚洲一区在线免费| 激情久久综艺| 亚洲韩日在线| 亚洲另类自拍| 精品999日本| 亚洲四色影视在线观看| 黄色日韩在线| 一区二区三区黄色| 在线成人av网站| 99re热这里只有精品视频| 国产一区二区三区精品欧美日韩一区二区三区 | 亚洲精品国产无天堂网2021| 国产午夜精品在线观看| 亚洲福利视频一区| 国内精品久久久久久久果冻传媒 | 亚洲国产精品黑人久久久| 国产亚洲欧美日韩在线一区| 最近看过的日韩成人| 国产亚洲综合精品| 宅男噜噜噜66国产日韩在线观看| 在线观看视频一区| 亚洲午夜久久久久久久久电影院| 最新日韩精品| 蜜桃av噜噜一区| 蜜臀91精品一区二区三区| 国产精品一区久久久久| 亚洲精品综合久久中文字幕| 一区二区亚洲| 久久精品欧美日韩| 欧美一区二区三区在线看| 欧美偷拍一区二区| 亚洲欧洲一区| 亚洲精品中文字幕在线| 久久久久成人网| 久久久精品999| 国产欧美另类| 亚洲一区在线观看免费观看电影高清 | 亚洲福利视频二区| 最新国产の精品合集bt伙计| 久久婷婷麻豆| 欧美成人午夜激情在线| 黄色国产精品| 免费成人av| 亚洲国产日韩在线一区模特| 亚洲国产一区二区三区高清| 欧美国产精品中文字幕| 亚洲七七久久综合桃花剧情介绍| 亚洲精品乱码久久久久久黑人| 欧美电影资源| 亚洲另类黄色| 欧美一区网站| 狠狠综合久久av一区二区老牛| 香蕉亚洲视频| 欧美a级一区| 99视频热这里只有精品免费| 欧美日韩一卡二卡| 午夜精品短视频| 老司机午夜精品视频在线观看| 亚洲国产精品久久久久| 欧美国产先锋| 亚洲视频综合| 久久婷婷一区| 亚洲国产婷婷| 国产精品剧情在线亚洲| 欧美主播一区二区三区美女 久久精品人 | 欧美激情一区三区| 亚洲精品影院| 欧美性猛交xxxx免费看久久久| 亚洲欧美日韩精品久久| 老司机午夜精品视频| 夜夜嗨av一区二区三区网页| 国产精品五区| 女女同性精品视频| 亚洲综合导航| 蜜臀久久久99精品久久久久久| 日韩特黄影片| 国产一区二区三区久久久| 欧美1级日本1级| 亚洲午夜一区二区三区| 噜噜噜91成人网| 亚洲尤物在线| 亚洲第一天堂av| 国产精品美女久久久久久2018 | 亚洲国产精品黑人久久久| 亚洲欧美日韩一区在线观看| 国产亚洲午夜| 欧美日韩一区综合| 欧美一区二区三区免费看| 亚洲美女av黄| 欧美成人精品h版在线观看| 亚洲欧美日韩在线| 久久黄色影院| 亚洲深夜福利| 亚洲丰满在线| 狂野欧美激情性xxxx欧美| 亚洲欧美日韩国产中文 | 久久人人爽人人爽爽久久| 日韩亚洲一区在线播放| 今天的高清视频免费播放成人| 国产精一区二区三区| 欧美午夜在线| 欧美女人交a| 麻豆国产va免费精品高清在线|