• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆-341  評論-2670  文章-0  trackbacks-0

                大概一年前曾經用C++開發了一個可以在C++中直接寫上下文無關文法的上下文無關文法分析器。這玩意兒叫Syngram。Syngram曾經做了兩次,第一次做成了用一個類去讀文法文件,后來不爽就改成了直接在C++里面寫的。我弄了一個叫Term的類,重載了一些操作符,于是你可以搞分支、可選、錯誤處理等復雜的文法推導式。現在打算做一個周邊工具。

                這個周邊工具的由來是這樣的。后來我用Syngram開發了一個支持namespace、class和函數的動態語言Vczh Free Script 2.0 beta,這個動態語言支持面向對象、泛型以及函數式等若干范式,語言可以調用編譯器編譯一個字符串并操作。虛擬機被我做成了兩個dll,一個是給native c++調用的,另一個是給C# 3.0調用的。編譯器我用了Syngram,在上面那個鏈接所提供的代碼里就有一個文件,布滿了文法推導式以及每一個式子的語義函數。旁邊的一個文件寫了一個很大的語法樹數據結構,是一組C++類。

                這門腳本語言的第一個版本的編譯器開發長達三天,因為我要花一天時間做文法,一天時間做語法樹,一天時間生成指令。第一版只支持閉包和數組。這么小的語言寫一個編譯器花了三天實在是浪費的太多了,因為后來我發現語法樹是一個很有規律的東西。我就在想,能不能我就寫一點點東西,然后有一個工具就幫我把這些代碼寫出來呢?前幾天洗澡的時候想到了一個解決方案。

                我可以用一種很簡便的方法寫一個可以被轉換成C++的類、列表、字典和枚舉類型的語法樹模型,然后將一點點東西添加在推導式里面告訴推導式創建什么樣的對象、如何修改對象、列表和字典等。錯誤信息的產生以及錯誤恢復已經在Syngram里面實現了,很容易支持進去。于是現在又變成了類似讀文法文件產生代碼的東西了,不過跟Syngram第一版有很大區別。

                首先,Syngram作為一個C++的類庫,仍然可以支持在C++里直接寫文法、錯誤處理以及語義函數。
                第二,這個新的工具讀入文法文件之后,產生的并不是一個完整的語法分析器,而是一些基于Syngram類庫的代碼。
                第三,這個新的工具的最大好處在于可以在自己寫的語義函數(將分析結果轉換成自己想要的語法樹)中和自己寫語法樹的數據結構(特別是相應的一些虛函數族)這兩個沒有挑戰性而且很煩的工作中解放出來。工具將根據輸入的文件生成用于表達數據結構的一堆類(通常是幾十個),根據需求自動分成幾個繼承的組,為他們添加一兩個使用了Visitor模式的接口。于是虛函數的方便被轉移到了Visitor模式的產物中,自己的代碼跟生成的代碼完全隔離。
                最后,說不定這個工具有GUI。

                前幾天完成了Syngram所屬的Vczh Library ++ 2.0中的GUI Framework預覽版。這個東西的初衷是寫給我自己用的,因為我很不喜歡MFC等有BEGIN_MESSAGE_MAP或者需要我處理WPARAM和LPARAM的界面庫,于是自己弄了一個。不過GUI Framework實在是龐大,一個人做起來也是比較吃力的。如果我心情好GUI 1.0 beta比這個Syngram Helper早完成的話,那么Syngram Helper就會有GUI用了。今天寫了個簡單的語法文件的文法,貼出來先。里面的注釋用英語僅僅是因為我懶的來回切換輸入法,估計有一堆語法錯誤,不要計較。

            KEYWORD  ->class
              ->bool
              ->int
              ->double
              ->string
              ->list
              ->map
              ->term
              ->infer
            OPERATOR ->[
              ->]
              -><
              ->>
              ->,
              ->=
              ->|
              ->:
              ->#
              ->@

            IDENT  ->[a-zA-Z_]\w*
            REGEX  ->[^\r\n]+\r\n
            COMMENT  ->'[^\r\n]*\r\n
            STRING  ->"([^\\"]|\\\.)*"

            CLASS   ->class IDENT [: IDENT] "{" MEMBERS "}"
            ENUM  ->enum IDENT "{" IDENTS "}"
            MEMBER  ->TYPE IDENT
              ->STRING IDENT //external member, treat STRING as type, can not be accessed in semantic rule
            TYPE  ->bool
              ->int
              ->double
              ->string
              ->token  //store a token
              ->list<TYPE>
              ->map<TYPE,TYPE>
              ->multimap<TYPE,TYPE>

            LEXICAL  ->term IDENT REGEX
            SYNTAX  ->infer TYPE IDENT RULE_EXP
            RULE_EXP ->[ RULE_EXP "|" ]RULE_SERIES
            RULE_SERIES ->[ RULE_SERIES ]RULE_UNIT
            RULE_UNIT ->RULE_TERM
              ->"[" RULE_EXP "]"
            RULE_TERM ->IDENT [ "[" SEMANTICS "]" ]

            SEMANTIC ->SEMANTIC_TARGET [ "=" SEMANTIC_SOURCE ]
            SEMANTIC_TARGET ->:IDENT // Field of result, new map item or new list item
            SEMANTIC_TARGET ->#key  // add item in result map using this key
            SEMANTIC_TARGET ->#value // add item in result map using this value
            SEMANTIC_TARGET ->#item  // add item in result list using this value
            SEMANTIC_TARGET ->#result // treat this value as the result, result map or result list
                // new item in a path is not required if there is at least a #result term in the same path
            SEMANTIC_TARGET ->#alias // name this value as SEMANTIC_SOURCE
            SEMANTIC_TARGET ->#error // treat SEMANTIC_SOURCE as error message
            SEMANTIC_TARGET ->#keyerror // treat SEMANTIC_SOURCE as error message and raise an error if the specified key exists
            SEMANTIC_TARGET ->#past  // past this term when error occurs
            SEMANTIC_TARGET ->#read  // read a token when error occurs
            SEMANTIC_TARGET ->#exit  // terminate parsing when error occurs
            SEMANTIC_SOURCE ->IDENT  // value of alias or enumeration item
            SEMANTIC_SOURCE ->STRING // value of error message
            SEMANTIC_SOURCE ->@IDENT // value of external string
            /*
            #key, #value, #item, #result : can only appears once in a path
            #alias    : can not be conflict in a path
            #error, #past, #read, #exit : can only appears once in a term
            #alias, #error   : must be used with SEMANTIC_SOURCE
            #keyerror   : can only appears once in a term, must be used with #key
            :IDENT    : can not be conflict in a path
            */

            IDENTS  ->IDENT [IDENTS]
            MEMBER  ->MEMBER [MEMBERS]
            SEMANTICS ->SEMANTIC ["," SEMANTICS]
            TYPES  ->( CLASS | ENUM )[TYPES]
            LEXICALS ->LEXICAL[LEXICALS]
            SYNTAXES ->SYNTAX[SYNTAXES]

            PROGRAM  ->TYPES LEXICALS SYNTAXES

            posted on 2008-08-27 05:11 陳梓瀚(vczh) 閱讀(1865) 評論(5)  編輯 收藏 引用 所屬分類: 腳本技術

            評論:
            # re: Syngram Helper開始設計:一個能用來寫編譯器的工具 2008-08-27 06:25 | Lnn
            super!  回復  更多評論
              
            # re: Syngram Helper開始設計:一個能用來寫編譯器的工具 2008-08-27 09:13 | Michel
            是否可以公布一下你的學習曲線?
            讀過哪些讀物能夠達到現在的程度?需要做哪些努力,關注哪些方面?
            如果您的飲食對您的能力有所提高的話,也可以公布一下~  回復  更多評論
              
            # re: Syngram Helper開始設計:一個能用來寫編譯器的工具 2008-08-27 09:25 | 陳梓瀚(vczh)
            事實上我以前是做圖形的,后來中途改方向,反正現在看起來以前走的路還真是亂七八糟。罷了。  回復  更多評論
              
            # re: Syngram Helper開始設計:一個能用來寫編譯器的工具 2008-08-27 17:01 | foxtail
            誰都說不清自己學習的路 摸爬滾打過來的  回復  更多評論
              
            # re: Syngram Helper開始設計:一個能用來寫編譯器的工具 2008-08-27 19:19 | 空明流轉
            這個 Demo 倒是挺簡潔的。  回復  更多評論
              
            久久久久亚洲av成人无码电影| 久久精品国产免费观看三人同眠| 国产精品久久永久免费| 亚洲一区中文字幕久久| 国产精品99久久久久久猫咪 | 亚洲AV无码久久精品成人| 无遮挡粉嫩小泬久久久久久久| 国产精品欧美久久久天天影视| 久久国产一片免费观看| 中文字幕乱码久久午夜| 99久久国产综合精品成人影院| 国产香蕉久久精品综合网| 99久久婷婷免费国产综合精品| 精品久久久一二三区| 精品国产91久久久久久久a| 日韩乱码人妻无码中文字幕久久| 精品视频久久久久| 久久久精品人妻一区二区三区蜜桃| 久久国产精品一区| 久久九九全国免费| 久久久国产乱子伦精品作者| 一本久道久久综合狠狠躁AV| 国产精自产拍久久久久久蜜| 狠狠88综合久久久久综合网| 亚洲国产另类久久久精品小说| 亚洲国产精品无码久久九九| 久久久精品国产Sm最大网站| 夜夜亚洲天天久久| 久久免费精品一区二区| 国内精品久久久久伊人av| 久久棈精品久久久久久噜噜| 亚洲综合日韩久久成人AV| 亚洲AV伊人久久青青草原| 久久青青草原亚洲av无码| 久久精品国产一区二区| 久久久久99精品成人片三人毛片 | 国产成人综合久久综合| 亚洲国产精品无码久久久不卡 | 久久大香萑太香蕉av| 青青草国产97免久久费观看| 日本精品久久久久久久久免费|