欧美日本久久,亚洲电影免费观看高清完整版在线 ,欧美日韩在线大尺度

Syngram Helper開始設計：一個能用來寫編譯器的工具

    大概一年前曾經用C++開發了一個可以在C++中直接寫上下文無關文法的上下文無關文法分析器。這玩意兒叫Syngram。Syngram曾經做了兩次，第一次做成了用一個類去讀文法文件，后來不爽就改成了直接在C++里面寫的。我弄了一個叫Term的類，重載了一些操作符，于是你可以搞分支、可選、錯誤處理等復雜的文法推導式。現在打算做一個周邊工具。

    這個周邊工具的由來是這樣的。后來我用Syngram開發了一個支持namespace、class和函數的動態語言Vczh Free Script 2.0 beta，這個動態語言支持面向對象、泛型以及函數式等若干范式，語言可以調用編譯器編譯一個字符串并操作。虛擬機被我做成了兩個dll，一個是給native c++調用的，另一個是給C# 3.0調用的。編譯器我用了Syngram，在上面那個鏈接所提供的代碼里就有一個文件，布滿了文法推導式以及每一個式子的語義函數。旁邊的一個文件寫了一個很大的語法樹數據結構，是一組C++類。

    這門腳本語言的第一個版本的編譯器開發長達三天，因為我要花一天時間做文法，一天時間做語法樹，一天時間生成指令。第一版只支持閉包和數組。這么小的語言寫一個編譯器花了三天實在是浪費的太多了，因為后來我發現語法樹是一個很有規律的東西。我就在想，能不能我就寫一點點東西，然后有一個工具就幫我把這些代碼寫出來呢？前幾天洗澡的時候想到了一個解決方案。

    我可以用一種很簡便的方法寫一個可以被轉換成C++的類、列表、字典和枚舉類型的語法樹模型，然后將一點點東西添加在推導式里面告訴推導式創建什么樣的對象、如何修改對象、列表和字典等。錯誤信息的產生以及錯誤恢復已經在Syngram里面實現了，很容易支持進去。于是現在又變成了類似讀文法文件產生代碼的東西了，不過跟Syngram第一版有很大區別。

    首先，Syngram作為一個C++的類庫，仍然可以支持在C++里直接寫文法、錯誤處理以及語義函數。
    第二，這個新的工具讀入文法文件之后，產生的并不是一個完整的語法分析器，而是一些基于Syngram類庫的代碼。
    第三，這個新的工具的最大好處在于可以在自己寫的語義函數（將分析結果轉換成自己想要的語法樹）中和自己寫語法樹的數據結構（特別是相應的一些虛函數族）這兩個沒有挑戰性而且很煩的工作中解放出來。工具將根據輸入的文件生成用于表達數據結構的一堆類（通常是幾十個），根據需求自動分成幾個繼承的組，為他們添加一兩個使用了Visitor模式的接口。于是虛函數的方便被轉移到了Visitor模式的產物中，自己的代碼跟生成的代碼完全隔離。
    最后，說不定這個工具有GUI。

    前幾天完成了Syngram所屬的Vczh Library ++ 2.0中的GUI Framework預覽版。這個東西的初衷是寫給我自己用的，因為我很不喜歡MFC等有BEGIN_MESSAGE_MAP或者需要我處理WPARAM和LPARAM的界面庫，于是自己弄了一個。不過GUI Framework實在是龐大，一個人做起來也是比較吃力的。如果我心情好GUI 1.0 beta比這個Syngram Helper早完成的話，那么Syngram Helper就會有GUI用了。今天寫了個簡單的語法文件的文法，貼出來先。里面的注釋用英語僅僅是因為我懶的來回切換輸入法，估計有一堆語法錯誤，不要計較。

KEYWORD ->class
->bool
->int
->double
->string
->list
->map
->term
->infer
OPERATOR ->[
->]
-><
->>
->,
->=
->|
->:
->#
->@

IDENT ->[a-zA-Z_]\w*
REGEX ->[^\r\n]+\r\n
COMMENT ->'[^\r\n]*\r\n
STRING ->"([^\\"]|\\\.)*"

CLASS ->class IDENT [: IDENT] "{" MEMBERS "}"
ENUM ->enum IDENT "{" IDENTS "}"
MEMBER ->TYPE IDENT
->STRING IDENT //external member, treat STRING as type, can not be accessed in semantic rule
TYPE ->bool
->int
->double
->string
->token //store a token
->list<TYPE>
->map<TYPE,TYPE>
->multimap<TYPE,TYPE>

LEXICAL ->term IDENT REGEX
SYNTAX ->infer TYPE IDENT RULE_EXP
RULE_EXP ->[ RULE_EXP "|" ]RULE_SERIES
RULE_SERIES ->[ RULE_SERIES ]RULE_UNIT
RULE_UNIT ->RULE_TERM
->"[" RULE_EXP "]"
RULE_TERM ->IDENT [ "[" SEMANTICS "]" ]

SEMANTIC ->SEMANTIC_TARGET [ "=" SEMANTIC_SOURCE ]
SEMANTIC_TARGET ->:IDENT // Field of result, new map item or new list item
SEMANTIC_TARGET ->#key // add item in result map using this key
SEMANTIC_TARGET ->#value // add item in result map using this value
SEMANTIC_TARGET ->#item // add item in result list using this value
SEMANTIC_TARGET ->#result // treat this value as the result, result map or result list
    // new item in a path is not required if there is at least a #result term in the same path
SEMANTIC_TARGET ->#alias // name this value as SEMANTIC_SOURCE
SEMANTIC_TARGET ->#error // treat SEMANTIC_SOURCE as error message
SEMANTIC_TARGET ->#keyerror // treat SEMANTIC_SOURCE as error message and raise an error if the specified key exists
SEMANTIC_TARGET ->#past // past this term when error occurs
SEMANTIC_TARGET ->#read // read a token when error occurs
SEMANTIC_TARGET ->#exit // terminate parsing when error occurs
SEMANTIC_SOURCE ->IDENT // value of alias or enumeration item
SEMANTIC_SOURCE ->STRING // value of error message
SEMANTIC_SOURCE ->@IDENT // value of external string
/*
#key, #value, #item, #result : can only appears once in a path
#alias    : can not be conflict in a path
#error, #past, #read, #exit : can only appears once in a term
#alias, #error   : must be used with SEMANTIC_SOURCE
#keyerror   : can only appears once in a term, must be used with #key
:IDENT    : can not be conflict in a path
*/

IDENTS ->IDENT [IDENTS]
MEMBER ->MEMBER [MEMBERS]
SEMANTICS ->SEMANTIC ["," SEMANTICS]
TYPES ->( CLASS | ENUM )[TYPES]
LEXICALS ->LEXICAL[LEXICALS]
SYNTAXES ->SYNTAX[SYNTAXES]

PROGRAM ->TYPES LEXICALS SYNTAXES

posted on 2008-08-27 05:11 陳梓瀚(vczh) 閱讀(1873) 評論(5) 編輯收藏引用所屬分類: 腳本技術

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: 手把手教你寫腳本引擎（五）——簡單的高級語言（3，符號表）手把手教你寫腳本引擎 PPT與Demo（一） Kernel FP的圖形Demo實現！ Kernel FP編譯器工具實現 Kernel FP 編譯器MakeFile開發完成 Kernep FP實現虛擬機的序列化與反序列化 Kernel FP添加反射API 使用Kernel FP的do-end語法糖添加自己的異常處理系統使用Kernel FP API實現一個運行Kernel FP代碼的控制臺程序在純函數式語言內實現有關IO的循環

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

留言簿(70)

隨筆分類(347)

好友博客

搜索

最新評論

閱讀排行榜

評論排行榜