青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆-341  評論-2670  文章-0  trackbacks-0

手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法)

 

陳梓瀚

華南理工大學(xué)軟件本科05

vczh@163.com

http://www.shnenglu.com/vczh/

 

    有了全盤的計(jì)劃之后,我們必須先處理輸入的腳本,才能夠進(jìn)行下一步的工作。字符串處理方面可以參照一下三篇文章:《構(gòu)造可配置語法分析器》、《構(gòu)造正則表達(dá)式引擎》以及《如何手寫語法分析器》。作為補(bǔ)充,這里再說一說其他的辦法。

 

    首先是詞法分析器。我們?nèi)匀荒軌蚴褂谩稑?gòu)造可配置語法分析器》前半部分的方法人腦畫出一張合適的DFA,這個(gè)時(shí)候我們可以手工來實(shí)現(xiàn)。用于詞法分析器的DFA只有兩種狀態(tài),一種是普通狀態(tài),另一種是終結(jié)狀態(tài)。所以我們可以很機(jī)械地將DFAC++寫出來。

 

    我們要為狀態(tài)編號。編號要連續(xù),而且要從0開始,這樣的話C++的編譯器一般都會為switch-case的代碼生成一張表,用于快速跳轉(zhuǎn)。然后用下面的方法。

 

    1:將輸入的指針Input復(fù)制出一個(gè)副本,叫Current;給出一個(gè)同類型的指針Last,將其賦值為NULL;使用一個(gè)變量Status來記錄當(dāng)前的狀態(tài)。初始化狀態(tài),一般為了方便我們把初始狀態(tài)編號成0

 

    2:做一個(gè)死循環(huán)不斷的計(jì)算新Status。對于某個(gè)Status我們總是能夠知道輸入什么字符跳轉(zhuǎn)到什么新的Status上去。不同的人寫出來的DFA可能會有所區(qū)別。我們首先判斷當(dāng)前的Status是不是終結(jié)狀態(tài),如果是的話將Current賦值給Last,然后繼續(xù)往下走。我們從Current指針拿出一個(gè)字符,然后計(jì)算新Status。如果Current不滿足要求那么結(jié)束循環(huán),如果Current滿足要求那么改變Status并讓Current指向新的位置。

 

    3:因?yàn)樽址偸怯邢薜模赃@個(gè)循環(huán)總是會結(jié)束。結(jié)束了之后,我們檢查Last。如果Last仍然是NULL,那么代表輸入的字符串是有問題的。如果不是,那么我們所需要的一個(gè)記號就從Input開始到Last結(jié)束了。如果記號的類型有需要保留的話,那么我們只需要添加一個(gè)新的代表類型的變量,在每一次修改Last的時(shí)候修改這個(gè)保存類型的變量就行了。因?yàn)橐粋€(gè)終結(jié)狀態(tài)只能代表一種類型的結(jié)束(反過來不成立,一種類型可能有好幾個(gè)終結(jié)狀態(tài))。

 

    然后是語法分析。一般來說,使用《如何手寫語法分析器》中描述的方法實(shí)現(xiàn)一個(gè)語法分析器的話是很容易的,但是一個(gè)主要問題就是如果一門語言很復(fù)雜,特別是操作符特別多的話,這些函數(shù)寫起來會很亂,因此每一個(gè)文法產(chǎn)生式的處理函數(shù)的命名和注釋就變得相當(dāng)重要了。為了簡化這件事情,我們還有另一種專門用來處理操作符的方法,而且是高度可配置的。為了簡化,我僅給出二元操作符和前綴操作符的處理方法。后綴操作符不常見,需要的話自己想辦法吧,在上一篇文章中的語法定義中并沒有出現(xiàn)后綴操作符。

 

    在這種方法中,我們把重點(diǎn)放在不包含修改優(yōu)先級的括號的表達(dá)式中。遇到一個(gè)用于修改優(yōu)先級的括號的時(shí)候,只要遞歸一下就好了。現(xiàn)在,我們通過詞法分析,已經(jīng)得到了很多記號,然后就使用以下的方法來生成一顆正確的語法樹:

 

    1:我們需要定義兩個(gè)指針,第一個(gè)用于保存根節(jié)點(diǎn),第二個(gè)用于保存當(dāng)前節(jié)點(diǎn)。在分析的過程中,根節(jié)點(diǎn)會經(jīng)常變化,當(dāng)前節(jié)點(diǎn)也是。

 

    2:取出一個(gè)單元。一個(gè)單元指的是一個(gè)用括號包括起來的完整的表達(dá)式、一個(gè)函數(shù)調(diào)用、一個(gè)常量或變量和僅由前綴操作符與單元組成的整體。舉個(gè)例子,1是單元,a是單元,function(param1,param2+param3)是單元,(a*b+c*d)是單元,-(a+b)也是單元。但是-a+b就不是單元了。單元內(nèi)部可能有表達(dá)式,我們可以遞歸下去。取出單元以后,就把根節(jié)點(diǎn)和當(dāng)前節(jié)點(diǎn)指向這個(gè)單元。

 

    3:一個(gè)正確的表達(dá)式總是由單元和二元操作組成的,如果在以下的步驟中出錯(cuò)的話,那么可以直接確定輸入的表達(dá)式的語法不正確。我們做一個(gè)死循環(huán)一直到遇到右括號、逗號等這些結(jié)束表達(dá)式的記號為止,對于每一個(gè)輸入執(zhí)行第4步。

 

    4:取出一個(gè)二元操作符和一個(gè)單元。然后從當(dāng)前節(jié)點(diǎn)往父節(jié)點(diǎn)找,一直到根節(jié)點(diǎn)或者父節(jié)點(diǎn)優(yōu)先級比當(dāng)前的二元操作符小的二元操作符為止。如果找到根節(jié)點(diǎn),那么整個(gè)根節(jié)點(diǎn)將作為二元操作符的左操作數(shù),單元作為右操作數(shù),根節(jié)點(diǎn)更新,當(dāng)前節(jié)點(diǎn)指向單元。如果不是的話,將找到的節(jié)點(diǎn)(這個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn)的優(yōu)先級比自己小)從父節(jié)點(diǎn)脫離,整個(gè)節(jié)點(diǎn)作為操作符的左操作數(shù),單元作為右操作數(shù),然后用這個(gè)二元操作符接上父節(jié)點(diǎn)。

 

    5:當(dāng)34進(jìn)行不下去的時(shí)候,我們就得到了一棵完整的表達(dá)式語法樹了。當(dāng)然,如果中間出錯(cuò)的話,我們應(yīng)當(dāng)輸出錯(cuò)誤信息。這個(gè)時(shí)候要不要繼續(xù)往下走就自己看著辦吧,因?yàn)檫M(jìn)行錯(cuò)誤恢復(fù)的話,接下去的錯(cuò)誤信息會很難看,就像VC++一樣。

 

    我給一個(gè)例子來說明如何處理這些事情。現(xiàn)在我們要分析1+2*3+4。這個(gè)算法將會產(chǎn)生一個(gè)正確的語法樹”1”,然后修改為正確的語法樹”1+2”,然后修改為正確的語法樹”1+2*3”,最后產(chǎn)生完整的正確的語法樹。

 

    第一步,產(chǎn)生一個(gè)單元的正確的語法樹:

    第二步,獲得一個(gè)二元操作符,并產(chǎn)生一個(gè)單元的語法樹”2”。因?yàn)楫?dāng)前節(jié)點(diǎn)往上就沒有了,所以執(zhí)行4中的第一種情況:

    第三步,獲得操作符”*”和一個(gè)單元的語法樹”3”。因?yàn)?/span>2的父節(jié)點(diǎn)的優(yōu)先級比”*”小,因此執(zhí)行4的第二種情況:

    第四步,獲得操作符”+”和一個(gè)單元的語法樹”4”。這個(gè)時(shí)候3的父節(jié)點(diǎn)的優(yōu)先級大于或等于”+”的優(yōu)先級,因此一直往上找,一直到根節(jié)點(diǎn)。因?yàn)楦?jié)點(diǎn)的優(yōu)先級仍然大于或等于”+”的優(yōu)先級,因此再也上不了了,執(zhí)行4的第一種情況:

    字符串結(jié)束了,中間也沒有出錯(cuò),代表輸入的表達(dá)式”1+2*3+4”是正確的,我們也得到了一棵正確的語法樹。

 

    通過之前的文章與上述兩種簡單的方法的學(xué)習(xí),我想分析一門語言的語法也就沒什么困難的了。不過分析字符串是次要的,得到語法樹才是主要的。就算用了一種猥瑣的處理字符串的辦法得到了語法樹,那也沒關(guān)系,以后有時(shí)間再改就行了。現(xiàn)在我們要討論一下語法樹的數(shù)據(jù)結(jié)構(gòu)問題。

 

    在這里我們需要大膽地使用虛函數(shù)。使用單一的一個(gè)class來表達(dá)整棵語法樹是不好的,因?yàn)槲覀兊恼Z法樹要表達(dá)unit、表達(dá)類型聲明、函數(shù)聲明、還有各種復(fù)雜的語句。類型是遞歸的,語句是遞歸的,表達(dá)式也是遞歸的。對于一組遞歸的結(jié)構(gòu),我們要定義一個(gè)幾類,并派生出各種子類來表達(dá)各種類型的結(jié)構(gòu)。這樣做的好處是我們可以很方便地處理類型檢查、其它語義分析以及生成指令。多態(tài)在這里是相當(dāng)好用的,比省掉一點(diǎn)虛函數(shù)的空間(若干個(gè)同類型的對象只共享一張?zhí)摵瘮?shù)表)和一點(diǎn)調(diào)用的時(shí)候犧牲的速度好多了。我想用復(fù)雜的if或函數(shù)指針來代替多態(tài)估計(jì)也沒有多態(tài)快。

 

    因?yàn)轭愋汀⒈磉_(dá)式和語句的處理方式是類似的,因此我只為表達(dá)式建模。我們的表達(dá)式有四則運(yùn)算、數(shù)組訪問以及函數(shù)調(diào)用。首先我們給出一個(gè)基類ExpBase

    class ExpBase

    {

    public:

       TypeBase* GetType(vector<ErrorMessage>& Errors);

    };

    我們拿到了一個(gè)表達(dá)式之后,轉(zhuǎn)換成表達(dá)式樹,就會得到一個(gè)ExpBase了,這個(gè)時(shí)候我們進(jìn)行類型檢查,只需要調(diào)用GetType就行了。各種不同的檢查由子類實(shí)現(xiàn)。

 

    然后我們?yōu)檫\(yùn)算符定義表達(dá)式節(jié)點(diǎn):

    enum BinOpType

    {

        Plus,

        Minus,

        Multiply,

        Division,

        ……

    };

    enum SinOpType

    {

        Negative,

        Not,

        ……

    };

    class ExpBinOp : public ExpBase

    {

    public:

        ExpBase*  ParamA;

        ExpBase*  ParamB;

        BinOpType Operator;

    };

    class ExpSinOp : public ExpBase

    {

    public:

        ExpBase* Param;

        SinOpType Operator;

    };

    數(shù)組訪問可以加進(jìn)二元操作符也可以不加,不過我個(gè)人還是傾向于不加的,因?yàn)楹罄m(xù)的處理邏輯有很大的不同。

 

接下來是函數(shù)調(diào)用的表達(dá)式節(jié)點(diǎn):

    class ExpInvoke : public ExpBase

    {

    public:

        ExpBase* Name;

        vector<ExpBase*> Params;

    };

 

    所有的符合表達(dá)式就構(gòu)造完了,但是我們?nèi)匀恍枰粋€(gè)代表單一記號的表達(dá)式,譬如變量名啊數(shù)字等等。我們直接把一個(gè)記號放進(jìn)去就好了,因?yàn)橛浱柪锩嬗谐A康念愋托拧⒁灿凶兞棵?/span>

    class ExpToken : public ExpBase

    {

    public:

        Token* Content;

    };

 

    表達(dá)式的數(shù)據(jù)結(jié)構(gòu)就構(gòu)造完了,然后我們把剩下的類型信息與語句構(gòu)造萬,給出單元結(jié)構(gòu)以后就結(jié)束了。

 

    鑒于實(shí)習(xí)期間較忙,自己的時(shí)間不多,完整的代碼我就不給出來了。要是大家愿意的話可以去這里看Vczh Free Script 2.0 beta的語法樹結(jié)構(gòu)。雖然少了類型族,但也還是能看得。

 

    下一篇文章講述語義分析以及符號表的事情。語法樹不僅要代表源代碼,還需要附帶額外的信息,譬如表達(dá)式的類型、重載的選擇等等。這些在語法分析的時(shí)候很難一起產(chǎn)生,所以我們借助多態(tài)來簡化這個(gè)任務(wù)。

posted on 2008-08-01 23:19 陳梓瀚(vczh) 閱讀(5214) 評論(4)  編輯 收藏 引用 所屬分類: 腳本技術(shù)

評論:
# re: 手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法)[未登錄] 2008-08-02 00:16 | foxtail
sf 哈哈  回復(fù)  更多評論
  
# re: 手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法) 2008-08-02 01:46 | 空明流轉(zhuǎn)
最近用flex+yacc+ctool來搞得,前兩個(gè)用于詞法和語法分析,ctool可以保存AST。  回復(fù)  更多評論
  
# re: 手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法) 2008-09-30 17:01 |
我有一門新的語言,需要語法分析器,和正則表達(dá)式引擎,可實(shí)在費(fèi)勁了。不知博主有興趣研究嗎?我的郵箱king_tu@163.com  回復(fù)  更多評論
  
# re: 手把手教你寫腳本引擎(四)——簡單的高級語言(2,處理語法) 2008-10-01 09:49 | 陳梓瀚(vczh)
工程上來說,正則表達(dá)式有boost::regex,語法分析器你可以選擇yacc幫你生成無法看懂的代碼,或者用boost幫你寫一些很難控制錯(cuò)誤信息的代碼,或者其他。  回復(fù)  更多評論
  
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲高清一二三区| 欧美四级伦理在线| 国语自产精品视频在线看8查询8| 亚洲一区二区三区欧美| 日韩亚洲在线观看| 欧美色综合天天久久综合精品| 亚洲午夜在线观看| 亚洲摸下面视频| 韩国一区二区三区美女美女秀| 久久亚洲精选| 欧美黄色影院| 亚洲欧美成人一区二区三区| 亚洲一区影院| 亚洲国产成人精品女人久久久 | 日韩午夜激情av| 亚洲日韩视频| 欧美视频官网| 久久婷婷一区| 欧美日韩 国产精品| 香蕉成人久久| 欧美成人有码| 欧美在线观看视频一区二区三区| 久久精品国产视频| 一区二区电影免费观看| 欧美亚洲免费电影| 亚洲免费精品| 性色av一区二区三区| 亚洲精品一区二区在线| 亚洲欧美三级伦理| 99re热这里只有精品视频| 亚洲欧美日韩另类| 99这里只有精品| 久久久xxx| 新67194成人永久网站| 另类图片国产| 久久精品国产综合精品| 欧美日韩天堂| 亚洲电影中文字幕| 狠狠久久综合婷婷不卡| 欧美国产在线电影| 亚洲在线免费| 欧美韩国在线| 老司机成人在线视频| 国产精品毛片在线看| 最新国产精品拍自在线播放| 国产自产高清不卡| 亚洲视频一区在线观看| 日韩一二三在线视频播| 久久综合999| 久久综合网色—综合色88| 国产精品任我爽爆在线播放| 日韩午夜中文字幕| 亚洲另类视频| 欧美成人午夜77777| 免费观看日韩| 在线观看的日韩av| 久久久免费av| 久久综合一区二区| 在线播放视频一区| 久久精品一二三| 久久一区激情| 在线观看欧美日韩国产| 久久精品系列| 欧美国产另类| 亚洲欧美精品在线| 亚洲一区二区视频在线| 欧美日韩免费视频| 日韩午夜激情| 午夜欧美精品| 国产日韩在线亚洲字幕中文| 欧美一区二区三区电影在线观看| 欧美一区二区视频在线| 小黄鸭精品aⅴ导航网站入口| 国内外成人在线| 欧美在线|欧美| 美女爽到呻吟久久久久| 在线不卡免费欧美| 欧美大片一区二区三区| 亚洲国产欧美精品| 99视频在线观看一区三区| 欧美精品国产精品| 99re视频这里只有精品| 午夜精品一区二区三区电影天堂 | 99综合精品| 欧美香蕉视频| 久久综合久久综合久久| 激情欧美一区| 亚洲尤物在线| 美腿丝袜亚洲色图| 亚洲美女毛片| 国产欧美日韩亚洲一区二区三区| 欧美在线视屏| 亚洲三级影片| 久久精品国产第一区二区三区| 狠狠狠色丁香婷婷综合激情| 欧美激情久久久| 亚洲综合国产激情另类一区| 麻豆久久精品| 亚洲一区二区在线免费观看视频| 国产麻豆精品theporn| 免费成人毛片| 亚洲欧美激情四射在线日| 欧美成人精品不卡视频在线观看 | 亚洲精品系列| 亚洲欧美国产视频| 在线精品国精品国产尤物884a| 欧美日韩精品二区| 久久久久国内| 亚洲一区二区三区高清| 亚洲第一福利在线观看| 午夜国产欧美理论在线播放| 亚洲电影天堂av| 国产农村妇女精品一二区| 欧美激情无毛| 久久激情久久| 亚洲先锋成人| 亚洲精品一区二区三区在线观看| 久久久久一区二区| 亚洲一区免费观看| 亚洲美女av黄| 亚洲高清免费| 国产欧美一二三区| 国产精品国产三级国产普通话三级 | 亚洲国产另类精品专区| 久久一二三四| 久久成人18免费观看| 亚洲深夜福利网站| 亚洲乱码精品一二三四区日韩在线 | 一区二区欧美国产| 亚洲国产精品热久久| 国内久久婷婷综合| 国产亚洲欧洲一区高清在线观看 | 国产伦精品一区二区三区视频黑人 | 亚洲国产精品ⅴa在线观看| 麻豆成人综合网| 久久蜜桃香蕉精品一区二区三区| 香蕉视频成人在线观看| 午夜精品福利视频| 亚洲欧美日韩精品久久亚洲区| 中日韩男男gay无套| 99亚洲精品| 一区二区三区精密机械公司 | 国产午夜亚洲精品羞羞网站| 国产精品美女一区二区| 国产精品日韩在线播放| 国产精品第三页| 国产精品毛片在线| 国产精品一区二区a| 国产日韩亚洲欧美| 国产主播精品在线| **网站欧美大片在线观看| 伊人春色精品| 亚洲精品日韩激情在线电影| 亚洲人成在线观看网站高清| 亚洲精品字幕| 亚洲欧美日本在线| 久久精品观看| 麻豆国产va免费精品高清在线| 欧美成年人视频网站| 亚洲高清在线播放| 99视频国产精品免费观看| 亚洲午夜视频在线| 久久疯狂做爰流白浆xx| 国产精品久久91| 免费观看国产成人| 欧美日韩视频不卡| 国产精品一区久久| 激情婷婷亚洲| 日韩一二三在线视频播| 欧美一区二区三区婷婷月色 | 蜜臀av一级做a爰片久久| 亚洲福利视频三区| 亚洲午夜一区二区| 久久夜色精品国产| 欧美午夜精品伦理| 韩国欧美国产1区| 亚洲国产成人91精品| 老牛国产精品一区的观看方式| 久久午夜国产精品| 欧美精品一区视频| 国产美女一区| 亚洲国产一区二区视频| 亚洲综合欧美| 欧美高清在线一区二区| 中日韩美女免费视频网址在线观看| 欧美一区综合| 欧美午夜宅男影院| 亚洲国产清纯| 久久成人精品视频| 99v久久综合狠狠综合久久| 欧美一区深夜视频| 欧美大片第1页| 国产在线一区二区三区四区| 一区二区欧美日韩| 欧美成人网在线| 午夜精品在线观看| 欧美三级精品| 亚洲蜜桃精久久久久久久| 久色婷婷小香蕉久久| 亚洲欧美韩国|