青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

隨筆-341  評論-2670  文章-0  trackbacks-0

文章中引用的代碼均來自https://github.com/vczh/tinymoe

?

實現(xiàn)Tinymoe的第一步自然是一個詞法分析器。詞法分析其所作的事情很簡單,就是把一份代碼分割成若干個token,記錄下他們所在文件的位置,以及丟掉不必要的信息。但是Tinymoe是一個按行分割的語言,自然token列表也就是二維的,第一維是行,第二維是每一行的token。在繼續(xù)講詞法分析器之前,先看看Tinymoe包含多少token:

  • 符號:(、)、,、:、&、+、-、*、/、\、%、<、>、<=、>=、=、<>
  • 關鍵字:module、using、phrase、sentence、block、symbol、type、cps、category、expression、argument、assignable、list、end、and、or、not
  • 數(shù)字:123、456.789
  • 字符串:"abc\r\ndef"
  • 標識符:tinymoe
  • 注釋:-- this is a comment

?

Tinymoe對于token有一個特殊的規(guī)定,就是字符串和注釋都是單行的。因此如果一個字符串在沒有結束之前就遇到了換行,那么這種寫法定義為你遇到了一個沒有右雙引號的字符串,需要報個錯,然后下一行就不是這個字符串的內容了。

?

一個詞法分析器所需要做的事情,就是把一個字符串分解成描述此法的數(shù)據(jù)結構。既然上面已經(jīng)說到Tinymoe的token列表是二維的,因此數(shù)據(jù)結構肯定會體現(xiàn)這個觀點。Tinymoe的詞法分析器代碼可以在這里找到:https://github.com/vczh/tinymoe/blob/master/Development/Source/Compiler/TinymoeLexicalAnalyzer.h

?

首先是token:

CodeTokenType是一個枚舉類型,標記一個token的類型。這個類型比較細化,每一個關鍵字有自己的類型,每一個符號也有自己的類型,剩下的按種類來分。我們可以看到token需要記錄的最關鍵的東西只有三個:類型、內容和代碼位置。在token記錄代碼位置是十分重要的,正確地記錄代碼位置可以讓你能夠報告帶位置的錯誤、從語法樹的節(jié)點還原成代碼位置、甚至在調試的時候可以把指令也換成位置。

?

這里需要提到的是,string_t是一個typedef,具體的聲明可以在這里看到:https://github.com/vczh/tinymoe/blob/master/Development/Source/TinymoeSTL.h。Tinymoe是完全由標準的C++11和STL寫成的,但是為了適應不同情況的需要,Tinymoe分為依賴code page的版本和Unicode版本。如果編譯Tinymoe代碼的時候聲明了全局的宏UNICODE_TINYMOE的話,那Tinymoe所有的字符處理將使用wchar_t,否則使用char。char的類型和Tinymoe編譯器在運行的時候操作系統(tǒng)當前的code page是綁定的。所以這里會有類似string_t啊、ifstream_t啊、char_t等類型,會在不同的編譯選項的影響下指向不同的STL類型或者原生的C++類型。github上的VC++2013工程使用的是wchar_t的版本,所以string_t就是std::wstring。

?

Tinymoe的詞法分析器除了token的類型以外,肯定還需要定義整個文件結構在詞法分析后的結果:

這個數(shù)據(jù)結構體現(xiàn)了"Tinymoe的token列表是二維的"的這個觀點。一個文件會被詞法分析器處理成一個shared_ptr<CodeFIle>對象,CodeFile::lines記錄了所有非空的行,CodeLine::tokens記錄了該行的所有token。

?

現(xiàn)在讓我們來看詞法分析的具體過程。關于如何從正則表達式構造詞法分析器可以在這里(http://www.shnenglu.com/vczh/archive/2008/05/22/50763.html)看到,不過我們今天要講一講如何人肉構造詞法分析器。方法其實是一樣的,首先人肉構造狀態(tài)機,然后把用狀態(tài)機分析輸入的字符串的代碼抄過來就可以了。但是很少有人會解耦得那么開,因為這樣寫很容易看不懂,其次有可能會遇到一些極端情況是你無法用純粹的正則表達式來分詞的,譬如說C++的raw string literal:R"tinymoe(這里的字符串沒有轉義)tinymoe"。一個用【R"<一些字符>(】開始的字符串只能由【)<同樣的字符>"】來結束,要順利分析這種情況,只能通過在狀態(tài)機里面做hack才能解決。這就是為什么我們人肉構造詞法分析器的時候,會把狀態(tài)和動作都混在一起寫,因為這樣便于處理特殊情況。

?

不過幸好的是,Tinymoe并沒有這種情況發(fā)生。所以我們可以直接從狀態(tài)機入手。為了簡單起見,我在下面的狀態(tài)機中去掉所有不是+和-的符號。首先,我們需要一個起始狀態(tài)和一個結束狀態(tài):

?

首先我們添加整數(shù)和標識符進去:

?

其次是加減和浮點:

?

最后把字符串和注釋補全:

?

這樣狀態(tài)機就已經(jīng)完成了。讀過編譯原理的可能會問,為什么終結狀態(tài)都是由虛線而不是帶有輸入的實現(xiàn)指向的?因為虛線在這里有特殊的意義,也就是說它不能移動輸入的字符串的指針,而且他還要負責添加一個token。當狀態(tài)跳到End之后,那他就會變成Start,所以實際上Start和End是同一個狀態(tài)。這個狀態(tài)機也不是輸入什么字符都能跳轉到下一個狀態(tài)的。所以當你發(fā)現(xiàn)輸入的字符讓你無路可走的時候,你就是遇到了一個詞法錯誤

?

這樣我們的設計就算完成了,接下來就是如何用C++來實現(xiàn)它了。為了讓代碼更容易閱讀,我們應該給Start和1-9這么多狀態(tài)起名字,做法如下:

在這里類似狀態(tài)3這樣的狀態(tài)被我省略掉了,因為這個狀態(tài)唯一的出路就是虛線,所以跳到這個狀態(tài)意味著你要立刻執(zhí)行虛線,也就是說你不需要做"跳到這個狀態(tài)"這個動作。因此它不需要有一個名字。

?

然后你只要按照下面的做法翻譯這個狀態(tài)機就可以了:

?

只要寫到這里,那么我們就初步完成了詞法分析器了。其實任何系統(tǒng)的主要功能都是相對容易實現(xiàn)的,往往是次要的功能才需要花費大量的精力來完成,而且還很容易出錯。在這里"次要的功能"就是——記錄token的行列號,還有維護CodeFile::lines避免空行的出現(xiàn)!

?

盡管我已經(jīng)做過了那么多次詞法分析器,但是我仍然無法一氣呵成寫對,仍然會出一些bug。面對編譯器這種純計算程序,debug的最好方法就是寫單元測試。不過對于不熟悉單元測試的人來講可能很難一下子想到要做什么測試,在這里我可以把我給Tinymoe謝的一部分單元測試在這里貼一下。

?

第一個,當然是傳說中的"Hello, world!"測試了:

?

TEST_CASE和TEST_ASSERT(這里暫時沒有直接用到TEST_ASSERT)是我為了開發(fā)Tinymoe隨手擼的一個宏,可以在Tinymoe的代碼里看到。為了檢查我們有沒有粗心大意,我們有必要檢查詞法分析器的任何一個輸出的數(shù)據(jù),譬如每一行有多少token,譬如每一個token的行號列好內容和類型。我為了讓這些枯燥的測試用例容易看懂,在這個文件(

?

第二個測試用例針對的是整數(shù)和浮點的輸出和報錯上,重點在于檢查每一個token的列號是不是正確的計算了出來:

?

第三個測試用例的重點主要是-符號和—注釋的分析:

?

第四個測試用例則是測試字符串的escaping和在面對換行的時候是否正確的處理(之前提到字符串不能換行,遇到一個突然的換行將會被看成缺少雙引號):

?

鑒于詞法分析本來內容也不多,所以這篇文章也不會太長。相信有前途的程序員也會在這里得到一些編譯原理以外的知識。下一篇文章將會描述Tinymoe的函數(shù)頭的語法分析部分,將會描述一個編譯器的不帶歧義的語法分析是如何人肉出來的。敬請期待。


評論:
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析 2014-03-04 19:03 | 釀泉


另外狀態(tài)機的圖片是怎么做出來的?  回復  更多評論
  
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析 2014-03-05 05:55 | yoast
簡單的內容,請讀者參考你的老文章就可以了。重點是后面的CPS啥的,太讓人期待了。希望能解釋的讓菜鳥都明白。加油!  回復  更多評論
  
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析 2014-03-05 06:24 | silverbullettt
除了寫在循環(huán)里之外,一般你什么情況下用auto?  回復  更多評論
  
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析 2014-03-09 19:24 | 陳梓瀚(vczh)
@silverbullettt
定義變量的時候  回復  更多評論
  
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析 2014-03-09 19:25 | 陳梓瀚(vczh)
@釀泉
word寫的,直接發(fā)cppblog變成了圖片  回復  更多評論
  
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析[未登錄] 2014-03-19 06:59 | 白開水
你的符號定義中,貌似只有 與(&),沒有 或(|)  回復  更多評論
  
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析 2014-03-21 20:25 | ftt
博主用的什么編譯器呀,看起來很美  回復  更多評論
  
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析[未登錄] 2014-03-23 04:50 | 白開水
@白開水

是我搞錯了,原來這里 & 是連接的意思
  回復  更多評論
  
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析 2014-03-23 05:45 | 陳梓瀚(vczh)
@ftt
Visual Studio  回復  更多評論
  
# re: 跟vczh看實例學編譯原理——二:實現(xiàn)Tinymoe的詞法分析[未登錄] 2015-01-22 19:33 | yzy
想請教個問題。當年我們學校的老師說編譯器程序一定要用到Graph數(shù)據(jù)結構(而不是條件分支語句)。否則就沒有真正意義上使用狀態(tài)機來實現(xiàn)編譯器。這問題困擾了我很久。因為我搜索了很多編譯器程序實際上都沒有用到圖。

博主對這個問題怎么看?  回復  更多評論
  
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            亚洲黄一区二区三区| 欧美岛国激情| 亚洲视频观看| 国产精品一区二区三区观看| 午夜精品久久久久久久99黑人| 在线亚洲观看| 韩国欧美一区| 亚洲黄色三级| 国产精品一区二区三区观看| 久久视频这里只有精品| 欧美成人免费网| 性欧美videos另类喷潮| 久久久噜噜噜久噜久久 | 欧美国产亚洲视频| 在线天堂一区av电影| 亚洲特级毛片| 亚洲国产精品成人一区二区| 99精品福利视频| 国产一区自拍视频| 亚洲国产影院| 国语自产精品视频在线看| 亚洲大片免费看| 国产精品丝袜久久久久久app| 久久米奇亚洲| 国产精品大片wwwwww| 久久综合国产精品台湾中文娱乐网| 亚洲无限乱码一二三四麻| 亚洲经典自拍| 国产日韩在线不卡| 99av国产精品欲麻豆| 国产一区视频网站| 一区二区三区偷拍| 亚洲美女免费视频| 欧美综合第一页| 亚洲女ⅴideoshd黑人| 免费在线一区二区| 久久久精品tv| 国产精品日韩在线| 亚洲人妖在线| 亚洲国产网站| 久久亚洲私人国产精品va| 欧美一区二区女人| 国产精品国产三级国产aⅴ浪潮 | 欧美一区二区在线看| 欧美激情一区| 欧美国产日韩精品| 黄色成人在线免费| 午夜免费久久久久| 亚洲欧美日韩国产成人| 欧美日韩国产区一| 最新热久久免费视频| 亚洲国产另类久久久精品极度| 新狼窝色av性久久久久久| 午夜伦欧美伦电影理论片| 欧美日韩国产小视频在线观看| 欧美二区在线看| 亚洲国产精品va在线看黑人| 久久国产精品网站| 蜜桃av噜噜一区| 揄拍成人国产精品视频| 久久疯狂做爰流白浆xx| 久久精品盗摄| 国产亚洲精品久久久久久| 香蕉av777xxx色综合一区| 亚洲欧美中日韩| 国产欧美日韩专区发布| 亚洲伊人伊色伊影伊综合网| 亚洲自拍偷拍一区| 国产美女精品人人做人人爽| 亚洲一区二区三区高清 | 一本久久青青| 国产精品美腿一区在线看| 亚洲午夜av电影| 久久精品在线视频| 激情视频一区二区三区| 久久亚洲私人国产精品va| 亚洲国产成人在线播放| 亚洲精品日韩综合观看成人91| 欧美国产一区二区| 亚洲最新在线视频| 久久精品成人一区二区三区 | 欧美视频免费看| 亚洲欧美日韩在线高清直播| 久久综合九色九九| 亚洲精品一区二区三区福利| 欧美日韩国产在线播放| 亚洲影院污污.| 久热精品视频在线观看一区| 亚洲激情视频网站| 小黄鸭精品aⅴ导航网站入口| 国产一区二区三区免费观看| 久久精品欧美日韩精品| 亚洲黄一区二区三区| 欧美夜福利tv在线| 最近中文字幕日韩精品 | 欧美激情一区二区| 欧美一区成人| 亚洲精品综合精品自拍| 久久精品夜夜夜夜久久| 日韩视频在线免费观看| 国产区精品视频| 欧美黄色一区| 久久精品国产亚洲一区二区三区| 亚洲国产精品成人久久综合一区| 亚洲欧美在线磁力| 最新国产成人在线观看| 国产精品午夜电影| 欧美激情亚洲自拍| 久久久久久亚洲精品杨幂换脸 | 欧美成人精品在线视频| 亚洲免费在线视频| 亚洲国产精品ⅴa在线观看| 欧美一区成人| 亚洲作爱视频| 亚洲国产一区二区三区高清| 国产欧美一区视频| 欧美人与性禽动交情品 | 欧美国产大片| 久久精品视频网| 亚洲女性裸体视频| 亚洲香蕉视频| 一本色道久久综合| 亚洲精品1区2区| 欧美成年网站| 麻豆精品视频在线| 久久精品国产2020观看福利| 亚洲图片你懂的| 夜夜嗨av色一区二区不卡| 91久久精品一区| 亚洲国产va精品久久久不卡综合| 国产午夜精品久久| 国产亚洲一级高清| 国产一区二区精品久久99| 国产精品爽爽爽| 国产精品视频观看| 国产精品一区视频| 国产精品美女午夜av| 国产精品美女久久久浪潮软件 | 在线日韩成人| 亚洲大片免费看| 亚洲国产精品久久久久婷婷老年 | 亚洲免费高清视频| 日韩视频在线一区二区三区| 亚洲精品一区二区三区樱花| 亚洲破处大片| 日韩午夜精品| 亚洲一区在线直播| 欧美一区综合| 久久久综合精品| 免费亚洲电影在线观看| 欧美肥婆在线| 亚洲国产激情| 亚洲伦理精品| 亚洲一区不卡| 欧美自拍偷拍| 蜜乳av另类精品一区二区| 欧美高清不卡在线| 欧美午夜片欧美片在线观看| 国产精品久久久久久久久久免费 | 国产精品你懂的在线| 国产日韩欧美中文| 亚洲第一区在线| 亚洲午夜精品视频| 午夜精品久久久久久99热| 久久精品99国产精品酒店日本| 看片网站欧美日韩| 亚洲精品乱码久久久久久按摩观| 国产精品99久久久久久白浆小说| 销魂美女一区二区三区视频在线| 久久伊人一区二区| 欧美极品aⅴ影院| 国产麻豆日韩欧美久久| 亚洲盗摄视频| 午夜性色一区二区三区免费视频| 久久久人成影片一区二区三区| 欧美大片免费看| 亚洲一区二区三区中文字幕在线| 久久欧美肥婆一二区| 欧美日韩在线一区二区三区| 狠狠色狠狠色综合日日91app| 亚洲精品一区中文| 久久久五月天| 宅男噜噜噜66国产日韩在线观看| 久久久免费av| 国产美女搞久久| 99精品视频免费观看视频| 久久精品二区| 一本色道久久综合狠狠躁篇怎么玩| 久久国产精品久久w女人spa| 欧美午夜无遮挡| 亚洲精品三级| 欧美成人免费全部| 久久gogo国模啪啪人体图| 欧美日韩一区二区三区免费| 伊人影院久久| 久久久精品五月天| 亚洲综合国产激情另类一区| 欧美激情欧美狂野欧美精品| 一区二区在线观看视频| 午夜在线a亚洲v天堂网2018|