開始用FLEX做詞法分析,然后在此基礎上稍微做些符號匹配(實在稱不上語法分析),即完成了XML
文件的簡單解析。
我把XML文件拆分成:<, >, />, </, =, ID, STRING 等token。這樣一整理,用FLEX直接生成詞法
分析程序。每一次getToken就返回這些token。上層的語法匹配就變得比較簡單。例如當得到"/>"token
時,我就可以判斷這是一個節點的結束;當得到ID token時,就可以推測下一個token為"=",再下一個
是個STRING。不過對于部分token,也需要做一兩個token的回溯,例如當遇到"<"時,并不一定表示一個
新節點的開始,它可能是新節點的開始,同樣也可能是上一個節點的結束("</")。
以我薄弱的編譯原理知識來看,解析XML變得非常容易。除此之外,還需要寫一些上層代碼來保存
XML結構,以方面更上層代碼獲取XML文件的配置信息。因為我打算用純C來寫這個東西,所以數據結構方
面只有自己處理。這里我以一種變相的樹結構來保存:每一個節點有兩個域:first child, sibling。
其實這樣做是一個很明顯的通用做法,因為XML種每一個節點都可能擁有不定數量的children節點,如果
讓parent直接去保存,顯然很笨。例如:
<Resource>
<bmp file="1.bmp"/>
<bmp file="2.bmp"/>
</Resource>
可以使用這樣的數據結構來存儲:
struct xmlNode
{
...
struct xmlNode *child;
struct xmlNode *sibling;
};
對于Resource這個node而言,其child域指向第一個bmp節點(file屬性為1.bmp那個節點);對于第一
個bmp節點而言,其sibling域則指向了第二個bmp節點。
這個簡單的xml解析器是在公司外網機器上寫的,沒有VC,沒有任何IDE。代碼我是用VIM敲的,敲好
后寫makefile,用mingw里的gcc、make來生成程序,用gdb來調試程序。這算是第一次離開VC寫的一個非
練習程序(起碼用makefile來組織工程)。- -| makefile寫的比較爛,gdb用得很不熟,不過好歹調試出來
了。越來越想換個平臺,只可惜工作還是得在windows vc下,很掃興。
后來發覺詞法分析也很簡單,用FLEX的時候正則表達式都寫出來了。前段時間一直在看編譯原理,雖然不
用功。但是就這里而言,基本可以直接根據正則表達式畫出DFA。終于不用接觸那惡心的從NFA轉DFA的
過程,因為我至今不會,更不會寫代碼轉。- - 總而言之,自己手寫了詞法分析。邊寫邊參考編譯原理
與實踐中附帶的tiny-c編譯器的詞法分析部分,最終發現我抄了一遍。MD,一點技術含量都沒有。
附上全部源代碼(對于代碼我還是比較滿意的:D),下載