久久久久久91香蕉国产,欧美高清视频免费观看,国产一区二区视频在线观看

小寫了個XML解析器

    開始用FLEX做詞法分析，然后在此基礎(chǔ)上稍微做些符號匹配（實在稱不上語法分析），即完成了XML
文件的簡單解析。
    我把XML文件拆分成：<, >, />, </, =, ID, STRING 等token。這樣一整理，用FLEX直接生成詞法
分析程序。每一次getToken就返回這些token。上層的語法匹配就變得比較簡單。例如當(dāng)?shù)玫?/>"token
時，我就可以判斷這是一個節(jié)點的結(jié)束；當(dāng)?shù)玫絀D token時，就可以推測下一個token為"="，再下一個
是個STRING。不過對于部分token，也需要做一兩個token的回溯，例如當(dāng)遇到"<"時，并不一定表示一個
新節(jié)點的開始，它可能是新節(jié)點的開始，同樣也可能是上一個節(jié)點的結(jié)束("</")。
    以我薄弱的編譯原理知識來看，解析XML變得非常容易。除此之外，還需要寫一些上層代碼來保存
XML結(jié)構(gòu)，以方面更上層代碼獲取XML文件的配置信息。因為我打算用純C來寫這個東西，所以數(shù)據(jù)結(jié)構(gòu)方
面只有自己處理。這里我以一種變相的樹結(jié)構(gòu)來保存：每一個節(jié)點有兩個域：first child, sibling。
其實這樣做是一個很明顯的通用做法，因為XML種每一個節(jié)點都可能擁有不定數(shù)量的children節(jié)點，如果
讓parent直接去保存，顯然很笨。例如：
    <Resource>
        <bmp file="1.bmp"/>
        <bmp file="2.bmp"/>
    </Resource>
    可以使用這樣的數(shù)據(jù)結(jié)構(gòu)來存儲：
    struct xmlNode
    {
        ...
        struct xmlNode *child;
        struct xmlNode *sibling;
    };
    對于Resource這個node而言，其child域指向第一個bmp節(jié)點(file屬性為1.bmp那個節(jié)點)；對于第一
個bmp節(jié)點而言，其sibling域則指向了第二個bmp節(jié)點。
    這個簡單的xml解析器是在公司外網(wǎng)機器上寫的，沒有VC，沒有任何IDE。代碼我是用VIM敲的，敲好
后寫makefile，用mingw里的gcc、make來生成程序，用gdb來調(diào)試程序。這算是第一次離開VC寫的一個非
練習(xí)程序(起碼用makefile來組織工程)。- -| makefile寫的比較爛，gdb用得很不熟，不過好歹調(diào)試出來
了。越來越想換個平臺，只可惜工作還是得在windows vc下，很掃興。
    后來發(fā)覺詞法分析也很簡單，用FLEX的時候正則表達式都寫出來了。前段時間一直在看編譯原理，雖然不
用功。但是就這里而言，基本可以直接根據(jù)正則表達式畫出DFA。終于不用接觸那惡心的從NFA轉(zhuǎn)DFA的
過程，因為我至今不會，更不會寫代碼轉(zhuǎn)。- - 總而言之，自己手寫了詞法分析。邊寫邊參考編譯原理
與實踐中附帶的tiny-c編譯器的詞法分析部分，最終發(fā)現(xiàn)我抄了一遍。MD，一點技術(shù)含量都沒有。

附上全部源代碼（對于代碼我還是比較滿意的:D），下載

posted on 2008-12-10 16:22 Kevin Lynx 閱讀(4617) 評論(9) 編輯收藏引用所屬分類: 通用編程、編譯原理

@Kevin Lynx
@肥仔
- -!
我恰好說了，如果parent直接保存children，好占空間的，例如你這個vector，雖然我的處理方式累了點。- -!
===============================================
沒錯，而且使用vector雖然方便了，但是除了增加內(nèi)存消耗以外，還有性能損耗，附加的庫會加劇你的移植問題，雖然說是標準模板庫，但是在底層的工具類實現(xiàn)里，最好還是符合KISS原則夠用就好^^比如TinyXML就提供了支持和不支持使用STL的選項用以折衷
回復(fù) 更多評論

# re: 小寫了個XML解析器 2008-12-13 18:03 dell筆記本

不錯，謝謝，省得我自己寫了回復(fù) 更多評論

# re: 小寫了個XML解析器 2009-01-04 02:06 胖dudu

c 的東西，還加了個vector就不太好了吧，我推薦自己封一個c版本的vector或者list 回復(fù) 更多評論

# re: 小寫了個XML解析器 2009-01-08 09:07 Kevin Lynx

@胖dudu
不用自己做了。BSD（相關(guān)組織）早使用宏寫了一套數(shù)據(jù)結(jié)構(gòu)，鏈表，樹，等等。回復(fù) 更多評論

# re: 小寫了個XML解析器 2009-04-29 11:41 gua

直接使用TinyXML就可以了！回復(fù) 更多評論

# re: 小寫了個XML解析器[未登錄] 2011-08-12 17:07 dophi

@gua
hacker為啥要自己寫工具來用而不是用現(xiàn)成的工具？回復(fù) 更多評論

刷新評論列表

只有注冊用戶登錄后才能發(fā)表評論。
【推薦】100%開源！大型工業(yè)跨平臺軟件C++源碼提供，建模，組態(tài)！

相關(guān)文章: 使用Github Page來寫博客寫了個簡單的網(wǎng)站，codertrace.com 逆向思路：破解飛秋群聊協(xié)議靜態(tài)庫中全局變量的初始化問題強大的bcb 指針和模塊健壯 GDI+中從內(nèi)存讀取圖片/保存圖片到內(nèi)存 DNF游戲聲音資源提取玩了一下alienbrain的EventsScript 小寫了個XML解析器

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

# re: 小寫了個XML解析器 2008-12-10 18:20 肥仔

# re: 小寫了個XML解析器[未登錄] 2008-12-10 19:40 908971

# re: 小寫了個XML解析器 2008-12-11 08:50 Kevin Lynx

# re: 小寫了個XML解析器 2008-12-11 11:06 momor

# re: 小寫了個XML解析器 2008-12-13 18:03 dell筆記本

# re: 小寫了個XML解析器 2009-01-04 02:06 胖dudu

# re: 小寫了個XML解析器 2009-01-08 09:07 Kevin Lynx

# re: 小寫了個XML解析器 2009-04-29 11:41 gua

# re: 小寫了個XML解析器[未登錄] 2011-08-12 17:07 dophi

loop_in_codes

導(dǎo)航

統(tǒng)計

公告

常用鏈接

留言簿(52)

隨筆分類

隨筆檔案

收藏夾

C++

關(guān)注的開源項目

其他關(guān)注

網(wǎng)絡(luò)編程

我的項目

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜

小寫了個XML解析器

評論