欧美欧美全黄,亚洲第一黄网,黄色成人av网

小寫了個XML解析器

    開始用FLEX做詞法分析，然后在此基礎上稍微做些符號匹配（實在稱不上語法分析），即完成了XML
文件的簡單解析。
    我把XML文件拆分成：<, >, />, </, =, ID, STRING 等token。這樣一整理，用FLEX直接生成詞法
分析程序。每一次getToken就返回這些token。上層的語法匹配就變得比較簡單。例如當得到"/>"token
時，我就可以判斷這是一個節點的結束；當得到ID token時，就可以推測下一個token為"="，再下一個
是個STRING。不過對于部分token，也需要做一兩個token的回溯，例如當遇到"<"時，并不一定表示一個
新節點的開始，它可能是新節點的開始，同樣也可能是上一個節點的結束("</")。
    以我薄弱的編譯原理知識來看，解析XML變得非常容易。除此之外，還需要寫一些上層代碼來保存
XML結構，以方面更上層代碼獲取XML文件的配置信息。因為我打算用純C來寫這個東西，所以數據結構方
面只有自己處理。這里我以一種變相的樹結構來保存：每一個節點有兩個域：first child, sibling。
其實這樣做是一個很明顯的通用做法，因為XML種每一個節點都可能擁有不定數量的children節點，如果
讓parent直接去保存，顯然很笨。例如：
    <Resource>
        <bmp file="1.bmp"/>
        <bmp file="2.bmp"/>
    </Resource>
    可以使用這樣的數據結構來存儲：
    struct xmlNode
    {
        ...
        struct xmlNode *child;
        struct xmlNode *sibling;
    };
    對于Resource這個node而言，其child域指向第一個bmp節點(file屬性為1.bmp那個節點)；對于第一
個bmp節點而言，其sibling域則指向了第二個bmp節點。
    這個簡單的xml解析器是在公司外網機器上寫的，沒有VC，沒有任何IDE。代碼我是用VIM敲的，敲好
后寫makefile，用mingw里的gcc、make來生成程序，用gdb來調試程序。這算是第一次離開VC寫的一個非
練習程序(起碼用makefile來組織工程)。- -| makefile寫的比較爛，gdb用得很不熟，不過好歹調試出來
了。越來越想換個平臺，只可惜工作還是得在windows vc下，很掃興。
    后來發覺詞法分析也很簡單，用FLEX的時候正則表達式都寫出來了。前段時間一直在看編譯原理，雖然不
用功。但是就這里而言，基本可以直接根據正則表達式畫出DFA。終于不用接觸那惡心的從NFA轉DFA的
過程，因為我至今不會，更不會寫代碼轉。- - 總而言之，自己手寫了詞法分析。邊寫邊參考編譯原理
與實踐中附帶的tiny-c編譯器的詞法分析部分，最終發現我抄了一遍。MD，一點技術含量都沒有。

附上全部源代碼（對于代碼我還是比較滿意的:D），下載

posted on 2008-12-10 16:22 Kevin Lynx 閱讀(4617) 評論(9) 編輯收藏引用所屬分類: 通用編程、編譯原理

@Kevin Lynx
@肥仔
- -!
我恰好說了，如果parent直接保存children，好占空間的，例如你這個vector，雖然我的處理方式累了點。- -!
===============================================
沒錯，而且使用vector雖然方便了，但是除了增加內存消耗以外，還有性能損耗，附加的庫會加劇你的移植問題，雖然說是標準模板庫，但是在底層的工具類實現里，最好還是符合KISS原則夠用就好^^比如TinyXML就提供了支持和不支持使用STL的選項用以折衷
回復更多評論

# re: 小寫了個XML解析器 2008-12-13 18:03 dell筆記本

不錯，謝謝，省得我自己寫了回復更多評論

# re: 小寫了個XML解析器 2009-01-04 02:06 胖dudu

c 的東西，還加了個vector就不太好了吧，我推薦自己封一個c版本的vector或者list 回復更多評論

# re: 小寫了個XML解析器 2009-01-08 09:07 Kevin Lynx

@胖dudu
不用自己做了。BSD（相關組織）早使用宏寫了一套數據結構，鏈表，樹，等等。回復更多評論

# re: 小寫了個XML解析器 2009-04-29 11:41 gua

直接使用TinyXML就可以了！回復更多評論

# re: 小寫了個XML解析器[未登錄] 2011-08-12 17:07 dophi

@gua
hacker為啥要自己寫工具來用而不是用現成的工具？回復更多評論

刷新評論列表

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: 使用Github Page來寫博客寫了個簡單的網站，codertrace.com 逆向思路：破解飛秋群聊協議靜態庫中全局變量的初始化問題強大的bcb 指針和模塊健壯 GDI+中從內存讀取圖片/保存圖片到內存 DNF游戲聲音資源提取玩了一下alienbrain的EventsScript 小寫了個XML解析器

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

# re: 小寫了個XML解析器 2008-12-10 18:20 肥仔

# re: 小寫了個XML解析器[未登錄] 2008-12-10 19:40 908971

# re: 小寫了個XML解析器 2008-12-11 08:50 Kevin Lynx

# re: 小寫了個XML解析器 2008-12-11 11:06 momor

# re: 小寫了個XML解析器 2008-12-13 18:03 dell筆記本

# re: 小寫了個XML解析器 2009-01-04 02:06 胖dudu

# re: 小寫了個XML解析器 2009-01-08 09:07 Kevin Lynx

# re: 小寫了個XML解析器 2009-04-29 11:41 gua

# re: 小寫了個XML解析器[未登錄] 2011-08-12 17:07 dophi

loop_in_codes

導航

統計

公告

常用鏈接

留言簿(52)

隨筆分類

隨筆檔案

收藏夾

C++

關注的開源項目

其他關注

網絡編程

我的項目

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜

小寫了個XML解析器

評論