• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 40, 文章 - 0, 評(píng)論 - 9, 引用 - 0
            數(shù)據(jù)加載中……

            C++解析XML(From:C++ front)

            http://blog.csdn.net/wangqis/archive/2006/05/17/743039.aspx
            http://blog.csdn.net/amidiot/archive/2005/09/11/477335.aspx

            用mingw32-make前修改一下makefile文件,改為如下

            # DEBUG can be set to YES to include debugging info, or NO otherwise(不是DEBUG)
            DEBUG          := NO

            # PROFILE can be set to YES to include profiling info, or NO otherwise
            PROFILE        := NO

            # TINYXML_USE_STL can be used to turn on STL support. NO, then STL
            # will not be used. YES will include the STL files.(使用STL,選擇的話,則可以使用std::string)
            TINYXML_USE_STL := YES


            張弛<zhangchi(at)china.com>

            注:本文的最新版本可以在下面的地址找到
                   http://amidiot.512j.com/article/tinyxml/tinyxml_note.htm

            一、      TinyXml的特點(diǎn)

            TinyXml是一個(gè)基于DOM模型的、非驗(yàn)證的輕量級(jí)C++解釋器。

            1.      SAXDOM

            目前XML的解析主要有兩大模型:SAXDOM

            其中SAX是基于事件的,其基本工作流程是分析XML文檔,當(dāng)發(fā)現(xiàn)了一個(gè)新的元素時(shí),產(chǎn)生一個(gè)對(duì)應(yīng)事件,并調(diào)用相應(yīng)的用戶處理函數(shù)。這種方式占用內(nèi)存少,速度快,但用戶程序相應(yīng)得會(huì)比較復(fù)雜。

            DOM(文檔對(duì)象模型),則是在分析時(shí),一次性的將整個(gè)XML文檔進(jìn)行分析,并在內(nèi)存中形成對(duì)應(yīng)的樹(shù)結(jié)構(gòu),同時(shí),向用戶提供一系列的接口來(lái)訪問(wèn)和編輯該樹(shù)結(jié)構(gòu)。這種方式占用內(nèi)存大,速度往往慢于SAX,但可以給用戶提供一個(gè)面向?qū)ο蟮脑L問(wèn)接口,對(duì)用戶更為友好。

            另?yè)?jù)說(shuō),一些同時(shí)提供了SAXDOM接口的庫(kù),是在底層先實(shí)現(xiàn)SAX,再在SAX的基礎(chǔ)上實(shí)現(xiàn)DOM

            目前我知道的XML解析庫(kù)有下面幾個(gè):

            名稱

            訪問(wèn)接口

            是否支持驗(yàn)證

            備注

            Expat

            SAX/Local

            不清楚

            Local指它還有一套自己訪問(wèn)模型

            LibXML2

            SAX/DOM

             

             

             

            TinyXml

            DOM

             

             

             

            XML4C

            SAX/DOM

            Xerces-C是一家,不過(guò)用了ICU,國(guó)際化似乎更好

            Xerces-C

            SAX/DOM

             

             

             

            XML Booster

            Local

            不清楚

            這個(gè)庫(kù)不是特別了解,好像是類似yacc那樣,可以生成一個(gè)特定的解析器,估計(jì)效率應(yīng)該很高(看名字也像)。

             

             

             

            2.      驗(yàn)證和非驗(yàn)證

            對(duì)于一個(gè)特定的XML文檔而言,其正確性分為兩個(gè)層次。首先是其格式應(yīng)該符合XML的基本格式要求,比如第一行要有聲明,標(biāo)簽的嵌套層次必須前后一致等等,符合這些要求的文件,就是一個(gè)合格的XML文件,稱作well-formatted。但除此之外,一個(gè)XML文檔因其內(nèi)容的不同還必須在語(yǔ)義上符合相應(yīng)的標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)由相應(yīng)的DTD文件或者Schema文件來(lái)定義,符合了這些定義要求的XML文件,稱作valid

            因此,解析器也分為兩種,一種是驗(yàn)證的,即會(huì)跟據(jù)XML文件中的聲明,用相應(yīng)的DTD文件對(duì)XML文件進(jìn)行校驗(yàn),檢查它是否滿足DTD文件的要求。另一種是忽略DTD文件,只要基本格式正確,就可以進(jìn)行解析。

            就我所知,驗(yàn)證的解析器通常都是比較重量級(jí)的。TinyXml不支持驗(yàn)證,但是體積很小,用在解析格式較為簡(jiǎn)單的XML文件,比如配置文件時(shí),特別的合適。

             

            二、      TinyXml的構(gòu)建和使用

            1.      獲取

            TinyXml首頁(yè)在http://www.grinninglizard.com/tinyxml/index.html,從這里可以找到最新版本的源代碼,目前的版本是2.3.4

            2.      構(gòu)建

            TinyXml在構(gòu)建時(shí)可以選擇是否支持STL,選擇的話,則可以使用std::string,所以通常應(yīng)該打開(kāi)這個(gè)選項(xiàng)。

            Windows上,TinyXml的源碼包里提供了VC6的工程文件,直接用它就可以生成兩個(gè)靜態(tài)庫(kù)(帶STL和不帶STL),非常容易。唯一需要注意的是,默認(rèn)生成的庫(kù)是單線程的,如果用在多線程的項(xiàng)目中,需要改動(dòng)一下配置,生成相應(yīng)的多線程庫(kù)。

            Unix平臺(tái)上,TinyXml的源碼包里只提供了一個(gè)Makefile,對(duì)于典型的Linux系統(tǒng),或裝了gccgmake的其他Unix,這個(gè)Makefile足夠用了,我在RH9RHEL4上測(cè)試,簡(jiǎn)單的make就成功了。需要注意的有以下幾點(diǎn):默認(rèn)的編譯是不支持STL的,可以通過(guò)編輯MakefileTINYXML_USE_STL := NO那一行,把NO改成YES就可以支持STL了;還有默認(rèn)只生成了一個(gè)測(cè)試程序,沒(méi)有生成任何庫(kù),如果要生成靜態(tài)庫(kù)的話,可以用ar命令,將生成的幾個(gè)目標(biāo)文件打包就行了,如果要生成動(dòng)態(tài)庫(kù),則需要加上-fpic參數(shù)重新編譯。

            3.      使用

            構(gòu)建了相應(yīng)的庫(kù)之后,在使用了它們的工程中,只要在連接時(shí)把他們連上就行了。需要注意的是,如果需要STL支持,在編譯用到了TinyXml的文件時(shí),需要定義一個(gè)宏TIXML_USE_STL,對(duì)gcc,可以使用參數(shù)-DTIXML_USE_STL,對(duì)cl.exeVC),可以使用參數(shù)/DTIXML_USE_STL,如果嫌麻煩,可以直接定義在 tinyxml.h文件里。

             

             

             

            三、      TinyXml的編程模型

            1.      類之間的關(guān)系

            TinyXml實(shí)現(xiàn)的時(shí)DOM訪問(wèn)模型,因此提供了一系列的類對(duì)應(yīng)XML文件中的各個(gè)節(jié)點(diǎn)。主要類間的關(guān)系如下圖所示:

            類結(jié)構(gòu)圖

            TiXmlBase:其他類的基類,是個(gè)抽象類

            TiXmlNode:表示一個(gè)節(jié)點(diǎn),包含節(jié)點(diǎn)的一般方法,如訪問(wèn)自節(jié)點(diǎn)、兄弟節(jié)點(diǎn)、編輯自身、編輯子節(jié)電

            TiXmlDocument:表示整個(gè)XML文檔,不對(duì)應(yīng)其中某個(gè)特定的節(jié)點(diǎn)。

            TiXmlElement:表示元素節(jié)點(diǎn),可以包含子節(jié)點(diǎn)和TiXmlAttribute

            TiXmlComment:表示注釋

            TiXmlDeclaration:表示聲明

            TiXmlText:表示文本節(jié)點(diǎn)

            TiXmlUnknown:表示未知節(jié)點(diǎn),通常是出錯(cuò)了

            TiXmlAttribute:表示一個(gè)元素的屬性

            下面是一個(gè)簡(jiǎn)單的例子:

            <?xml version="1.0" encoding="utf-8" ?>
                    <!-This is only a sample-->

                <book>

                    <name>TinyXml How To</name>

                   <price unit=”RMB”>20</price>

                    <description>Some words…</description>

             </ book >

             
                    整個(gè)文檔,對(duì)應(yīng)TiXmlDocument

            book,name,price, description,都對(duì)應(yīng)TiXmlElement

            第一行對(duì)應(yīng)一個(gè)TiXmlDeclaration

            第二行對(duì)應(yīng)一個(gè)TiXmlComment

            “TinyXml How To”對(duì)應(yīng)一個(gè)TiXmlText

            unit則是price的一個(gè)TiXmlAttribute

            這些類與XML文件中的相應(yīng)元素都有很好的對(duì)應(yīng)關(guān)系,因此相信參照TinyXml的文檔,可以很容易的掌握各個(gè)方法的使用。

             

            2.      需要注意的問(wèn)題

            各類之間的轉(zhuǎn)換

            由于各個(gè)節(jié)點(diǎn)類都從TiXmlNode繼承,在使用時(shí)常常需要將TiXmlNode*類型的指針轉(zhuǎn)換為其派生類的指針,在進(jìn)行這種轉(zhuǎn)換時(shí),應(yīng)該首先使用由TiXmlNode類提供的一系列轉(zhuǎn)換函數(shù),如ToElement(void),而不是c++dynamic_cast

             檢查返回值

             由于TinyXml是一個(gè)非校驗(yàn)的解析器,因此當(dāng)解析一個(gè)文件時(shí),很可能文件并不包含我們預(yù)期的某個(gè)節(jié)點(diǎn),在這種情況下,TinyXml將返回空指針。因此,必須要對(duì)返回值進(jìn)行檢查,否則將很容易出現(xiàn)內(nèi)存訪問(wèn)的錯(cuò)誤。

             如何重頭建立一個(gè)XML文件

             先建立一個(gè)TiXmlDocument對(duì)象,然后,載入某個(gè)模板,或者直接插入一個(gè)節(jié)點(diǎn)作為根節(jié)點(diǎn),接著就可以像打開(kāi)一個(gè)已有的XML文件那樣對(duì)它進(jìn)行操作了。

             

            四、      總結(jié)

            TinyXml最大的特點(diǎn)就是它很小,可以很方便的靜態(tài)連接到程序里。對(duì)于像配置文件、簡(jiǎn)單的數(shù)據(jù)文件這類文件的解析,它很適合。但是由于它是非驗(yàn)證的,因此需要在程序里做許多檢查工做,加重了程序編寫(xiě)的負(fù)擔(dān)。因此對(duì)于復(fù)雜的XML文件,我覺(jué)得最好還是用驗(yàn)證的解析器來(lái)處理。


            posted on 2008-09-12 14:12 閱讀(803) 評(píng)論(0)  編輯 收藏 引用 所屬分類: xml編譯器

            一本久久a久久精品亚洲| 久久棈精品久久久久久噜噜| AAA级久久久精品无码区| 日本精品久久久久久久久免费| 国产69精品久久久久观看软件| 99久久人妻无码精品系列| 国产成人综合久久综合| 久久人人爽人人爽人人片AV麻豆| 欧洲人妻丰满av无码久久不卡| 久久久久久久亚洲精品| 久久丫精品国产亚洲av| 亚洲七七久久精品中文国产 | 成人久久久观看免费毛片| 久久www免费人成看国产片| 蜜臀久久99精品久久久久久小说| 久久99精品久久久久久齐齐| 久久香综合精品久久伊人| 思思久久好好热精品国产| aaa级精品久久久国产片| 国内精品九九久久精品| 久久AAAA片一区二区| 久久久久久国产精品免费无码 | 无码精品久久久久久人妻中字 | 国产精品福利一区二区久久| 久久久一本精品99久久精品88| 久久播电影网| 狠狠精品久久久无码中文字幕 | 久久精品国产精品亚洲人人| 久久成人影院精品777| 国产亚洲色婷婷久久99精品| 人妻少妇久久中文字幕| 久久夜色精品国产网站| 久久偷看各类wc女厕嘘嘘| 欧美熟妇另类久久久久久不卡| 精品久久久久久中文字幕大豆网| 伊人久久大香线蕉综合5g| 亚洲国产成人久久一区久久| 久久综合九色综合欧美就去吻| 久久精品视屏| 麻豆av久久av盛宴av| 国产精品久久久久久久久久影院 |