• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            cexer

            cexer
            posts - 12, comments - 334, trackbacks - 0, articles - 0
              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

            寫了一個mircro XML解析器,附源代碼

            Posted on 2008-08-22 16:56 cexer 閱讀(4458) 評論(20)  編輯 收藏 引用 所屬分類: utility

            轉帖請注明出處 http://www.shnenglu.com/cexer/archive/2008/08/18/59285.html

            不喜歡看人廢話喜歡直奔主題的是同學可以直接: goto 附件下載


              mirco 的意思是比 tiny 還要 tiny。

              GUI 模板用 XML 做是最合適的。方便嵌入腳本,方便編輯修改,方便嵌入皮膚描述,用 XML 做模板,寫起 GUI 編輯器也要方便得多。

              以前幾個的 GUI 模板解析器用的是 MSXML 來實現的,不過它提供的接口字符串類型全是 BSTR,自己的接口又是 TCHAR*,每一次的調用都會有一次字符串轉換,效率很低。而且一想到代碼里有 QueryInteface,AddRef,Release ,心里就不踏實,擔心吊膽的。

              于是又打算用 TinyXML,看了幾遍代碼,發現它對寬字符集的支持有些古怪。代碼里其它的雜七雜八的東西有點多,代碼風格什么的也不大喜歡。

              于是自己寫了一個簡單的,雖然有錯誤檢測機制,不過沒有提供查詢接口,因為這樣我覺得使接口不整潔。其實要知道 XML 哪里出錯了很簡單,隨便拿個瀏覽器打開就行了,提示得非常詳細。不過以后可能會根據需要添加上。XPATH 支持也是如此。接口函數全部使用 UNICODE。

             

            測試代碼:

               1: // cexer
               2: #include "./include/XML/xmlfile.h"
               3: #include "./include/XML/xmlelement.h"
               4: #include "./include/XML/xmldeclaration.h"
               5: #include "./include/XML/xmlunknown.h"
               6: #include "./include/XML/xmlcomment.h"
               7: #include "./include/XML/xmltext.h"
               8: #include "./include/XML/xmlattribute.h"
               9:  
              10: using namespace cexer;
              11: using namespace cexer::xml;
              12:  
              13:  
              14: // c++ std
              15: #include <iostream>
              16: using namespace std;
              17:  
              18:  
              19: int wmain( int argc,WCHAR** argv )
              20: {
              21:     wcout.imbue( std::locale("chs") );
              22:  
              23:     XmlFile document( L"./XMLs/utf16le_ns.xml" );
              24:     if ( !document.load() )
              25:     {
              26:         wcout<<L"解析失敗"<<endl;
              27:         return 0;
              28:     }
              29:  
              30:     XmlElement* root = document.element();
              31:     if ( !root )
              32:     {
              33:         wcout<<L"沒有找到根結點"<<endl;
              34:         return 0;
              35:     }
              36:  
              37:     wcout<<root->name()<<endl;
              38:  
              39:  
              40:     XmlNode* firstChild = root->firstChild();
              41:     if ( !firstChild )
              42:     {
              43:         wcout<<L"沒有子結點"<<endl;
              44:         return 0;
              45:     }
              46:  
              47:     XmlDeclaration* declar = xml_cast<XmlDeclaration*>( firstChild );
              48:     if ( !declar )
              49:     {
              50:         wcout<<L"第一個子結點不是聲明"<<endl;
              51:     }
              52:     else
              53:     {
              54:         wcout<<L"第一個節點是聲明"<<endl;
              55:         wcout<<L"version = "<<declar->version()<<endl;
              56:         wcout<<L"encoding = "<<declar->encoding()<<endl;
              57:         wcout<<L"standalone = "<<declar->standalone()<<endl;
              58:     }
              59:  
              60:     XmlComment* comment = xml_cast<XmlComment*>( firstChild->next() );
              61:     if ( !comment )
              62:     {
              63:         wcout<<L"第二個子結點不是注釋"<<endl;
              64:     }
              65:     else
              66:     {
              67:         wcout<<L"第二個結點是注釋:"<<comment->value()<<endl;
              68:     }
              69:  
              70:     XmlElement* window = root->element( L"window" );
              71:     if ( !window )
              72:     {
              73:         wcout<<L"沒有找到window元素結點"<<endl;
              74:         return 0;
              75:     }
              76:     wcout<<window->attributeValue( L"text" )<<endl;
              77:  
              78:  
              79:     XmlElement* nextWindow = window->nextElement( L"window" );
              80:     if ( !nextWindow )
              81:     {
              82:         wcout<<L"沒有找到后面的window元素結點"<<endl;
              83:     }
              84:     else
              85:     {
              86:         wcout<<L"后面還有一個window元素結點 ";
              87:         wcout<<nextWindow->attributeValue(_T("name"))<<endl;
              88:     }
              89:  
              90:     XmlElement* panel = window->element( L"panel" );
              91:     if ( panel )
              92:     {
              93:         wcout<<panel->attributeValue( L"caption" )<<endl;
              94:     }
              95:  
              96:     window->setAttribute( L"styleAdd",L"WS_VISIBLE" );
              97:     window->setAttribute( L"styleRemove",L"\";<>=&\"" );
              98:  
              99:     if ( !document.save( L"./XMLs/modified/utf16le_ns.xml" ) )
             100:     {    
             101:         wcout<<L"保存失敗"<<endl;
             102:     }
             103:  
             104:     return 0;
             105: }

             

            編碼支持:

              因為內部使用 MultiBytesToWideChar 和 WideCharToMultiBytes 來實現字符集/編碼的操作,因此對字符集/編碼的支持很靈活,能夠支持以上兩個函數支持的所有編碼,只需簡單的修改即可添加新的支持。預置了幾種編碼支持:

            1. UTF-16LE(UNICODE)
            2. GBK
            3. BIG5
            4. GB2312
            5. UTF-7
            6. UTF-8

              對于沒有編碼聲明并且沒有文件頭簽名文件,都視為 UTF-8 編碼。以上的代碼當中的 XML 文件就是一個沒有簽名,沒有聲明的 UTF-16LE 編碼的 XML 文件。

              TinyXML 內部解析字符串全是以 char*  類型來解析,只支持多字節編碼如 UTF-8,ASCII,不支持 UNICODE 編碼。如對中文的支持就比較古怪,如果 XML 以 UTF-8 格式保存,則設置“值”的時候必須自己把字符串轉換為 UTF-8 再設置,而在取得值以后,則必須自己將它們從 UTF-8 轉換成 UNICODE 或 ASCII,否則就是亂碼。

              主要是 TinyXML 為了跨平臺,所以沒有像 MultiBytesToWideChar  和 WideCharToMultiBytes  這種函數的直接支持。不過如果是為了跨平臺,這兩個函數也可以考慮自己實現。

             

            節點類型轉換:

              因為在內存當中,元素,注釋,文本,聲明等結點都是存儲為一個基類的指針,因此在使用的時候必須要有一個類型轉換的動作。也有一些 XML 解析器比較簡單,其中只有文檔,元素,屬性這三種結點,內存當中存的全部都是元素集合,元素當中再存有屬性集合,用不著類型轉換,不過這種 XML 將 XML 讀入內存再存入磁盤文件當中時,會丟失掉 XML 文件原有的格式。

              TinyXML 在內存當中所有的結點(除屬性)都以基類 TiXmlNode 指針的形式存放 ,從一個 TiXmlNode* 進行類型轉的方法是這樣的:

              首先在基 TiXmlBase 聲明一組虛函數

               1: class TiXmlNode
               2: {
               3:     virtual TiXmlDocument*   ToDocument()    { return 0; }
               4:     virtual TiXmlElement*    ToElement()        { return 0; }
               5:     virtual TiXmlComment*    ToComment()     { return 0; }
               6:     virtual TiXmlUnknown*    ToUnknown()        { return 0; }
               7:     virtual TiXmlText*       ToText()        { return 0; }
               8:     virtual TiXmlDeclaration*    ToDeclaration() { return 0; }
               9: };

             
              然后在子類當中各自重寫向自己類型轉換的那一個虛函數。如在 XmlElement 和 XmlComment 當中:

               1: class XmlElement
               2: {
               3:     virtual TiXmlElement*    ToElement()        { return this; }
               4: };
               5:  
               6: class XmlComment
               7: {
               8:     virtual TiXmlComment*    ToComment()     { return this; }
               9: };


              這樣做很方便,不過如果要寫一個新的 XML 結點類型,就比較麻煩了,必須重新修改基類 TiXmlNode 的代碼,整個 XML 解析器的代碼都得重新編譯一遍。

              我則借用了 COM 的 Queryinterface 的方式。在基類 XmlCastable 當中聲明了一個虛函數 query,任意結點調用這個函數,輸入一個類型,若該結點是這個類型,那么就輸出指針的值并返回 true,否則輸出 NULL 并返回 false。

               1: class XmlCastable
               2: {
               3:     virtual bool query( XmlType destType,void** ppvoid ) = 0;
               4: };
               5:  


              如在 XmlNamedNode  當中:

               1: bool XmlNamedNode::query( XmlType type,void** pptr )
               2: {
               3:     if ( !pptr )
               4:     {
               5:         return false;
               6:     }
               7:  
               8:     *pptr = NULL;
               9:  
              10:     if ( XmlNamedNode::s_type == type )
              11:     {
              12:         *pptr = this;
              13:         return true;
              14:     }
              15:  
              16:     return false;
              17: }


              不過這樣使用起來會相當地麻煩,所以寫了一個輔助函數 xml_cast,可以對 XmlNode* 這樣調用:

               1: XmlNode* node = ...;
               2: XmlElement* element = xml_cast<XmlElement*>( node );
               3: XmlComment* comment = xml_cast<XmlComment*>( node );


            類結構:

               1: // 給函數 xml_cast 提供結點類型的轉換能力
               2: class XmlCastable
               3: {...};
               4:  
               5: // 除了屬性結點(XmlAttribute)外,所有結點類型的基礎
               6: class XmlNode:public XmlCastable
               7: {...};
               8:  
               9: // 含有子結點的結點如:元素(XmlElement),文檔(XmlDocument)
              10: class XmlParentNode:public XmlNode
              11: {...};
              12:  
              13: // 有名字的結點如:元素(XmlElement),屬性(XmlAttribute)
              14: class XmlNamedNode:public XmlCastable
              15: {...};
              16:  
              17: // 有值的結點如:屬性(XmlAttribute),文本(XmlText),注釋(XmlComment),未知(XmlUnknown)
              18: class XmlValueNode:public XmlCastable
              19: {...};
              20:  
              21:  
              22: // XML聲明 <?xml ..... ?>
              23: class XmlDeclaration:public XmlNode
              24: {...};
              25:  
              26:  
              27: // XML注釋結點<!-- ..... -->
              28: class XmlComment:public XmlNode
              29:                  ,public XmlValueNode
              30: {...};
              31:  
              32:  
              33: // XML文本結點 [文本] 及 <![CDATA[...]]>
              34: class XmlText:public XmlNode
              35:               ,public XmlValueNode
              36: {...};
              37:  
              38: // XML文檔結點
              39: class XmlDocument:public XmlParentNode
              40: {...};
              41:  
              42: // XML元素結點
              43: class XmlElement:public XmlParentNode
              44:                  ,public XmlNamedNode
              45: {...};
              46:  
              47: // XML元素屬性
              48: class XmlAttribute:public XmlNamedNode
              49:                    ,public XmlValueNode
              50: {...};
              51:  
              52: // 解析器暫不支持的XML結點如
              53: //    <!DOCTYPE PLAY SYSTEM 'play.dtd'>
              54: //    <!ELEMENT title (#PCDATA)>
              55: //    <!ELEMENT books (title,authors)>
              56: class XmlUnknown:public XmlNode
              57:                  ,public XmlValueNode
              58: {...};
              59:  
              60:  


            附件下載:

              從 cexer 的庫當中把 xml 解析器剝離出來放上來。希望大家也都積極踴躍地共享代碼。(注:還沒有怎么詳細測試,切不可用于重要的項目如國防工程火箭發射工程之類的,崩潰死機核彈爆炸什么的本人概不負責。。。。)

            點擊下載

            Feedback

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 17:55 by 陳梓瀚(vczh)
            http://www.shnenglu.com/vczh/archive/2008/06/28/54871.html

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 18:00 by 陳梓瀚(vczh)
            話說我的庫的接口完全是Utf-16字符串的,然后我有一個Mbcs字符串類,倆能互轉。所以用我的庫的人要么用Utf-16,要么在每一個參數和返回值那里都去轉。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 18:01 by cexer
            @陳梓瀚(vczh)
            真是牛人,不過你的代碼風格我不喜歡哈。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 18:02 by cexer
            @陳梓瀚(vczh)
            話說我的庫的接口完全是Utf-16字符串的,然后我有一個Mbcs字符串類,倆能互轉。所以用我的庫的人要么用Utf-16,要么在每一個參數和返回值那里都去轉。

            一樣的哈。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 18:04 by 陳梓瀚(vczh)
            我的庫一開始的目的是僅給我個人用的。后來發exe和screenshoot發多了,有一些憤青噴我說沒發代碼純屬炫耀,雖然對于這些人他們需要的是一個代碼的鏈接,而不是一份代碼。我就只好那么干了。因此風格是我自己私底下用的那一套,這是歷史原因。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 18:15 by 陳梓瀚(vczh)
            話說dynamic_cast<>在失敗的時候也是返回0,你自己寫一個難道是為了效率?還是怕編譯器被關掉RTTI?還是其他的什么東西。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 19:00 by cexer
            @陳梓瀚(vczh)
            效率問題。dynamic_cast<>的比較的效率和字符串比較差不多,因此。。。不過想換成使用dynamic_cast<>也容易,直接
            #define xml_cast dynamic_cast
            就行了。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 20:33 by 空明流轉
            @陳梓瀚(vczh)
            你那個歷史問題還是解決得好,要不我用你代碼要替換vl真是替換的欲死欲活啊。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 21:13 by cexer
            @空明流轉
            系統懷疑你灌水,亂棒打出!

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-22 21:38 by foxtail
            就是阿,他搞個vl做什么,囧@空明流轉

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-23 00:58 by 陳梓瀚(vczh)
            因為我要強調我是因為那些憤青才開源的

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-23 08:35 by 空明流轉
            你只要這個代碼不賣錢,還是開源的好。
            我拿去貼代碼還是方便許多。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-23 08:38 by 空明流轉
            話說文本解析本來就不那么快,不在乎dynamic_cast那點時間的。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-23 11:43 by cexer
            @空明流轉
            節點的類型轉換都是在解析完成以后的啊。如果是在循環當中用dynamic_cast,效率還是挺低的。

            # re: 寫了一個mircro XML解析器,附源代碼[未登錄]  回復  更多評論   

            2008-08-24 10:28 by Kevin Lynx
            cppblog人才輩出,不敢說話了。
            我是真的來灌水......

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-24 15:24 by 戴爾筆記本
             GUI 模板用 XML 做的確是最合適的。因為方便嵌入腳本,

            # re: 寫了一個mircro XML解析器,附源代碼[未登錄]  回復  更多評論   

            2008-08-25 10:09 by 陳梓瀚(vczh)
            要是想寫腳本的話直接HTML好了。你要是為了界面而往C++里面加個腳本引擎,完全是得不償失。

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2008-08-25 11:28 by cexer
            @陳梓瀚(vczh)
            曾經實現過類似HTML的,加了上腳本引擎,可配置能力和二次開發能力大大增強,用處還是很大的。

            # re: 寫了一個mircro XML解析器,附源代碼[未登錄]  回復  更多評論   

            2008-08-25 14:17 by 陳梓瀚(vczh)
            嗯嗯,基于這一點考慮我做了vczh free script 2.0,而不是做一個script for GUI framework……

            # re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

            2009-01-08 16:36 by 陳昕
            報告個bug,保存成UTF16文件的時候頭部字節錯了,和讀取時的不一樣,并且IE打不開保存的文件.改成和讀取時的一樣就好了.
            91精品国产高清久久久久久io| 久久精品中文字幕一区| 久久久国产精品网站| 日本道色综合久久影院| 久久天天日天天操综合伊人av| 亚洲精品99久久久久中文字幕 | AV狠狠色丁香婷婷综合久久| 狠色狠色狠狠色综合久久| 人妻无码久久精品| 麻豆成人久久精品二区三区免费 | 久久精品人妻中文系列| 久久精品a亚洲国产v高清不卡| 久久久久国色AV免费观看| 久久无码中文字幕东京热| 久久久久综合网久久| 7777精品伊人久久久大香线蕉| 久久99热只有频精品8| 亚洲国产成人久久综合区| 精品久久人妻av中文字幕| 久久久噜噜噜久久中文字幕色伊伊| 国内精品久久久久久久久电影网 | 久久久久综合网久久| 久久久www免费人成精品| 国内精品久久久久国产盗摄| 国产精品久久国产精品99盘| 久久国产亚洲精品| 久久亚洲av无码精品浪潮| 伊人久久综在合线亚洲2019| 国产亚洲精品美女久久久| 亚洲欧美日韩中文久久| 久久亚洲熟女cc98cm| 一本大道久久东京热无码AV | 精品久久一区二区| 久久综合九色综合网站| 亚洲精品乱码久久久久久蜜桃不卡| 久久天天躁狠狠躁夜夜2020| 精品无码人妻久久久久久| 久久av免费天堂小草播放| 久久se精品一区二区影院| 久久伊人中文无码| 亚洲国产高清精品线久久|