青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

cexer

cexer
posts - 12, comments - 334, trackbacks - 0, articles - 0
  C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

寫了一個mircro XML解析器,附源代碼

Posted on 2008-08-22 16:56 cexer 閱讀(4478) 評論(20)  編輯 收藏 引用 所屬分類: utility

轉帖請注明出處 http://www.shnenglu.com/cexer/archive/2008/08/18/59285.html

不喜歡看人廢話喜歡直奔主題的是同學可以直接: goto 附件下載


  mirco 的意思是比 tiny 還要 tiny。

  GUI 模板用 XML 做是最合適的。方便嵌入腳本,方便編輯修改,方便嵌入皮膚描述,用 XML 做模板,寫起 GUI 編輯器也要方便得多。

  以前幾個的 GUI 模板解析器用的是 MSXML 來實現的,不過它提供的接口字符串類型全是 BSTR,自己的接口又是 TCHAR*,每一次的調用都會有一次字符串轉換,效率很低。而且一想到代碼里有 QueryInteface,AddRef,Release ,心里就不踏實,擔心吊膽的。

  于是又打算用 TinyXML,看了幾遍代碼,發現它對寬字符集的支持有些古怪。代碼里其它的雜七雜八的東西有點多,代碼風格什么的也不大喜歡。

  于是自己寫了一個簡單的,雖然有錯誤檢測機制,不過沒有提供查詢接口,因為這樣我覺得使接口不整潔。其實要知道 XML 哪里出錯了很簡單,隨便拿個瀏覽器打開就行了,提示得非常詳細。不過以后可能會根據需要添加上。XPATH 支持也是如此。接口函數全部使用 UNICODE。

 

測試代碼:

   1: // cexer
   2: #include "./include/XML/xmlfile.h"
   3: #include "./include/XML/xmlelement.h"
   4: #include "./include/XML/xmldeclaration.h"
   5: #include "./include/XML/xmlunknown.h"
   6: #include "./include/XML/xmlcomment.h"
   7: #include "./include/XML/xmltext.h"
   8: #include "./include/XML/xmlattribute.h"
   9:  
  10: using namespace cexer;
  11: using namespace cexer::xml;
  12:  
  13:  
  14: // c++ std
  15: #include <iostream>
  16: using namespace std;
  17:  
  18:  
  19: int wmain( int argc,WCHAR** argv )
  20: {
  21:     wcout.imbue( std::locale("chs") );
  22:  
  23:     XmlFile document( L"./XMLs/utf16le_ns.xml" );
  24:     if ( !document.load() )
  25:     {
  26:         wcout<<L"解析失敗"<<endl;
  27:         return 0;
  28:     }
  29:  
  30:     XmlElement* root = document.element();
  31:     if ( !root )
  32:     {
  33:         wcout<<L"沒有找到根結點"<<endl;
  34:         return 0;
  35:     }
  36:  
  37:     wcout<<root->name()<<endl;
  38:  
  39:  
  40:     XmlNode* firstChild = root->firstChild();
  41:     if ( !firstChild )
  42:     {
  43:         wcout<<L"沒有子結點"<<endl;
  44:         return 0;
  45:     }
  46:  
  47:     XmlDeclaration* declar = xml_cast<XmlDeclaration*>( firstChild );
  48:     if ( !declar )
  49:     {
  50:         wcout<<L"第一個子結點不是聲明"<<endl;
  51:     }
  52:     else
  53:     {
  54:         wcout<<L"第一個節點是聲明"<<endl;
  55:         wcout<<L"version = "<<declar->version()<<endl;
  56:         wcout<<L"encoding = "<<declar->encoding()<<endl;
  57:         wcout<<L"standalone = "<<declar->standalone()<<endl;
  58:     }
  59:  
  60:     XmlComment* comment = xml_cast<XmlComment*>( firstChild->next() );
  61:     if ( !comment )
  62:     {
  63:         wcout<<L"第二個子結點不是注釋"<<endl;
  64:     }
  65:     else
  66:     {
  67:         wcout<<L"第二個結點是注釋:"<<comment->value()<<endl;
  68:     }
  69:  
  70:     XmlElement* window = root->element( L"window" );
  71:     if ( !window )
  72:     {
  73:         wcout<<L"沒有找到window元素結點"<<endl;
  74:         return 0;
  75:     }
  76:     wcout<<window->attributeValue( L"text" )<<endl;
  77:  
  78:  
  79:     XmlElement* nextWindow = window->nextElement( L"window" );
  80:     if ( !nextWindow )
  81:     {
  82:         wcout<<L"沒有找到后面的window元素結點"<<endl;
  83:     }
  84:     else
  85:     {
  86:         wcout<<L"后面還有一個window元素結點 ";
  87:         wcout<<nextWindow->attributeValue(_T("name"))<<endl;
  88:     }
  89:  
  90:     XmlElement* panel = window->element( L"panel" );
  91:     if ( panel )
  92:     {
  93:         wcout<<panel->attributeValue( L"caption" )<<endl;
  94:     }
  95:  
  96:     window->setAttribute( L"styleAdd",L"WS_VISIBLE" );
  97:     window->setAttribute( L"styleRemove",L"\";<>=&\"" );
  98:  
  99:     if ( !document.save( L"./XMLs/modified/utf16le_ns.xml" ) )
 100:     {    
 101:         wcout<<L"保存失敗"<<endl;
 102:     }
 103:  
 104:     return 0;
 105: }

 

編碼支持:

  因為內部使用 MultiBytesToWideChar 和 WideCharToMultiBytes 來實現字符集/編碼的操作,因此對字符集/編碼的支持很靈活,能夠支持以上兩個函數支持的所有編碼,只需簡單的修改即可添加新的支持。預置了幾種編碼支持:

  1. UTF-16LE(UNICODE)
  2. GBK
  3. BIG5
  4. GB2312
  5. UTF-7
  6. UTF-8

  對于沒有編碼聲明并且沒有文件頭簽名文件,都視為 UTF-8 編碼。以上的代碼當中的 XML 文件就是一個沒有簽名,沒有聲明的 UTF-16LE 編碼的 XML 文件。

  TinyXML 內部解析字符串全是以 char*  類型來解析,只支持多字節編碼如 UTF-8,ASCII,不支持 UNICODE 編碼。如對中文的支持就比較古怪,如果 XML 以 UTF-8 格式保存,則設置“值”的時候必須自己把字符串轉換為 UTF-8 再設置,而在取得值以后,則必須自己將它們從 UTF-8 轉換成 UNICODE 或 ASCII,否則就是亂碼。

  主要是 TinyXML 為了跨平臺,所以沒有像 MultiBytesToWideChar  和 WideCharToMultiBytes  這種函數的直接支持。不過如果是為了跨平臺,這兩個函數也可以考慮自己實現。

 

節點類型轉換:

  因為在內存當中,元素,注釋,文本,聲明等結點都是存儲為一個基類的指針,因此在使用的時候必須要有一個類型轉換的動作。也有一些 XML 解析器比較簡單,其中只有文檔,元素,屬性這三種結點,內存當中存的全部都是元素集合,元素當中再存有屬性集合,用不著類型轉換,不過這種 XML 將 XML 讀入內存再存入磁盤文件當中時,會丟失掉 XML 文件原有的格式。

  TinyXML 在內存當中所有的結點(除屬性)都以基類 TiXmlNode 指針的形式存放 ,從一個 TiXmlNode* 進行類型轉的方法是這樣的:

  首先在基 TiXmlBase 聲明一組虛函數

   1: class TiXmlNode
   2: {
   3:     virtual TiXmlDocument*   ToDocument()    { return 0; }
   4:     virtual TiXmlElement*    ToElement()        { return 0; }
   5:     virtual TiXmlComment*    ToComment()     { return 0; }
   6:     virtual TiXmlUnknown*    ToUnknown()        { return 0; }
   7:     virtual TiXmlText*       ToText()        { return 0; }
   8:     virtual TiXmlDeclaration*    ToDeclaration() { return 0; }
   9: };

 
  然后在子類當中各自重寫向自己類型轉換的那一個虛函數。如在 XmlElement 和 XmlComment 當中:

   1: class XmlElement
   2: {
   3:     virtual TiXmlElement*    ToElement()        { return this; }
   4: };
   5:  
   6: class XmlComment
   7: {
   8:     virtual TiXmlComment*    ToComment()     { return this; }
   9: };


  這樣做很方便,不過如果要寫一個新的 XML 結點類型,就比較麻煩了,必須重新修改基類 TiXmlNode 的代碼,整個 XML 解析器的代碼都得重新編譯一遍。

  我則借用了 COM 的 Queryinterface 的方式。在基類 XmlCastable 當中聲明了一個虛函數 query,任意結點調用這個函數,輸入一個類型,若該結點是這個類型,那么就輸出指針的值并返回 true,否則輸出 NULL 并返回 false。

   1: class XmlCastable
   2: {
   3:     virtual bool query( XmlType destType,void** ppvoid ) = 0;
   4: };
   5:  


  如在 XmlNamedNode  當中:

   1: bool XmlNamedNode::query( XmlType type,void** pptr )
   2: {
   3:     if ( !pptr )
   4:     {
   5:         return false;
   6:     }
   7:  
   8:     *pptr = NULL;
   9:  
  10:     if ( XmlNamedNode::s_type == type )
  11:     {
  12:         *pptr = this;
  13:         return true;
  14:     }
  15:  
  16:     return false;
  17: }


  不過這樣使用起來會相當地麻煩,所以寫了一個輔助函數 xml_cast,可以對 XmlNode* 這樣調用:

   1: XmlNode* node = ...;
   2: XmlElement* element = xml_cast<XmlElement*>( node );
   3: XmlComment* comment = xml_cast<XmlComment*>( node );


類結構:

   1: // 給函數 xml_cast 提供結點類型的轉換能力
   2: class XmlCastable
   3: {...};
   4:  
   5: // 除了屬性結點(XmlAttribute)外,所有結點類型的基礎
   6: class XmlNode:public XmlCastable
   7: {...};
   8:  
   9: // 含有子結點的結點如:元素(XmlElement),文檔(XmlDocument)
  10: class XmlParentNode:public XmlNode
  11: {...};
  12:  
  13: // 有名字的結點如:元素(XmlElement),屬性(XmlAttribute)
  14: class XmlNamedNode:public XmlCastable
  15: {...};
  16:  
  17: // 有值的結點如:屬性(XmlAttribute),文本(XmlText),注釋(XmlComment),未知(XmlUnknown)
  18: class XmlValueNode:public XmlCastable
  19: {...};
  20:  
  21:  
  22: // XML聲明 <?xml ..... ?>
  23: class XmlDeclaration:public XmlNode
  24: {...};
  25:  
  26:  
  27: // XML注釋結點<!-- ..... -->
  28: class XmlComment:public XmlNode
  29:                  ,public XmlValueNode
  30: {...};
  31:  
  32:  
  33: // XML文本結點 [文本] 及 <![CDATA[...]]>
  34: class XmlText:public XmlNode
  35:               ,public XmlValueNode
  36: {...};
  37:  
  38: // XML文檔結點
  39: class XmlDocument:public XmlParentNode
  40: {...};
  41:  
  42: // XML元素結點
  43: class XmlElement:public XmlParentNode
  44:                  ,public XmlNamedNode
  45: {...};
  46:  
  47: // XML元素屬性
  48: class XmlAttribute:public XmlNamedNode
  49:                    ,public XmlValueNode
  50: {...};
  51:  
  52: // 解析器暫不支持的XML結點如
  53: //    <!DOCTYPE PLAY SYSTEM 'play.dtd'>
  54: //    <!ELEMENT title (#PCDATA)>
  55: //    <!ELEMENT books (title,authors)>
  56: class XmlUnknown:public XmlNode
  57:                  ,public XmlValueNode
  58: {...};
  59:  
  60:  


附件下載:

  從 cexer 的庫當中把 xml 解析器剝離出來放上來。希望大家也都積極踴躍地共享代碼。(注:還沒有怎么詳細測試,切不可用于重要的項目如國防工程火箭發射工程之類的,崩潰死機核彈爆炸什么的本人概不負責。。。。)

點擊下載

Feedback

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 17:55 by 陳梓瀚(vczh)
http://www.shnenglu.com/vczh/archive/2008/06/28/54871.html

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 18:00 by 陳梓瀚(vczh)
話說我的庫的接口完全是Utf-16字符串的,然后我有一個Mbcs字符串類,倆能互轉。所以用我的庫的人要么用Utf-16,要么在每一個參數和返回值那里都去轉。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 18:01 by cexer
@陳梓瀚(vczh)
真是牛人,不過你的代碼風格我不喜歡哈。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 18:02 by cexer
@陳梓瀚(vczh)
話說我的庫的接口完全是Utf-16字符串的,然后我有一個Mbcs字符串類,倆能互轉。所以用我的庫的人要么用Utf-16,要么在每一個參數和返回值那里都去轉。

一樣的哈。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 18:04 by 陳梓瀚(vczh)
我的庫一開始的目的是僅給我個人用的。后來發exe和screenshoot發多了,有一些憤青噴我說沒發代碼純屬炫耀,雖然對于這些人他們需要的是一個代碼的鏈接,而不是一份代碼。我就只好那么干了。因此風格是我自己私底下用的那一套,這是歷史原因。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 18:15 by 陳梓瀚(vczh)
話說dynamic_cast<>在失敗的時候也是返回0,你自己寫一個難道是為了效率?還是怕編譯器被關掉RTTI?還是其他的什么東西。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 19:00 by cexer
@陳梓瀚(vczh)
效率問題。dynamic_cast<>的比較的效率和字符串比較差不多,因此。。。不過想換成使用dynamic_cast<>也容易,直接
#define xml_cast dynamic_cast
就行了。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 20:33 by 空明流轉
@陳梓瀚(vczh)
你那個歷史問題還是解決得好,要不我用你代碼要替換vl真是替換的欲死欲活啊。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 21:13 by cexer
@空明流轉
系統懷疑你灌水,亂棒打出!

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-22 21:38 by foxtail
就是阿,他搞個vl做什么,囧@空明流轉

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-23 00:58 by 陳梓瀚(vczh)
因為我要強調我是因為那些憤青才開源的

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-23 08:35 by 空明流轉
你只要這個代碼不賣錢,還是開源的好。
我拿去貼代碼還是方便許多。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-23 08:38 by 空明流轉
話說文本解析本來就不那么快,不在乎dynamic_cast那點時間的。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-23 11:43 by cexer
@空明流轉
節點的類型轉換都是在解析完成以后的啊。如果是在循環當中用dynamic_cast,效率還是挺低的。

# re: 寫了一個mircro XML解析器,附源代碼[未登錄]  回復  更多評論   

2008-08-24 10:28 by Kevin Lynx
cppblog人才輩出,不敢說話了。
我是真的來灌水......

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-24 15:24 by 戴爾筆記本
 GUI 模板用 XML 做的確是最合適的。因為方便嵌入腳本,

# re: 寫了一個mircro XML解析器,附源代碼[未登錄]  回復  更多評論   

2008-08-25 10:09 by 陳梓瀚(vczh)
要是想寫腳本的話直接HTML好了。你要是為了界面而往C++里面加個腳本引擎,完全是得不償失。

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2008-08-25 11:28 by cexer
@陳梓瀚(vczh)
曾經實現過類似HTML的,加了上腳本引擎,可配置能力和二次開發能力大大增強,用處還是很大的。

# re: 寫了一個mircro XML解析器,附源代碼[未登錄]  回復  更多評論   

2008-08-25 14:17 by 陳梓瀚(vczh)
嗯嗯,基于這一點考慮我做了vczh free script 2.0,而不是做一個script for GUI framework……

# re: 寫了一個mircro XML解析器,附源代碼  回復  更多評論   

2009-01-08 16:36 by 陳昕
報告個bug,保存成UTF16文件的時候頭部字節錯了,和讀取時的不一樣,并且IE打不開保存的文件.改成和讀取時的一樣就好了.
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            久久精品国产99| 久久丁香综合五月国产三级网站| 久久先锋资源| 开心色5月久久精品| 亚洲国产裸拍裸体视频在线观看乱了中文 | 先锋影音一区二区三区| 夜夜精品视频一区二区| 欧美性大战久久久久久久蜜臀| 日韩视频在线观看免费| 在线一区欧美| 国外成人免费视频| 亚洲精品美女在线观看| 欧美新色视频| 噜噜噜久久亚洲精品国产品小说| 欧美14一18处毛片| 亚洲在线观看视频网站| 久久国产手机看片| 亚洲精品美女| 欧美亚洲综合网| 亚洲精品一区在线观看香蕉| 亚洲视频在线播放| 亚洲二区精品| 亚洲午夜电影网| 亚洲高清在线观看一区| 亚洲一区国产视频| 亚洲日本中文字幕| 亚欧成人精品| 99精品视频网| 久久久久久久综合| 亚洲男女毛片无遮挡| 久久只有精品| 久久激情网站| 欧美视频官网| 伊人成人在线视频| 一区二区三区免费在线观看| 亚洲电影在线看| 亚洲一区美女视频在线观看免费| 亚洲国产乱码最新视频| 午夜精品久久久久99热蜜桃导演| 日韩视频一区二区三区| 久久久久久国产精品一区| 亚洲欧美一区二区视频| 欧美大尺度在线| 久久中文精品| 国产偷久久久精品专区| 这里是久久伊人| 一区二区三区国产| 欧美成人国产| 男同欧美伦乱| 精品动漫一区| 久久精品国产一区二区电影 | 久久伊人一区二区| 国产欧美精品xxxx另类| 一区二区三区免费在线观看| 夜夜嗨av色一区二区不卡| 男人插女人欧美| 欧美xart系列高清| 一区二区在线视频| 久久精品论坛| 美女精品国产| 伊人久久成人| 久久在线视频| 欧美激情偷拍| 亚洲久久成人| 欧美欧美全黄| 亚洲作爱视频| 亚洲欧美日韩国产成人精品影院| 欧美三级午夜理伦三级中文幕| 亚洲激情网站| 亚洲天堂黄色| 国产精品视频久久| 亚洲欧美日韩国产综合在线| 欧美一区综合| 伊人久久婷婷色综合98网| 久久se精品一区精品二区| 欧美bbbxxxxx| 99re这里只有精品6| 欧美日韩蜜桃| 亚洲欧美精品在线| 蜜臀av国产精品久久久久| 亚洲第一网站免费视频| 欧美激情一二三区| 亚洲一区二区三区免费观看| 欧美专区在线播放| 亚洲高清不卡在线| 欧美日韩视频在线第一区| 亚洲小说欧美另类婷婷| 久色婷婷小香蕉久久| 亚洲欧洲一区二区天堂久久| 欧美日韩美女| 久久精品色图| 亚洲精品中文字幕有码专区| 亚洲欧美一区二区原创| 亚洲福利视频三区| 国产精品久久国产愉拍| 欧美一级久久久| 亚洲国产欧美久久| 欧美有码在线观看视频| 亚洲国产一区二区精品专区| 国产精品九九| 久久婷婷国产综合精品青草| 亚洲欧美视频一区二区三区| 国内视频精品| 欧美视频日韩视频| 久久久久久久性| 宅男噜噜噜66一区二区| 欧美大片在线观看一区| 午夜精品一区二区三区在线| 亚洲精品国产无天堂网2021| 国产精品一区在线观看| 欧美电影免费观看高清| 欧美在线播放一区二区| 亚洲精品美女免费| 欧美电影免费观看| 性欧美1819性猛交| 夜夜嗨一区二区| 一区二区亚洲| 国产视频亚洲精品| 欧美日韩在线播| 欧美成人四级电影| 久久久九九九九| 午夜国产精品视频| 一本综合久久| 亚洲精品日本| 亚洲第一福利在线观看| 久久精品日产第一区二区三区| 亚洲视频精选| 一区二区三区日韩精品视频| 亚洲国产视频一区| 亚洲国产三级| 亚洲激情一区二区| 亚洲国产一区二区a毛片| 精品69视频一区二区三区| 国产日韩欧美成人| 国产精品一区二区在线观看| 国产精品成人免费精品自在线观看| 欧美激情亚洲精品| 欧美精品一区二区三区在线播放| 老司机久久99久久精品播放免费 | 欧美亚洲一区在线| 午夜精品美女自拍福到在线 | 亚洲自拍三区| 羞羞视频在线观看欧美| 午夜精品久久一牛影视| 欧美一区二区三区免费视| 午夜伦欧美伦电影理论片| 亚洲欧美日韩精品久久久久| 亚洲欧美日韩在线一区| 午夜精品久久久久久久99樱桃 | 欧美片网站免费| 欧美精品久久久久久久久老牛影院| 美女精品在线观看| 欧美国产日韩二区| 欧美日韩成人网| 国产精品高潮久久| 国产精品实拍| 国产资源精品在线观看| 在线精品亚洲| 日韩一级不卡| 欧美一区二区三区在| 久热综合在线亚洲精品| 91久久久精品| 亚洲午夜久久久久久久久电影网| 亚洲欧美在线免费观看| 久久视频这里只有精品| 欧美另类69精品久久久久9999| 欧美视频在线观看免费| 国产三级精品三级| 亚洲激情视频网| 午夜精品久久久久久99热| 久久免费少妇高潮久久精品99| 欧美国产第二页| 亚洲视频图片小说| 久久综合久久久久88| 亚洲午夜精品国产| 久久亚洲精选| 国产精品h在线观看| 狠狠色丁香婷婷综合久久片| 亚洲精品一区二区三区四区高清| 亚洲欧美久久久| 欧美69视频| 亚洲一区观看| 欧美激情综合色| 国产夜色精品一区二区av| 日韩视频一区二区三区在线播放| 久久久99久久精品女同性| 亚洲欧洲三级| 久久精品免费看| 国产精品久久久久久久久久尿 | 久久久久国产精品www| 亚洲免费av观看| 久久婷婷色综合| 国产欧美在线观看一区| 一区二区精品在线| 美女精品一区| 欧美专区18| 国产精品欧美一区二区三区奶水| 亚洲精品午夜精品| 免费欧美在线视频| 欧美在线亚洲|