• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            夢想的天堂

            常用鏈接

            統(tǒng)計

            最新評論

            XML字符串解析介紹

                    前些天在做一個小項目,需要實現(xiàn)從字符串到XML文件的逆向轉換過程。該字符串由XML文件所得。由于使用環(huán)境對解析時間和內(nèi)存使用量有嚴格的要求,因此必須確保解析速度和所占用內(nèi)存。
                  下面簡單敘述一下我的實現(xiàn)過程。最開始采用的方法是每次從文件字符串里面讀入一個節(jié)點的值,具體讀取過程有xml文件各個節(jié)點屬性決定。再利用一個stack對xml文件節(jié)點進行管理。大致思路是每讀入一個字符串,先判斷其類型,如果是Element或者text, comment, cdata類型則入棧,若為EndElement則出棧,這樣就可以順利建立起各個父子節(jié)點之間的關系。
                 采用這樣的方法是思路比較的明確,實現(xiàn)起來比較的簡單,缺點是解析速度太慢了,解析一個2M左右的XML文件要10多分鐘,而且所費時間與文件的大小成幾何級別增長,根本不可能接受。在采用這種方法過程中,也出現(xiàn)了一個小插曲。就是在解析比較大的xml文件時,當解析的xml節(jié)點超過1500個時,就會導致內(nèi)存分配錯誤,堆棧溢出,開始是百思不得其解,后來才知道是由于我在解析字符串過程中,采用了遞歸的方法,因此內(nèi)存消耗很厲害,特別是我開始傳入一個const字符串時,一個小小的幾百K(以200k為例)的文件就可能導致內(nèi)存一下子消耗幾百M,因為每次只讀入一個節(jié)點字符串,這樣最終大小可以達到200K+19.96k+....+0 ~=200*(200-1)k/2~ = 200M.因此導致編譯器堆棧溢出,解決方法有幾種,一是將堆棧設置大些,另外就是改遞歸為循環(huán)。我采用了后者。
                 在進行字符串解析時,我大量采用了STL的字符串find,find_first_of(),substr等

            函數(shù),但是這通常只在搜索小字符串時速度較快,在長達幾M的字符串時,由于大塊的內(nèi)存操作,程序運行慢如蝸牛。而且我在前面的實現(xiàn)方法中,每次是提取一個節(jié)點,然后再進行解析,這樣在讀取和解析過程中,會導致許多重復的步驟,嚴重影響工作效率。 于是我就采用一個了for循環(huán)對讀入的一個個字節(jié)進行處理,這樣速度得到顯著的提高。但是程序在解析大字符串時還是運行很慢,我開始 意識到是長字符串的問題,因此得想方法分段解析才行。于是決定每次從字符串里面提取一定的字符處理。在解析長達幾M的字符串時,我先后試驗了每次提取64bit,128bit,256bit,512bit, 1k, 2k, 4k等不同長度的字符串,發(fā)現(xiàn)在處理大字符串時,4K的效果最好。在解析一個8M左右的xml字符串時,速度可以達到30S,但是內(nèi)存消耗有點厲害了,達100M。因此也很難滿足要求。
                 最后還是采用了一種比較折中的方法,就是在初次解析時,只解析根節(jié)點以及其下一層子節(jié)點,在保存過程中再分段解析,主要可以極大的減少內(nèi)存消耗,8M左右的文件可以降低到20M左右內(nèi)存。速度也有所提高,最終耗時3s左右。

            posted on 2007-06-17 23:02 IT民工 閱讀(2618) 評論(2)  編輯 收藏 引用

            評論

            # re: XML字符串解析介紹 2007-08-27 18:17 c++ FANS

            你好,看了你的XML解析,想和你交流交流,可否?
            QQ:4427598
            謝謝!  回復  更多評論   

            # re: XML字符串解析介紹[未登錄] 2014-08-25 14:25 12

            12  回復  更多評論   

            久久亚洲AV成人无码| 亚洲国产精品无码久久| 99久久无码一区人妻| 国产成人精品久久亚洲高清不卡 国产成人精品久久亚洲高清不卡 国产成人精品久久亚洲 | 亚洲国产精品无码久久SM| 人妻少妇久久中文字幕一区二区| 国产精品美女久久久久| 久久久久亚洲AV综合波多野结衣 | 日本精品久久久久中文字幕8| 国产精品99久久精品爆乳| 国产偷久久久精品专区| 国产精品久久久久久搜索| 热久久最新网站获取| 久久久国产精品网站| 久久综合色老色| 成人午夜精品久久久久久久小说| 亚洲女久久久噜噜噜熟女| 99久久国产综合精品五月天喷水| 国产精品久久久久久久人人看| 成人资源影音先锋久久资源网| 亚洲国产成人久久精品99| 精品久久久久久亚洲| 亚洲国产精品无码久久| 久久久久人妻一区二区三区| 久久久久久久综合日本| avtt天堂网久久精品| 99久久精品免费看国产一区二区三区 | 四虎影视久久久免费观看| 国产99久久九九精品无码| 99久久精品日本一区二区免费| 久久久久综合国产欧美一区二区 | 久久99精品久久久久久9蜜桃| 久久99精品国产自在现线小黄鸭 | 亚洲va中文字幕无码久久| 久久精品国产清自在天天线| 久久精品综合网| 久久人人爽人人爽人人av东京热 | 三级韩国一区久久二区综合| 欧美午夜A∨大片久久| 久久99精品久久久久久齐齐| 久久精品国产只有精品66|