• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            夢想的天堂

            常用鏈接

            統計

            最新評論

            2007年6月17日 #

            XML字符串解析介紹

                    前些天在做一個小項目,需要實現從字符串到XML文件的逆向轉換過程。該字符串由XML文件所得。由于使用環境對解析時間和內存使用量有嚴格的要求,因此必須確保解析速度和所占用內存。
                  下面簡單敘述一下我的實現過程。最開始采用的方法是每次從文件字符串里面讀入一個節點的值,具體讀取過程有xml文件各個節點屬性決定。再利用一個stack對xml文件節點進行管理。大致思路是每讀入一個字符串,先判斷其類型,如果是Element或者text, comment, cdata類型則入棧,若為EndElement則出棧,這樣就可以順利建立起各個父子節點之間的關系。
                 采用這樣的方法是思路比較的明確,實現起來比較的簡單,缺點是解析速度太慢了,解析一個2M左右的XML文件要10多分鐘,而且所費時間與文件的大小成幾何級別增長,根本不可能接受。在采用這種方法過程中,也出現了一個小插曲。就是在解析比較大的xml文件時,當解析的xml節點超過1500個時,就會導致內存分配錯誤,堆棧溢出,開始是百思不得其解,后來才知道是由于我在解析字符串過程中,采用了遞歸的方法,因此內存消耗很厲害,特別是我開始傳入一個const字符串時,一個小小的幾百K(以200k為例)的文件就可能導致內存一下子消耗幾百M,因為每次只讀入一個節點字符串,這樣最終大小可以達到200K+19.96k+....+0 ~=200*(200-1)k/2~ = 200M.因此導致編譯器堆棧溢出,解決方法有幾種,一是將堆棧設置大些,另外就是改遞歸為循環。我采用了后者。
                 在進行字符串解析時,我大量采用了STL的字符串find,find_first_of(),substr等

            函數,但是這通常只在搜索小字符串時速度較快,在長達幾M的字符串時,由于大塊的內存操作,程序運行慢如蝸牛。而且我在前面的實現方法中,每次是提取一個節點,然后再進行解析,這樣在讀取和解析過程中,會導致許多重復的步驟,嚴重影響工作效率。 于是我就采用一個了for循環對讀入的一個個字節進行處理,這樣速度得到顯著的提高。但是程序在解析大字符串時還是運行很慢,我開始 意識到是長字符串的問題,因此得想方法分段解析才行。于是決定每次從字符串里面提取一定的字符處理。在解析長達幾M的字符串時,我先后試驗了每次提取64bit,128bit,256bit,512bit, 1k, 2k, 4k等不同長度的字符串,發現在處理大字符串時,4K的效果最好。在解析一個8M左右的xml字符串時,速度可以達到30S,但是內存消耗有點厲害了,達100M。因此也很難滿足要求。
                 最后還是采用了一種比較折中的方法,就是在初次解析時,只解析根節點以及其下一層子節點,在保存過程中再分段解析,主要可以極大的減少內存消耗,8M左右的文件可以降低到20M左右內存。速度也有所提高,最終耗時3s左右。

            posted @ 2007-06-17 23:02 IT民工 閱讀(2617) | 評論 (2)編輯 收藏

            2007年5月3日 #

            Erase method in STL

             In these days, I used STL in a project, and met several problems. One was caused by erase method. As we know, when we delete a element in a container in STL, the iterator itself will be changed, so the the iterator should be set correctly. A right method can be used as following:
               Typedef  list<MyClass*>::Iterator myIter;
               for(myIter it = listObj.begin(); it != listObj.end();)
                if(true)
                        it = listObj.erase(it);
               else
                     ++it;
                  
                  

            posted @ 2007-05-03 17:22 IT民工 閱讀(319) | 評論 (0)編輯 收藏

            XmlLite使用簡單介紹

                   最近因為項目的需要,將一個應用軟件的底層XML處理模塊進行重寫,由MSDOM改用xmlLite來完成。XmlLite是微軟專門針對C++使用者開發的一個輕量級開發包,只具備基本的I/O功能。提供了IXmlReader, IXmlWriter對XML文件進行簡單的讀寫操作。原理很簡單,在讀一個文件時,循環讀取各個節點,然后根據不同的節點類型讀取其相關屬性數據等。XMLLite中的數據類型主要封裝在XmlNodeType中,常使用到的有XmlNodeType_None, XmlNodeType_Element,XmlNodeType_EndElement等。在寫數據時,主要根據不同的節點類型,調用相關的API來完成。值得注意的是,由于XMLLite只提供順序化寫的功能,因此在寫具有多個深度的節點類型時,需要控制好WriteEndElement()函數的出現順序等,所以這些都可以通過函數的遞歸來完成。
                    由于XmlLite只提供簡單的讀寫等功能,因此,在實際應用中,需要對XMLLite提供的功能進行一定的封裝,從而提供自己的API功能。下面簡單說說我們采用的思路。在讀Xml文件時,需要在加載過程建立XML文件的內部數據結構。這可以通過兩種方式來完成,一種是在一個循環或者遞歸過程中,將整個XMLload進來;另外一種方法是一次只加載一層節點,然后遞歸加載其子節點。前面一種方法是在處理大XML文件時,可能會有memory footprint問題。所以最終采用了后面的方法。
                   在實現過程中,我們采用了composite模式來組織XML文件樹結構。通過使用list來建立樹結構。全部操作封裝在一個類中。
                  有關相關原因,xmlLite的具體封裝實現方法就不提及了。開發過程中,遇到的主要難點是數據的讀寫和保存,關鍵是數據結構的處理,其他部分都比較容易。
                 這我開通blog后的第一篇文章,呵呵,也不知道怎么寫好。以后會盡力寫好點^_^.

            posted @ 2007-05-03 15:37 IT民工 閱讀(4481) | 評論 (4)編輯 收藏

            僅列出標題  
            嫩草影院久久国产精品| 国产成人无码久久久精品一| 国产69精品久久久久99尤物| 久久综合九色综合97_久久久| 久久精品国产亚洲7777| 久久久久亚洲AV成人网人人网站| 久久精品免费全国观看国产| 久久久久无码精品国产| 大美女久久久久久j久久| 日韩中文久久| 国内精品久久久久影院免费| 日本高清无卡码一区二区久久| 精品国产青草久久久久福利| 国产2021久久精品| 久久久无码一区二区三区 | 久久精品国产亚洲麻豆| 香蕉aa三级久久毛片 | 日韩精品久久久久久久电影| 久久九九有精品国产23百花影院| 久久精品国产男包| 性做久久久久久免费观看| 狠狠色丁香婷婷久久综合五月| 亚洲人成电影网站久久| 91精品无码久久久久久五月天 | 久久久免费精品re6| 香蕉久久夜色精品国产尤物| 久久亚洲天堂| 久久av高潮av无码av喷吹| 久久综合久久综合久久综合| 国产精品久久久福利| 国产精品久久久久久吹潮| 欧洲精品久久久av无码电影 | 久久久无码精品亚洲日韩蜜臀浪潮| 久久这里只精品99re66| 伊人久久大香线蕉综合网站| 久久亚洲欧洲国产综合| 亚洲欧洲精品成人久久奇米网| 亚洲欧美日韩精品久久亚洲区| 狠狠色丁香久久婷婷综合图片 | 精品久久久中文字幕人妻| 国产69精品久久久久APP下载|