• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            Codejie's C++ Space

            Using C++

            LingosHook:結(jié)果抓取失敗的一種原因


                LingosHook在抓取結(jié)果數(shù)據(jù)時,HTML的解析最主要的一個環(huán)節(jié),就是說,如果對HTML字串分析上有任何的錯誤都會導(dǎo)致無法正確提取所需數(shù)據(jù)。
                還好LingosHook的HTML解析代碼是自己的,怎么說呢,“代碼在手,天下我有”,像是對付“破碎”HTML數(shù)據(jù),稍微改改就OK了,嘿嘿。。。
                當然了,也有不好的時候,由于HTML解析代碼是自己寫的,對很多特殊的情況的支持不好,導(dǎo)致解析失敗,比如最早發(fā)現(xiàn)<IMG>標簽沒有</IMG>這個問題找了很久,昨晚有發(fā)現(xiàn)了Lingoes還在用另一個特殊的標簽<PARAM>,這個也沒有</PARAM>;雖然Vicon詞典并沒有用到這個,但由于其它詞典使用到了,而導(dǎo)致整個HTML解析失敗。
                雖然加一個這樣特殊標簽處理很簡單,只是在CheckSepicalTag()函數(shù)里面添加一行就OK,但問題是,誰知道還會有多少個這樣的標簽?zāi)兀课沂遣豢赡芤粋€一個詞典檢測的啊。。。因此,如果使用中碰到類似無法抓取結(jié)果的時候,可以在'Setting'界面中,開啟'Open Trace'選項,然后當數(shù)據(jù)到達時,將'Trace'界面中的HTML數(shù)據(jù)Copy出來,然后貼上來,我來定位原因。。。

            posted on 2010-03-29 23:59 codejie 閱讀(239) 評論(0)  編輯 收藏 引用 所屬分類: 隨筆而已

            公告

            Using C++

            導(dǎo)航

            統(tǒng)計

            留言簿(73)

            隨筆分類(513)

            積分與排名

            最新評論

            閱讀排行榜

            評論排行榜

            国产精品九九久久免费视频 | 久久久国产精品网站| 伊人久久综合成人网| 精品人妻久久久久久888| 日本免费一区二区久久人人澡| 国产成人久久久精品二区三区 | 国产69精品久久久久APP下载| 久久久精品国产| 久久精品国产99国产精品澳门| 久久精品夜色噜噜亚洲A∨| 2019久久久高清456| 久久国产乱子精品免费女| 久久久久久久久波多野高潮| 91精品无码久久久久久五月天| 久久久久久精品免费看SSS| 久久国产精品久久| 中文成人无码精品久久久不卡| 国内精品久久久久影院优| 亚洲国产成人精品女人久久久 | 久久青青草原精品国产软件| 久久精品国产亚洲AV高清热 | 国产99精品久久| 99蜜桃臀久久久欧美精品网站| 精品久久人人爽天天玩人人妻 | 国产精品久久久久免费a∨| 国产伊人久久| 91久久精品无码一区二区毛片| 亚洲AV无码久久精品色欲| 要久久爱在线免费观看| 国产精品狼人久久久久影院| 欧洲精品久久久av无码电影| 久久久久高潮综合影院| 久久久久久久久波多野高潮| 亚洲国产成人精品久久久国产成人一区二区三区综| 热re99久久精品国产99热| 狠狠色丁香久久综合五月| 久久国产精品99精品国产987| 国产成人久久AV免费| 狠狠色丁香久久综合五月| 草草久久久无码国产专区| 国产农村妇女毛片精品久久 |