這幾天收到的最多的錯誤報告就是HTML解析異常,么辦法,誰叫LingosHook的HTML解析對象是咱自己寫的,稍微不合規(guī)則點的HTML數(shù)據(jù),TinyHtmlParser都不認(rèn)識。甚至連合規(guī)則的HTML標(biāo)準(zhǔn)注釋'<--!-->'都不認(rèn)識。。。。嗯,我知道這樣不太靠譜。。。
為了保證TinyHtmlParser能夠正確解析,就需要先‘預(yù)處理’一下HTML數(shù)據(jù),使其能夠符合標(biāo)準(zhǔn)點。對于這樣的需求,一個不二的庫就出現(xiàn)了--
Tidylib。這個庫怎么用就不說了,因為我也不太熟悉,嘿嘿,我使用的代碼請見
這里。
此次修改就是為了減少解析HTML數(shù)據(jù)時產(chǎn)生異常出頻度,因此界面上基本沒有變化,就直接上配置界面了。下載在
這里。

如圖所示,這個選項默認(rèn)是開啟的,因此想來像我這樣就使用一個或兩個詞典的人應(yīng)該不多,加上就使用vicon的更應(yīng)該不多了,最主要的使用其它詞典而碰到異常的人應(yīng)該很多很多,所以默認(rèn)開啟此項。此項開啟會引起性能的降低,當(dāng)然了這個降低只是代碼理論上的,實際使用中是看不出來的。只是有影響,咱最好就提供個選擇,民主點了。。。
下面的圖是Debug界面圖,就是原來的Trace界面,可以看到添加了一個Text和一個Button,便于調(diào)試,現(xiàn)在我能很快定位異常位置了,不需要像前面寫代碼了。。這里貼下就給大家看看,也想說下,實際給自己留好調(diào)試的后門,是很必要的。。
