LingosHook第十八版(v1.2.001)主要圍繞提高HTML數(shù)據(jù)詞典識別率和識別速度做了大幅度的修改,可以這里下載了。修改內(nèi)容如下:
1. 定義三種詞典解析類型,并以此為據(jù)重新設(shè)計實現(xiàn)HTML數(shù)據(jù)分析算法;
2. 增加對詞典解析配置,包括指定詞典解析類型和是否解析;
描述的有些暈,還是上圖說明吧。
如下圖所示,在配置界面中新增了一個按鈕,用于配置詞典的解析參數(shù);

點擊此按鈕,將彈出如下對話框,用于設(shè)置詞典解析參數(shù);

(對,是的,我終于把圖標(biāo)變小了,用的是歪門邪道,不說也罷。。。)
對話框中羅列了曾經(jīng)使用過的詞典。
1. 點擊其圖標(biāo)可以設(shè)置指定詞典的HTML數(shù)據(jù)是否被解析,‘X’為不解析;
2. 通過右鍵菜單可以看出,程序當(dāng)前在支持三種HTML數(shù)據(jù)解析類型:0,1,2;
3. 右鍵菜單中前端標(biāo)記有‘黑點’的類型表示此類型為程序默認(rèn)類型;默認(rèn)類型也可配置,請看下圖;

4. 當(dāng)當(dāng)前使用類型不為默認(rèn)類型時,可設(shè)置其為默認(rèn)類型;
5. 標(biāo)記為粗體的詞典表示當(dāng)前使用的類型為默認(rèn)類型;
6. 點擊'Reset the type of dictionary html data'按鈕,可以將類型設(shè)置為其默認(rèn)類型,如果存在的話;
上圖中所列詞典為我當(dāng)前測試的詞典,除了‘Jukuu’詞典結(jié)果暫時無法歸類外,其它詞典都可以歸為以上三類。因此當(dāng)使用的詞典不再以上列表中時,可先嘗試依次設(shè)置不同解析類型,以檢測是否可以分解其HTML數(shù)據(jù)。
從我的分析看,結(jié)果的外層格式是由Lingoes定死的,但各結(jié)果數(shù)據(jù)格式來自詞典自定義,這也是結(jié)果不同于的根本所在,所以無法預(yù)知Lingoes的HTML數(shù)據(jù)結(jié)果格式到底有多少種。有興趣的可以自己添加解析類型,源碼在這里;當(dāng)然你也可以發(fā)來詞典名稱和所查單詞,由我來分析(這個請別太認(rèn)真,我就說說,不能保證的。。。。)。
HtmlDictParser::TDictDefAttr g_stSysDictDefAttr[SIZE_DICTDEFATTR] =

{

{L"E1C27E806399D047822B6650194A3D32", HtmlDictParser::HTMLDATATYPE_1},//Vicon EC

{L"7AB175CC5F622A44A0DECE976AF22A16", HtmlDictParser::HTMLDATATYPE_1},//Langdao EC

{L"1E388F323A0BD943B30FC68598772814", HtmlDictParser::HTMLDATATYPE_1},//Fundset DC

{L"0895DFE8DB67F9409DB285590D870EDD", HtmlDictParser::HTMLDATATYPE_2},//Dict.CN online

{L"D4722835273E184582F2D24696A738EA", HtmlDictParser::HTMLDATATYPE_1},//Longman Dictionary of Contemporary English

{L"25D62D261B9B6943BE86B7DCF8F9D255", HtmlDictParser::HTMLDATATYPE_1},//Concise English Synonym & Antonym Dictionary

{L"74BF7ECCE3A9AC43B5E8902261A19B29", HtmlDictParser::HTMLDATATYPE_1},//Hudong Wiki

{L"C68363F3F2F8F04997C0552720B30742", HtmlDictParser::HTMLDATATYPE_1},//Google Web Definition

{L"3A259F0851B07D4AAA30FBFA43686AB3", HtmlDictParser::HTMLDATATYPE_2},//Dr.eye Online

{L"9455286C1F1BC84985523D2608B6A913", HtmlDictParser::HTMLDATATYPE_3},//Web Translation
};
<---- 疲憊的分割線 ---->
經(jīng)過這次修改,LingosHook設(shè)計期的功能都實現(xiàn)了,應(yīng)該可以收工,休息了。。。。