• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            Codejie's C++ Space

            Using C++

            LAC : I hate encoded data.


                昨晚敲好了LAC的Native Dictionary數(shù)據(jù)表, 今天準(zhǔn)備放些數(shù)據(jù)進(jìn)去,又是那么一沖動(dòng)--為什么不直接將Lingoes的數(shù)據(jù)導(dǎo)入進(jìn)去呢?反正早晚要做的.

                于是興沖沖地checkout出Lingoes-Extractor.這個(gè)項(xiàng)目是七八月份中無意間發(fā)現(xiàn)的,很強(qiáng)力,一定程度上破解了Lingoes的LD2格式,有興趣的快去download吧.
             
                在最早做LingosHook時(shí)也不是沒想過破解LD2,只是由于想著LingosHook只是個(gè)單詞本,不是個(gè)詞典,加上通過Hook方式也能獲得數(shù)據(jù),也就沒有去嘗試.現(xiàn)在要增加Native Dictionary,這些數(shù)據(jù)是必需的了,本來想著將前面準(zhǔn)備的(CET4,6)拿來用用就好了,但又覺得是不是有點(diǎn)不專業(yè)啊.于是轉(zhuǎn)而到處找詞典數(shù)據(jù),結(jié)果,結(jié)果就發(fā)現(xiàn)了這個(gè)Lingoes-Extractor項(xiàng)目.驚喜啊,當(dāng)時(shí)就決定直接用Lingoes是數(shù)據(jù)了...

                現(xiàn)在悲劇了...這就是為什么前面說Lingoes-Extractor是'一定程度上'破解了LD2呢?因?yàn)?雖然破解出的數(shù)據(jù)很全部,但很多必要的數(shù)據(jù)無法獲得.比如如下破解后的數(shù)據(jù):
            abut = abuts|abutted|abuttinga·but || ?'b?tv.  鄰接; 緊靠; 毗連

                數(shù)據(jù)顯示了abut單詞的多種表達(dá)式,以及音標(biāo),詞性和解釋,很全面,但問題是--這些數(shù)據(jù)該怎么分隔呢?
                研究了Lingoes-Extractor的源碼,發(fā)現(xiàn)其似乎也沒法分隔這些數(shù)據(jù),只能簡(jiǎn)單地分成'單詞'和'解釋'兩部分.
                
                現(xiàn)在,現(xiàn)在難道要我自己再來破解LD2嗎? 太悲劇了...現(xiàn)在真的么時(shí)間玩破解啊...記得上次破解WOW的WDB文件(有圖有真相...),差點(diǎn)死掉,我恨編碼數(shù)據(jù)!!!


            <---- 燒香的分割線 ---->

                高人啊,你在哪里啊... 唉,明天再好好看看人家的code先...

            posted on 2012-10-16 00:22 codejie 閱讀(1307) 評(píng)論(2)  編輯 收藏 引用 所屬分類: 隨筆而已

            評(píng)論

            # re: LAC : I hate encoded data. 2013-10-26 15:53 librehat

            小的最近在做Linux KDE桌面下的一個(gè)詞典小工具,到目前為止都用的網(wǎng)絡(luò)查詞(走有道、QQ、金山的API)。。。API查詞結(jié)果太「骨感」了,而且只有中英文。

            總算也要杠上LD2這個(gè)文件了,畢竟太多的詞典都是LD2格式的。

            想問問大俠,解開LD2文件有C++的實(shí)現(xiàn)嗎?我對(duì)Java一竅不通……另,如果用javascript實(shí)現(xiàn)的話會(huì)不會(huì)效率很慢(考慮到一個(gè)LD2文件也有個(gè)幾兆)  回復(fù)  更多評(píng)論   

            # re: LAC : I hate encoded data. 2013-10-26 18:08 codejie

            @librehat
            因?yàn)長AC是android應(yīng)用, 所以我也是用JAVA實(shí)現(xiàn)的. 但我覺得Extractor寫的不錯(cuò), 很好看懂的, Port到C++來實(shí)現(xiàn)肯定沒問題的.javascript不熟悉, 效率問題要看你打算怎么利用LD2文件了. 像LAC是先將LD2的索引部分解開, LD2文件僅當(dāng)數(shù)據(jù)使用, 如果你打算直接使用LD2, 那每次都解開索引部分, 怕效率就是大問題了.  回復(fù)  更多評(píng)論   

            公告

            Using C++

            導(dǎo)航

            統(tǒng)計(jì)

            留言簿(73)

            隨筆分類(513)

            積分與排名

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            潮喷大喷水系列无码久久精品| 欧美亚洲国产精品久久高清| 日韩精品无码久久一区二区三| www久久久天天com| 婷婷综合久久中文字幕蜜桃三电影| 久久久精品2019免费观看| 国产精品免费福利久久| 青青青伊人色综合久久| 国产精品久久久香蕉| 久久久久久九九99精品| 18岁日韩内射颜射午夜久久成人| 欧美激情精品久久久久久久| 无码八A片人妻少妇久久| 国产精品美女久久久m| 久久人人爽人爽人人爽av| 亚洲午夜久久久久久噜噜噜| 欧美久久久久久午夜精品| 久久久久久精品无码人妻| 怡红院日本一道日本久久 | 日韩影院久久| 久久久久青草线蕉综合超碰| 狠狠色噜噜狠狠狠狠狠色综合久久 | 久久亚洲国产成人影院| 99久久er这里只有精品18| 日本三级久久网| 狠狠色婷婷久久综合频道日韩| 久久er国产精品免费观看2| 亚洲香蕉网久久综合影视| 亚洲欧美成人久久综合中文网| 久久久久久久国产免费看| 一本伊大人香蕉久久网手机| 亚洲AV无一区二区三区久久 | 久久精品国产69国产精品亚洲| yy6080久久| 免费久久人人爽人人爽av| 亚洲国产精品无码久久久久久曰| 99久久免费国产精品| 久久国产成人精品麻豆| 国产精品福利一区二区久久| 久久99精品久久只有精品| 色妞色综合久久夜夜|