首先說,這篇文章是很久很久很久以前寫的,后來覺得沒啥技術(shù)含量,就沒發(fā)。今天放到這兒賺個(gè)眼球,主要目的還是征名,CPPBLOG網(wǎng)友一定要給力哦!
征名:
1. LiteEdit
2. EditLite
3. EverEdit
4. EditWin
5. MegaxEdit
正文:
-------------------------------------------------------------------------------------
1. 什么是代碼自動(dòng)完成1
首先我們先來下個(gè)定義.不要小瞧這個(gè),沒有這個(gè)定義,我們很容易迷失在功能的海洋之中.所謂代碼自動(dòng)完成既是
在用戶輸入或者修改的時(shí)候,能夠根據(jù)光標(biāo)前后位置的文本信息, 從[事先準(zhǔn)備好]的查找表中找出最匹配的過程.
注意:我們?cè)谶@里用了[事先準(zhǔn)備好]這個(gè)詞.
2. 難點(diǎn)分析
A). 怎么查找?
B). 從什么樣的表中查找?
C). 內(nèi)存占用怎么樣?
D). 如何快速的顯示出最匹配的結(jié)果?
我想上面的幾個(gè)問題是大多數(shù)人的第一印象.確實(shí),在我做這項(xiàng)工作之前,我嘗試了寫了幾個(gè)數(shù)據(jù)結(jié)構(gòu)來表達(dá)這樣的操作.
什么三叉,二叉樹啊,可是最后發(fā)現(xiàn)都比較麻煩。
不過,這些嘗試讓我覺得我寫的東西像個(gè)東西...什么呢? 這不就是個(gè)數(shù)據(jù)庫查詢嘛!!
經(jīng)過一番周折(其間過程不述), 選用了sqlite3作為數(shù)據(jù)庫,關(guān)于sqlite3是什么,本文不作具體描述.
那么上面的幾個(gè)難點(diǎn)就迎刃而解了.我們來看一下.
A). 怎么查找?
這個(gè)就簡(jiǎn)單多啦, select * from table where keyword like 'hint%', 其中的hint就是用戶輸入或者修改的前后文文本信息.
B). 從什么樣的查找表中查找?
不管了,當(dāng)然是數(shù)據(jù)庫.
C). 內(nèi)存占用怎么樣?
這個(gè)....我測(cè)試,一個(gè)表里面5萬條數(shù)據(jù),嵌入到程序之中后,內(nèi)存增加2M-3M左右.
D). 如何快速的顯示出最匹配的結(jié)果?
因?yàn)槭褂昧藬?shù)據(jù)庫,所以只顯示頭幾條就可以了.當(dāng)然可以分頁顯示全部拉.因?yàn)閟qlite支持limit語句.
到了這兒,我們可以知道上面的幾個(gè)難點(diǎn)都不是難點(diǎn)了,甚至很Easy.
不過,有一個(gè)問題,加入數(shù)據(jù)庫當(dāng)中有好幾萬條甚至數(shù)十萬條,那么怎么辦呢?
告訴你,沒有解決辦法!
不過,我們要學(xué)會(huì)避開這些問題.比如,筆者做了一個(gè)可以根據(jù)用戶的輸入即時(shí)提示用戶可能輸入的單詞的Sample,包含常用的單詞,分詞,復(fù)數(shù),大約有10萬個(gè)左右吧.
在我的程序中,甚至Debug版本中,都可以即時(shí)的顯示出來,不管你輸入多塊,還有一點(diǎn)就是內(nèi)存占用只增加了幾百K. Why?
呵呵,其實(shí)很簡(jiǎn)單,我創(chuàng)建了26張表. 聰明的讀者應(yīng)該馬上猜到了, 開頭為a的單詞放到一張表,開頭為b的單詞放到另一張表,其實(shí)就是一個(gè)簡(jiǎn)單的hash,寫查詢的時(shí)候,這樣.
sprintf( sql, "select word from %c_wordlist where word like '%s%%' limit 0, 10", buf[0], buf );
效果不錯(cuò)哦~~~`
采用上面的做法,你可以想SourceInsight那樣,把一個(gè)庫,或者整個(gè)windows sdk掃描出來做好符號(hào)庫,進(jìn)行簡(jiǎn)單的自動(dòng)完成...hahahaha
選用數(shù)據(jù)庫的最大的優(yōu)點(diǎn)是可擴(kuò)展性極佳.
3).比較麻煩的一點(diǎn): 如何完成文件內(nèi)的詞匯?
2)上面說的都是事先準(zhǔn)備好的表. 3)所提及的則是根據(jù)該文件要?jiǎng)討B(tài)生成的表.
其實(shí)上面兩者都是事先準(zhǔn)備好的表,只不過一個(gè)狹義的,一個(gè)是廣義的而已.
說它比較麻煩,因?yàn)闆]做過的都會(huì)有個(gè)直觀思路,就是掃描整個(gè)文件,然后放入數(shù)據(jù)庫中就完事了啊.
其實(shí)不然,直接掃描時(shí)最偷懶的做法,也是最有效的.
在這里,我給一個(gè)簡(jiǎn)單的解決方案,不過還沒沒來得及去寫.
方案如下:
在做詞法分析的時(shí)候,我們都會(huì)分析出來一些既不是關(guān)鍵字也不是字符串或者其它的state的[單純的文字].....懂了嗎?這些單純的
文字就是我們要可能自動(dòng)完成的詞匯.
這樣,我們?cè)诜治龅臅r(shí)候,只要把[ 詞匯->文件->代碼行 ]這樣的信息存入到指定的表中,就可以了.甚至只存入詞即可。
添加行或者刪除行的時(shí)候,更新該表就可以了.
在顯示的時(shí)候,因?yàn)橐粋€(gè)文件可能關(guān)聯(lián)好幾個(gè)自動(dòng)完成Database,那么設(shè)定好優(yōu)先級(jí),本文件內(nèi)的很顯然具有最高優(yōu)先級(jí).其它要么顯示
要么不顯示.要么只在注釋中顯示.....
每隔一段時(shí)間就掃描一次文件,如果文件不是太大的話,效率應(yīng)該不錯(cuò)。
-----------------------------------------------------------------------
后記,我曾經(jīng)做了一個(gè)sample,后來換電腦了,就不知道弄哪去了。
posted on 2011-01-04 20:21
megax 閱讀(3024)
評(píng)論(26) 編輯 收藏 引用