青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

foxriver
Keep It Simple and Stupid.
posts - 12,  comments - 39,  trackbacks - 0

當QQ群聊天記錄日積月累,達到一定數量級的時候,要查找某些單一文字,往往會花費10幾秒甚至幾分鐘才有反應。除去磁盤讀取的時間,是否對聊天記錄做一個全局索引也是個重要的優化,這篇文章就是為了優化文本查找速度,介紹一個最簡單的方法。

試著把QQ每條聊天記錄看成SQL里單一記錄,對單條記錄做全文索引。這里用的方法是bit位快速匹配。假設一條聊天記錄是"test", 轉換成16進制,就是"74 65 73 74", 對單條記錄,定義196位bit空間(占用24字節),定義為數組A, 然后按bit層(注意不是字節)做or操作:  (A = A or N, 把A的第N個bit設置為1)

初始狀態:
A = 0;        // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】

A = A or 0x74; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x10,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
A = A or 0x65; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x10,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
A = A or 0x73; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x18,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
A = A or 0x74; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x18,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】

使用時,給需要查找的字符串建立相同大小的bit索引B,對查找數據"es"做相同處理:

B = 0;
B = B or 0x65; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
B = B or 0x73; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x08,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】

然后把A和B做and操作,如果結果為空(完全沒有交集),則可以快速跳過這條記錄,而不用去判斷實際內容中是否包含了查找文本。

if (B & A)
{
  // 兩者索引存在交集,有一定的可能性,處理進一步文字查找操作。
}
else
{
  // 兩者不可能有包含關系,直接跳過本條記錄內容,判斷數據庫下一條記錄。
}

原理很簡單,就是求兩者的交集,但往往簡單的索引,能帶來意想不到的速度提升。實際測試中,只要輸入的查找文本比較短小,大約30%~60%上下浮動的數據都能直接略過,大大節省了查找總耗時。

本人實現中,中文的查找方法相當于兩個單字節的英文,為了最大效率利用空間,用算法把中文每個BYTE都壓縮在196bit之內。

posted on 2011-01-14 01:22 foxriver 閱讀(2252) 評論(6)  編輯 收藏 引用

FeedBack:
# re: C++ 【原創算法】實現一個最簡單bit位全文查找索引。
2011-01-14 09:30 | atyuwen
你這個不就是bloom filter的山寨版么,而且hash時并沒有考慮到pattern中的字母順序,結果退化成了一個普通的字符集求交。  回復  更多評論
  
# re: C++ 實現一個最簡單bit位全文查找索引。
2011-01-14 09:42 | foxriver
@atyuwen

啥,已經有人實現過了?有點杯具,去找來bloom filter研究研究。  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-01-14 12:03 | waiting4you
和布隆算法還是不太一樣的,有創意~~
只是有個地方沒看懂,A = A or 0x74怎么運算呢?怎么得到...0x16...的?謝謝  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-01-14 14:28 | foxriver
@waiting4you

杯具,測試數據寫錯了,是十進制的結果,被我寫成了16進制,已經修正。感謝。  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-01-14 21:50 | qiuxiafei
額 確實是bloomfilter....
不過還是很贊 異曲同工  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-02-12 17:57 | 隨便寫寫~~
@waiting4you
嘗試做了下,還不錯~~

public void or(byte[] input, byte index) {
int move = index % 8;
int fix = index / 8;
input[fix] |= (byte)(1 << move);
}

public bool and(byte[] input1, byte[] input2) {
for (int i = 0; i < input1.Length; i++) {
int x = input1[i] & input2[i];
if (x > 0)
return true;
}
return false;
}  回復  更多評論
  

只有注冊用戶登錄后才能發表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理



<2025年11月>
2627282930311
2345678
9101112131415
16171819202122
23242526272829
30123456

常用鏈接

留言簿(3)

隨筆檔案

文章檔案

相冊

1

搜索

  •  

最新評論

閱讀排行榜

評論排行榜

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            136国产福利精品导航网址| 国产精品一区二区你懂的| 狠狠色伊人亚洲综合成人| 亚洲综合视频网| 亚洲午夜国产一区99re久久| 国产精品国内视频| 亚洲欧美网站| 欧美一区二区三区在线| 狠狠色香婷婷久久亚洲精品| 蘑菇福利视频一区播放| 欧美精品一区视频| 亚洲欧美日韩一区| 久久久久久国产精品mv| 亚洲人成毛片在线播放| 日韩五码在线| 国产一区二区三区高清在线观看| 免费高清在线一区| 欧美日韩国产精品一卡| 午夜亚洲激情| 鲁大师影院一区二区三区| 99精品欧美一区二区三区综合在线 | 99视频精品全部免费在线| 国产精品色网| 欧美国产免费| 国产精品成人播放| 美女精品在线观看| 欧美性大战久久久久久久蜜臀| 久久精品国产综合精品| 欧美激情中文字幕乱码免费| 欧美一区1区三区3区公司| 老司机免费视频一区二区| 亚洲一区二区在线看| 久久天天躁狠狠躁夜夜爽蜜月| 一本色道久久综合精品竹菊| 久久99伊人| 一区二区91| 久久久精品欧美丰满| 亚洲性av在线| 欧美激情片在线观看| 久久久综合精品| 国产精品久久久久久久电影| 欧美激情五月| 伊人伊人伊人久久| 亚洲欧美一区二区原创| 在线亚洲国产精品网站| 久久中文精品| 久久免费黄色| 国产欧美精品在线| 中文日韩在线| 一本一本大道香蕉久在线精品| 久久性色av| 久久久久久久综合狠狠综合| 国产精品久久久久久久久久ktv| 欧美激情二区三区| 在线免费观看日本欧美| 欧美中文在线观看国产| 久久国产精品99国产精| 国产精品嫩草99a| 一区二区国产日产| 亚洲天堂偷拍| 欧美日本在线| 一区二区三区国产在线| 亚洲视频在线播放| 日韩一区二区精品| 美日韩免费视频| 另类尿喷潮videofree| 国产亚洲人成a一在线v站| 亚洲一区二区三区四区五区黄| 99热这里只有精品8| 美女露胸一区二区三区| 欧美国产视频日韩| 亚洲风情在线资源站| 美女日韩欧美| 亚洲成色精品| 亚洲欧洲一级| 欧美激情一区二区三区全黄| 欧美激情免费在线| 亚洲欧洲日本国产| 欧美日韩成人| 亚洲一区久久久| 久久福利精品| 揄拍成人国产精品视频| 久久中文精品| 亚洲美女av在线播放| 中国成人黄色视屏| 国产精品夜色7777狼人 | 中文在线一区| 国产精品高潮呻吟视频| 午夜精品亚洲一区二区三区嫩草| 久久久久国产免费免费| 精品电影一区| 欧美激情视频一区二区三区在线播放 | 午夜在线观看免费一区| 国产精品美女久久久久av超清| 亚洲免费视频网站| 欧美a级片网站| 亚洲日本va午夜在线电影 | 宅男噜噜噜66一区二区| 久久精品一区| 亚洲人午夜精品| 国产精品乱人伦中文| 久久青草欧美一区二区三区| 亚洲精品在线观| 欧美在线综合视频| 亚洲精品男同| 国产欧美亚洲日本| 欧美激情国产日韩| 欧美一区二区三区啪啪| 亚洲日本成人| 久久久无码精品亚洲日韩按摩| 亚洲国产日韩欧美在线动漫| 欧美日韩专区| 久久亚洲私人国产精品va媚药 | 午夜亚洲视频| 亚洲国产成人在线播放| 先锋影音网一区二区| 久久久久久久久久久成人| 欧美大片91| 小处雏高清一区二区三区| 亚洲日韩中文字幕在线播放| 国产精品毛片| 欧美激情视频网站| 久久久噜噜噜| 亚洲午夜久久久| 亚洲精品国产拍免费91在线| 久久国产欧美| 亚洲自拍都市欧美小说| 亚洲国产裸拍裸体视频在线观看乱了中文| 欧美日韩视频在线第一区| 欧美成黄导航| 久久久噜噜噜久久中文字幕色伊伊| 亚洲视频在线观看免费| 亚洲剧情一区二区| 亚洲国产日韩一区二区| 久久综合伊人77777麻豆| 亚洲欧美视频| 亚洲亚洲精品三区日韩精品在线视频| 亚洲高清在线| 在线精品在线| 激情欧美丁香| 国产一区二区欧美| 国产一区二区三区av电影| 国产精品久久久久一区| 欧美亚韩一区| 欧美视频免费看| 欧美日韩亚洲高清| 欧美日韩色一区| 欧美伦理影院| 欧美日韩国产一区二区| 欧美寡妇偷汉性猛交| 欧美va天堂| 欧美激情一区二区| 欧美激情一二区| 欧美日韩二区三区| 国产精品国产福利国产秒拍| 国产精品久久久久高潮| 国产精品女人网站| 国产偷国产偷精品高清尤物| 国产视频精品xxxx| 精品动漫一区| 91久久久亚洲精品| 一区二区不卡在线视频 午夜欧美不卡在| 亚洲精品国产精品国自产观看浪潮 | 欧美在线免费看| 久久五月激情| 欧美理论电影在线播放| 欧美日韩午夜激情| 国产精品久久久久久久电影 | 嫩模写真一区二区三区三州| 另类尿喷潮videofree| 欧美成人精品三级在线观看| 欧美日韩精品免费观看视一区二区 | 亚洲欧美变态国产另类| 久久超碰97中文字幕| 久久综合精品国产一区二区三区| 模特精品裸拍一区| 欧美日韩亚洲一区二区三区四区| 国产精品捆绑调教| 影音先锋久久久| 99爱精品视频| 久久九九全国免费精品观看| 欧美激情国产精品| 亚洲私人影院在线观看| 久久在线免费视频| 国产精品免费一区二区三区在线观看 | 99国产一区二区三精品乱码| 亚洲欧美一区二区在线观看| 免费观看国产成人| 国产精品一区一区| 91久久久亚洲精品| 午夜视频在线观看一区二区三区 | 中文一区二区在线观看| 久久久久久电影| av成人免费在线| 久久婷婷一区| 国产日韩在线播放| 亚洲一级电影| 亚洲欧洲日本一区二区三区| 亚洲欧美另类中文字幕| 欧美日本免费|