青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

foxriver
Keep It Simple and Stupid.
posts - 12,  comments - 39,  trackbacks - 0

當QQ群聊天記錄日積月累,達到一定數量級的時候,要查找某些單一文字,往往會花費10幾秒甚至幾分鐘才有反應。除去磁盤讀取的時間,是否對聊天記錄做一個全局索引也是個重要的優化,這篇文章就是為了優化文本查找速度,介紹一個最簡單的方法。

試著把QQ每條聊天記錄看成SQL里單一記錄,對單條記錄做全文索引。這里用的方法是bit位快速匹配。假設一條聊天記錄是"test", 轉換成16進制,就是"74 65 73 74", 對單條記錄,定義196位bit空間(占用24字節),定義為數組A, 然后按bit層(注意不是字節)做or操作:  (A = A or N, 把A的第N個bit設置為1)

初始狀態:
A = 0;        // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】

A = A or 0x74; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x10,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
A = A or 0x65; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x10,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
A = A or 0x73; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x18,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
A = A or 0x74; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x18,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】

使用時,給需要查找的字符串建立相同大小的bit索引B,對查找數據"es"做相同處理:

B = 0;
B = B or 0x65; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】
B = B or 0x73; // 【0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x20,0x00,0x08,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00】

然后把A和B做and操作,如果結果為空(完全沒有交集),則可以快速跳過這條記錄,而不用去判斷實際內容中是否包含了查找文本。

if (B & A)
{
  // 兩者索引存在交集,有一定的可能性,處理進一步文字查找操作。
}
else
{
  // 兩者不可能有包含關系,直接跳過本條記錄內容,判斷數據庫下一條記錄。
}

原理很簡單,就是求兩者的交集,但往往簡單的索引,能帶來意想不到的速度提升。實際測試中,只要輸入的查找文本比較短小,大約30%~60%上下浮動的數據都能直接略過,大大節省了查找總耗時。

本人實現中,中文的查找方法相當于兩個單字節的英文,為了最大效率利用空間,用算法把中文每個BYTE都壓縮在196bit之內。

posted on 2011-01-14 01:22 foxriver 閱讀(2237) 評論(6)  編輯 收藏 引用

FeedBack:
# re: C++ 【原創算法】實現一個最簡單bit位全文查找索引。
2011-01-14 09:30 | atyuwen
你這個不就是bloom filter的山寨版么,而且hash時并沒有考慮到pattern中的字母順序,結果退化成了一個普通的字符集求交。  回復  更多評論
  
# re: C++ 實現一個最簡單bit位全文查找索引。
2011-01-14 09:42 | foxriver
@atyuwen

啥,已經有人實現過了?有點杯具,去找來bloom filter研究研究。  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-01-14 12:03 | waiting4you
和布隆算法還是不太一樣的,有創意~~
只是有個地方沒看懂,A = A or 0x74怎么運算呢?怎么得到...0x16...的?謝謝  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-01-14 14:28 | foxriver
@waiting4you

杯具,測試數據寫錯了,是十進制的結果,被我寫成了16進制,已經修正。感謝。  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-01-14 21:50 | qiuxiafei
額 確實是bloomfilter....
不過還是很贊 異曲同工  回復  更多評論
  
# re: C++ 【山寨算法】實現一個最簡單bit位全文查找索引。
2011-02-12 17:57 | 隨便寫寫~~
@waiting4you
嘗試做了下,還不錯~~

public void or(byte[] input, byte index) {
int move = index % 8;
int fix = index / 8;
input[fix] |= (byte)(1 << move);
}

public bool and(byte[] input1, byte[] input2) {
for (int i = 0; i < input1.Length; i++) {
int x = input1[i] & input2[i];
if (x > 0)
return true;
}
return false;
}  回復  更多評論
  

<2025年9月>
31123456
78910111213
14151617181920
21222324252627
2829301234
567891011

常用鏈接

留言簿(3)

隨筆檔案

文章檔案

相冊

1

搜索

  •  

最新評論

閱讀排行榜

評論排行榜

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美成人精品一区| 亚洲一区二区三区四区五区黄 | 亚洲欧洲另类| 欧美α欧美αv大片| 蜜臀av国产精品久久久久| 亚洲精品国产精品国自产在线| 亚洲国产精品久久久久| 欧美女同视频| 欧美伊人久久| 老司机免费视频久久| 夜夜嗨av色一区二区不卡| 亚洲一区国产视频| 伊人成综合网伊人222| 91久久国产自产拍夜夜嗨| 欧美午夜精品久久久| 久久久久国产精品厨房| 欧美成人精品1314www| 亚洲欧美日韩一区二区在线| 欧美一区二区精品久久911| 在线看无码的免费网站| 日韩午夜高潮| 极品尤物av久久免费看 | 久久精品视频99| 欧美刺激性大交免费视频| 午夜性色一区二区三区免费视频| 久久精品中文| 亚洲欧美另类综合偷拍| 久久一区激情| 欧美一区二区网站| 欧美黄色大片网站| 久久久亚洲国产天美传媒修理工 | 国产精品久久久久久久久搜平片| 久久精品国产亚洲5555| 欧美国产亚洲视频| 久久久综合激的五月天| 欧美午夜不卡视频| 亚洲国产成人一区| 国内视频一区| 亚洲一区二区三区精品动漫| 亚洲精品免费看| 欧美一区二区三区在线观看 | 国产九九精品| aⅴ色国产欧美| 亚洲精品国产精品乱码不99按摩 | 亚洲视频免费| 夜夜嗨一区二区三区| 久热精品视频在线| 老牛影视一区二区三区| 国产欧美一区二区三区沐欲| 一区二区福利| 亚洲视频碰碰| 欧美日韩在线观看一区二区三区 | 欧美激情久久久| 雨宫琴音一区二区在线| 久久狠狠久久综合桃花| 欧美在线视频一区二区三区| 国产精品区二区三区日本| 一区二区不卡在线视频 午夜欧美不卡在 | 亚洲一区在线播放| 欧美精品一区二区视频| 亚洲国产高清一区二区三区| 一区二区在线免费观看| 久久精品成人一区二区三区蜜臀 | 久久九九久久九九| 国产毛片久久| 欧美一区二区三区在线观看视频 | 亚洲国产日韩欧美在线99| 久久久久久伊人| 欧美xx视频| 亚洲精品在线一区二区| 欧美日韩ab| 日韩网站在线观看| 亚洲欧美在线免费观看| 国产日韩精品一区观看| 久久精品免费观看| 欧美激情精品久久久六区热门 | 国产精品永久入口久久久| 亚洲综合色网站| 国产精品视频精品视频| 欧美激情片在线观看| 黄色成人av在线| 免费久久99精品国产自| 亚洲日本欧美在线| 亚洲欧美日韩直播| 激情久久久久久久久久久久久久久久| 久久久免费观看视频| 亚洲狠狠丁香婷婷综合久久久| 一区二区不卡在线视频 午夜欧美不卡在 | 亚洲精品视频免费| 午夜精品久久久久久久99樱桃| 国产一区二区剧情av在线| 美女视频黄a大片欧美| 亚洲美女在线一区| 久久免费的精品国产v∧| 亚洲乱码日产精品bd| 国产精品久久久久久久久久直播| 久久久久久电影| 日韩一区二区精品| 久久婷婷激情| 亚洲一区二区欧美| 亚洲电影免费在线| 国产精品人人做人人爽| 男人的天堂成人在线| 亚洲综合色自拍一区| 亚洲国产精品综合| 久久精品二区三区| 亚洲视频免费看| 亚洲国产精选| 国产曰批免费观看久久久| 欧美日韩精品是欧美日韩精品| 久久成人国产| 亚洲线精品一区二区三区八戒| 欧美激情区在线播放| 欧美在线观看一区二区| 宅男精品导航| 亚洲精品免费电影| 精品av久久707| 国产欧美在线观看一区| 欧美日韩中文在线| 免费在线欧美视频| 久久久国产一区二区| 亚洲图色在线| 一本一本大道香蕉久在线精品| 亚洲高清123| 毛片av中文字幕一区二区| 欧美在线播放一区| 亚洲欧美国产不卡| 亚洲影院污污.| 一本色道久久综合狠狠躁的推荐| 亚洲国产91色在线| 亚洲成色777777在线观看影院| 国产视频不卡| 国产专区一区| 国内精品久久久久久影视8| 国产女主播一区二区| 国产麻豆午夜三级精品| 国产欧美精品一区| 国产欧美精品一区二区三区介绍| 国产精品日韩一区二区三区| 国产精品久久久久久模特| 欧美私人网站| 国产精品久久久久9999吃药| 国产精品第三页| 国产精品海角社区在线观看| 国产精品激情偷乱一区二区∴| 国产精品激情| 国产欧美日本一区视频| 国产一区成人| 在线欧美一区| 亚洲黄色天堂| 一区二区三区|亚洲午夜| 一区二区福利| 99视频超级精品| 99综合在线| 亚洲天堂成人在线视频| 亚洲女女女同性video| 亚洲欧美在线高清| 欧美在线综合| 欧美激情按摩| 国产精品视频九色porn| 黄色一区二区在线| 亚洲精品你懂的| 亚洲欧美一区二区三区极速播放| 久久av资源网| 欧美高清在线精品一区| 日韩一区二区免费高清| 欧美一级成年大片在线观看| 久久网站免费| 欧美性猛交xxxx乱大交蜜桃| 国产一区美女| 99视频热这里只有精品免费| 性做久久久久久久久| 欧美成人激情视频| 亚洲视频视频在线| 久久亚洲精品伦理| 欧美视频免费| 亚洲第一视频| 欧美在线啊v一区| 亚洲三级观看| 久久爱91午夜羞羞| 欧美日韩天堂| 亚洲大片免费看| 香蕉乱码成人久久天堂爱免费| 欧美高清视频在线观看| 亚洲制服欧美中文字幕中文字幕| 女女同性女同一区二区三区91| 国产精品久久久一区二区三区| 1024国产精品| 欧美在线啊v| 一区二区高清| 欧美区日韩区| 亚洲国产成人91精品| 欧美综合国产| 99视频精品免费观看| 欧美jizz19hd性欧美| 黄色国产精品| 欧美伊人久久久久久午夜久久久久| 91久久精品国产91性色 | 免费成人高清| 欧美一级黄色网|