• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            那誰的技術博客

            感興趣領域:高性能服務器編程,存儲,算法,Linux內核
            隨筆 - 210, 文章 - 0, 評論 - 1183, 引用 - 0
            數據加載中……

            tokyocabinet1.4.19閱讀筆記(四)hash數據庫freepool的組織與管理

            這一節關注freepool的組織,freepool顧名思義,就是負責存放被刪除,空閑出來的空間,以便于后面回收利用.
            在第一節中已經提到,這一個部分,在初始化的時候會全部讀入采用malloc從堆中分配的內存中,所以對它的大部分操作都是直接在內存中進行的---除了要同步到數據庫文件中時.

            所有的freepool,以數組形式組織在一起,每個freepool元素結構體的定義是:
            typedef struct {                         // type of structure for a free block
              uint64_t off;                          // offset of the block
              uint32_t rsiz;                         // size of the block
            } HDBFB;
            可見,每個freepool關注的僅有兩個因素:所保存block在數據庫文件中的offset,以及這塊block的尺寸.

            當需要插入新的記錄時,需要在當前的freepool中進行查詢,看有沒有適合的freepool可以回收利用,因此需要根據尺寸進行查詢,所以為了提高查詢速率,freepool數組中的元素是根據每個freepool的尺寸進行排序的,這樣根據尺寸進行查找時就可以采用二分查找提高效率了,但是要注意到可能出現的找到的尺寸不符合要求,過大了(大于所需尺寸的一倍以上),這個時候會將這塊freepool進行拆分,一部分給予使用,剩余的回收到freepool中.另外,如果在freepool中查找所需尺寸出現了很多次失敗的情況(一旦失敗表示沒有符合要求的freepool可以回收利用,這時就需要增加數據庫文件大小以加入新的記錄了),就需要對freepool進行一次合并操作,將相鄰的freepool合并起來形成盡可能大的freepool,而判斷是否相鄰的依據就是根據在數據庫文件中的offset,此時又會將所有的freepool根據offset進行一次排序,然后再進行前面的合并操作.

            以上就是freepool數組的大體組織情況,因為它保存在內存里面的,而且會經常有更新,那么就會出現當前的freepool與數據庫文件中保存的freepool情況不一致的可能,所以在關閉/拷貝數據庫的時候還要將內存中的freepool信息一次性的同步到數據庫文件中,但是我注意到,在數據庫運行期間是沒有這個同步操作的,所以,一旦數據庫被非法關閉,那么數據庫文件中里面的freepool信息將完全的錯亂,我想這也是TC不夠安全的一個佐證吧.

            下面簡單的介紹TC hash數據庫中與freepool相關的API:
            1)static bool tchdbsavefbp(TCHDB *hdb)
            將當前內存中freepool數組信息同步到數據庫文件中,僅當關閉/拷貝數據庫時被調用.

            2) static bool tchdbloadfbp(TCHDB *hdb)
            加載數據庫文件中的freepool信息到內存中,與tchdbsavefbp 是兩個互逆的過程.

            3) static void tcfbpsortbyoff(HDBFB *fbpool, int fbpnum)
            根據offset對freepool數組進行排序

            4) static void tcfbpsortbyrsiz(HDBFB *fbpool, int fbpnum)
            根據size對freepool數組進行排序

            5) static void tchdbfbpmerge(TCHDB *hdb)
            將地址相鄰的freepool進行合并,內部實現中首先會調用tcfbpsortbyoff 對freepool根據offset進行排序,這樣才方便合并操作.

            6) static void tchdbfbpinsert(TCHDB *hdb, uint64_t off, uint32_t rsiz)
            將一塊block插入到合適的freepool中,插入之前和插入之后freepool數組都是根據size排序好的.

            7) static bool tchdbfbpsearch(TCHDB *hdb, TCHREC *rec)
            根據rec所要求的尺寸,查找一塊合適的freepool回收利用,如果找到的freepool過大(大于所要求的一倍),那么就分為兩份,一份負責插入rec,一份重新插入到合適的freepool中.

            8) static bool tchdbfbpsplice(TCHDB *hdb, TCHREC *rec, uint32_t nsiz)
            查看緊跟著rec的數據庫文件空間是否是空閑的,如果是就合并進來,也就是加大rec的尺寸,以滿足nsiz大小的要求.

            9) static bool tchdbwritefb(TCHDB *hdb, uint64_t off, uint32_t rsiz)
            將一塊block置位空閑的(就是寫它的magic number為0xb0)

            總體來看,freepool是TC hash數據庫中操作很頻繁的一塊數據區,在刪除一條記錄時需要將這條記錄放到合適的freepool中,而新增記錄時還需要從當前的freepool中查找合適的block,但是由于freepool是保存在內存中的,而且又進行過排序因此可以使用二分查找算法,所以對它進行的管理操作還是較為高效的.




            posted on 2010-01-22 22:38 那誰 閱讀(6639) 評論(1)  編輯 收藏 引用 所屬分類: tokyo cabinet

            評論

            # re: tokyocabinet1.4.19閱讀筆記(四)hash數據庫freepool的組織與管理  回復  更多評論   

            TC的HDB的碎片整理如果只考慮相鄰空閑塊進行merge的話,效果有限。另外,對機器和進程異常的處理正如你所說,還不夠安全。
            2010-01-24 15:56 | davidripple
            精品久久久久中文字幕日本| 国产精品热久久毛片| 久久久久久久亚洲精品| 久久精品国产亚洲一区二区三区| 久久久WWW免费人成精品| 久久频这里精品99香蕉久| 国产精品禁18久久久夂久| 国内精品久久久久久麻豆| 亚洲愉拍99热成人精品热久久| 久久99国产精品一区二区| 香蕉久久影院| 国产成人无码精品久久久久免费| 久久亚洲精品成人无码网站| 成人亚洲欧美久久久久| 久久综合久久自在自线精品自| 久久青青国产| 久久青草国产手机看片福利盒子| 亚洲人成伊人成综合网久久久| 香港aa三级久久三级老师2021国产三级精品三级在 | 精品久久久久久中文字幕| 亚洲国产精品嫩草影院久久| 久久精品一区二区| 精品久久久久久中文字幕人妻最新 | 婷婷五月深深久久精品| 伊人情人综合成人久久网小说| 亚洲乱亚洲乱淫久久| 久久精品国产亚洲77777| 久久久久青草线蕉综合超碰| 久久影院午夜理论片无码| 久久99久久成人免费播放| 国产精品99久久久久久宅男| 狠狠色噜噜狠狠狠狠狠色综合久久| 久久久精品国产sm调教网站| 人妻无码αv中文字幕久久| 奇米影视7777久久精品人人爽| 性高湖久久久久久久久AAAAA| 国内精品久久久久久久亚洲| 久久午夜福利电影| 日日狠狠久久偷偷色综合0| 久久久国产打桩机| 色8久久人人97超碰香蕉987|