Hash與Btree的區別
當記錄號不是用于數據存取的主鍵時,應該使用 Hash和Btree算法 。 (如果記錄號是用于數據存取的一個二級關鍵字,那么還是可以選擇Btree算法,因為它支持一個主鍵和一個記錄號同時存取。)
Btree中的主鍵是有序存儲 ,記錄間的關聯是依靠次序。并且其結構能隨數據的插入和刪除進行動態調整。為了代碼的簡單,DB沒有實現對關鍵字的前綴碼壓縮。Btree支持對數據查詢、插入、刪除的常數級速度。關鍵字可以為任意的數據結構。因此,當在主鍵有序時,Btree算法應該被使用 。例如,如果主鍵是時間戳,那么8點時間戳后面跟隨的就是9點時間戳, 這種情況下,Btree算法一般是正確的選擇。再來個例子:如果主鍵是名字,應用需要取出所有同姓的記錄,那么Btree 存取方法同樣是個好選擇。
Hash 和 Btree 兩種方式在小的數據集合上幾乎沒有性能的差別 。不過,由于Hash使用的是擴展線性HASH算法(extended linear hashing),可以根據HASH表的增長進行適當的調整。所以當一個數據集合足夠大且關鍵字為隨機分布時,采用Hash算法比較好 。
Queue和Recno區別
當用記錄號作為數據存取的主鍵時,應該使用 Queue和Recno存取方法 。記錄號由算法本身生成。實際上,這和關系型數據庫中邏輯主鍵通常定義為int AUTO型是同一個概念。兩者基本上都是建立在Btree算法之上,提供存儲有序數據的接口。Queue的優勢在于:由于其記錄為定長,在插入操作時把記錄插入到隊列的尾部,所以速度最快,而且它執行上鎖和并發處理的水平也相當高。 Recno 的長處在于它支持一些Queue不能實現的特征,比如可變長記錄和支持flat-text文件。
記錄號可以是可變的或者不變的: 可變指的是當記錄被刪除或者插入記錄號發生變化;不變指的是記錄號無論數據庫如何操作,記錄號都不會發生改變。 基于記錄號存取在Btree方式下也是可行的。但是,記錄號是可變,當記錄刪除或插入時,數據庫內的其他記錄的記錄號都將發生改變。 Queue存取方法總是用固定的方式運行,不管數據庫如何操作,記錄號始終改變。 Recno 可以被設置為不變和可變兩種形式。
另外,Recno為數據庫提供支持flat-text文件的永久存儲和數據在讀或修改時提供一個快速的臨時存儲空間。
一個表格:
存儲方式 | 描述 | 選擇場景 |
BTree | 關鍵字有序存儲,并且其結構能隨數據的插入和刪除進行動態調整。 為了代碼的簡單, Berkeley DB 沒有實現對關鍵字的前綴碼壓縮。 B+ 樹支持對數據查詢、插入、刪除的常數級速度。關鍵字可以為任意的數據結構 | 1 、 當 Key 為復雜類型時。 2 、 當 Key 有序時。 |
Hash | DB 中實際使用的是擴展線性 HASH 算法( extended linear hashing ), 可以根據 HASH 表的增長進行適當的調整。關鍵字可以為任意的數據結構。 | 1 、 當 Key 為復雜類型。 2 、 當數據較大且 key 隨機分布時。 |
Recno | 要求每一個記錄都有一個邏輯紀錄號,邏輯紀錄號由算法本身生成。 相當于關系數據庫中的自動增長字段。 Recho 建立在 B+ 樹算法之上,提供了一個存儲有序數據的接口。 記錄的長度可以為定長或不定長。 | 1 、 當 key 為邏輯記錄號時。 2 、 當非高并發的情況下。 |
Queue | 和 Recno 方式接近 , 只不過記錄的長度為定長。 數據以定長記錄方式存儲在隊列中,插入操作把記錄插入到隊列的尾部, 相比之下插入速度是最快的。 | 1 、 當 key 為邏輯記錄號時。 2 、 定長記錄。 3 、 高并發的情況下。 |