然后是HashTable類的骨架(我在這里把它封裝成類了):
接下來是構造函數:
先略去哈希函數,介紹插入函數:
然后是查找:
當然可以根據具體情況做各種改動,如果要極限追求效率可以在t_node里面把key改為指針,然后使用自己編寫的內存分配函數代替new。最簡單的哈希函數:其實最簡單的哈希表1就是H(x)=x,意思是若記錄對象是整數,就直接采用這個整數為下標(char類型也可視為整數),這個就是數組,但它也可以看作哈希表。最簡單的哈希表2就是H(x)=1,意思是不管是什么元素都放到同一個下標,這個就是鏈表,也可視為一種哈希表。大整數的哈希函數:當記錄對象是大整數的時候,若再用H(x)=x,數組的范圍將會承受不起,所以這時候要考慮哈希函數的設計問題,又有很多種設計方法,最廣泛的一種就是H(x)=x%k,k通常是一個質數。一般的哈希函數:我們也許會記錄一些class或者struct之類的東西,這時候我們可以選取里面的某些關鍵變量進行一種運算來確定下標。沖突的處理:再好的哈希函數也很難避免沖突,所謂沖突就是說H(a)=H(b)的情況,而開散列的處理方法是在數組后面掛的是鏈表,這樣沖突的元素可以直接掛在鏈表的末端,而閉散列沒有鏈表,一般是重復Hn(x)或者往H(x)+a(a=1,2,3..)尋找,這會使哈希表變得一塌糊涂,而且沖突還可能引發別的沖突,而且也不便于估計哈希數組的范圍,所以鄙人不提倡使用閉散列的組織方式。順便說一句:好的哈希函數是盡量減少和平衡沖突,盡量使得每個鏈的長度分布得平均,好的哈希函數的設計要靠長久的經驗積累,絕非一日之功。哈希表的本質思想:散列表本質思想就是把數組與鏈表的優勢結合起來,數組的訪問復雜度是O(1),鏈表的插入復雜度是O(1),然而數組的插入復雜度和鏈表的訪問復雜度都比較高,所以就產生了散列表。我們可以把這個思想運用到許多地方,這本是我想說的重點,但鄙人才疏學淺,不知如何表達,日后整理一下代碼說明吧。