• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            時雨の記-RainCode
            遠野嘉一(Lams Lupin)的專欄
            posts - 2,  comments - 8,  trackbacks - 0
            前言
                  散列表(HashTable)又稱為哈希表,是一種快速的數據查找結構,它通常是為一個(組)要記錄的數據設計一個哈希函數H(x),依據這個函數進行給數據定位,如果是閉散列,那就是直接存到數組的H(x)下標處,如果是開散列,就是存到指針數組H(x)下標的鏈表處。在OI中某些Pascaler為了避開鏈表而采用的閉散列鄙人認為相當糟糕,至于原因會在后面解釋。所以本文只談開散列。

            哈希表的組織方式:
                  我們首先要確定一個哈希函數H(x),x是要記錄的對象,我們以H(x)來確定對象的記錄的鏈的位置。
                  還需要一個指針數組來存放每個鏈的頭指針。由于要使用鏈表,所以還要有一個class/struct作為鏈表的基本單位。
            哈希表的一般實現:
            首先是鏈表的基本元素:
            template<class T>
            struct t_node
            {
                
            public:
                    T key;
                    
            //other info
                    t_node* next;
            }
            ;

            然后是HashTable類的骨架(我在這里把它封裝成類了):

            template<class T>
            class hashtable
            {
                
            public:
                    hashtable();
                    
            int hash(const T &sr);
                    
            void insert();
                    t_node 
            *find(const T &sr);
                    
            //add more functions
                private:
                    t_node 
            *ht[t_size];//you should define t_size as sth before
                    
            //add more things
            }
            ;

            接下來是構造函數:

            hashtable<T>::hahstable()
            {
                memset(ht,
            0,sizeof(ht));
            }

            先略去哈希函數,介紹插入函數:

            void hashtable<T>::insert(const T &sr)
            {
                
            int loc = hash(sr);
                
            if (ht[loc] == 0)
                
            {
                    
            //此處為空,插入一個新鏈表
                    ht[loc] = new t_node();
                    ht[loc]
            -> key = T;
                }

                
            else
                
            {
                    t_node 
            *now = ht[loc];
                    
            while (true)
                    
            {
                        
            if (now->key == sr)
                        
            {
                            
            //元素已經存在。 
                            return;
                        }

                        
            else if (now->next == 0)
                        
            {
                            
            //鏈里面沒有該元素,就地插入
                            now->next = new t_node();
                            now
            ->next->key = T; 
                            
            return;
                        }

                        
            else now = now->next;
                    }

                }

            }

            然后是查找:

            t_node *hashtable<T>::find(const T &st)
            {
                
            int loc = hash(sr);
                
            if (ht[loc] == 0)
                
            {
                    
            //此處為空,木有~ 返回空指針 
                    return 0;
                }

                
            else
                
            {
                    t_node 
            *now = ht[loc];
                    
            while (true)
                    
            {
                        
            if (now->key == sr)
                        
            {
                            
            //找到了 
                            return now;
                        }

                        
            else if (now->next == 0)
                        
            {
                            
            //遍歷完了整個鏈還是木有。。 
                            return 0;
                        }

                        
            else now = now->next;//看這個鏈的下一個元素 
                    }

                }

            }

            當然可以根據具體情況做各種改動,如果要極限追求效率可以在t_node里面把key改為指針,然后使用自己編寫的內存分配函數代替new。


            最簡單的哈希函數:
            其實最簡單的哈希表1就是H(x)=x,意思是若記錄對象是整數,就直接采用這個整數為下標(char類型也可視為整數),這個就是數組,但它也可以看作哈希表。
            最簡單的哈希表2就是H(x)=1,意思是不管是什么元素都放到同一個下標,這個就是鏈表,也可視為一種哈希表。

            大整數的哈希函數:
            當記錄對象是大整數的時候,若再用H(x)=x,數組的范圍將會承受不起,所以這時候要考慮哈希函數的設計問題,又有很多種設計方法,最廣泛的一種就是H(x)=x%k,k通常是一個質數。

            一般的哈希函數:
            我們也許會記錄一些class或者struct之類的東西,這時候我們可以選取里面的某些關鍵變量進行一種運算來確定下標。

            沖突的處理:
            再好的哈希函數也很難避免沖突,所謂沖突就是說H(a)=H(b)的情況,而開散列的處理方法是在數組后面掛的是鏈表,這樣沖突的元素可以直接掛在鏈表的末端,而閉散列沒有鏈表,一般是重復Hn(x)或者往H(x)+a(a=1,2,3..)尋找,這會使哈希表變得一塌糊涂,而且沖突還可能引發別的沖突,而且也不便于估計哈希數組的范圍,所以鄙人不提倡使用閉散列的組織方式。
            順便說一句:好的哈希函數是盡量減少和平衡沖突,盡量使得每個鏈的長度分布得平均,好的哈希函數的設計要靠長久的經驗積累,絕非一日之功。

            哈希表的本質思想:
            散列表本質思想就是把數組與鏈表的優勢結合起來,數組的訪問復雜度是O(1),鏈表的插入復雜度是O(1),然而數組的插入復雜度和鏈表的訪問復雜度都比較高,所以就產生了散列表。我們可以把這個思想運用到許多地方,這本是我想說的重點,但鄙人才疏學淺,不知如何表達,日后整理一下代碼說明吧。

            posted on 2011-09-10 12:07 遠野嘉一 閱讀(2789) 評論(8)  編輯 收藏 引用

            FeedBack:
            # re: 淺談哈希思想的應用
            2011-09-10 15:23 | 李立強
            在CSDN的群里看到了,過來看看。
            我覺得你在類中使用typedef會比較好,這樣子不僅可以跟STL達到一種同步,同時可以方便的閱讀和使用,例如可以把
            typedef T size_type;
            typedef size_type* iterator;
            typedef const iterator const_iterator;
            typedef size_type& reference;
            typedef const reference const_reference;
            之類的。這只是舉例子,并不是一定適合你這個類,你可以自己寫適合的typedef。還有一點,我在看primer時,他們將t_node設為class,然后再設置一個友元,這樣子可以防止t_node的訪問,達到封裝的效果。  回復  更多評論
              
            # re: 淺談哈希思想的應用
            2011-09-10 15:39 | 博洋家紡
            止t_node的訪問,達到封裝的效果  回復  更多評論
              
            # re: 淺談哈希思想的應用[未登錄]
            2011-09-10 16:50 | Chipset
            1、耗費內存太多。
            2、速度可能不會太快。

            作為對比,SGI STL和Boost的哈西表速度太慢,耗費內存也太多,估計你的這個還趕不上Boost和SGI STL的哈希表。如果感興趣,到我的主頁上看看哈西表怎么設計的。  回復  更多評論
              
            # re: 淺談哈希思想的應用
            2011-09-10 19:49 | 遠野嘉一
            @Chipset
            謝謝批評,你的哈希表我剛剛看了,確實不錯。事實上我在編寫哈希表的時候都是指針處理數據的,所以理論上在有N個元素時內存占用只有sizeof(ht)+N*sizeof(void*)以及N*sizeof(T)的數據原本占用的內存,sizeof(ht)=t_size*sizeof(void*),鄙人以為應該不會很高,此外我也通常自己編寫內存管理器,和你的博文比較以后,發現我通常寫的和你寫的“拉鏈哈希”應當是時間、空間差不多的,還沒發現新的東西。
            至于哈希函數的設計和內存管理器我將會專門發文,所以在這里就沒有贅述,愿今后繼續關注、指教,謝謝!  回復  更多評論
              
            # re: 淺談哈希思想的應用
            2011-09-10 19:52 | 遠野嘉一
            @李立強
            謝謝建議,這個typedef加上應該是很好的,至于封裝問題我以為是具體操作的事情了,應該不用贅述所以就沒講。。。以后會注意。  回復  更多評論
              
            # re: 淺談哈希思想的應用[未登錄]
            2011-09-10 21:26 | Chipset
            @遠野嘉一
            不是批評,而是交流心得或者說互相學習。我說話不會拐彎抹角客氣,請不要見怪。

            你給出的信息比較少,我個人覺得t_size不應定義成常數,對于靜態表初始化時指定容量就行了,如果是動態表應該能自動調整大小。

            映射到一個數組時(對應下標),最好不要用取模,因為取模耗費太多CPU指令。
              回復  更多評論
              
            # re: 淺談哈希思想的應用[未登錄]
            2011-09-11 00:01 | Jcily
            我倒是覺得博主說的言簡意賅,非常節約讀者時間又把信息傳達到了。
            頂一個。  回復  更多評論
              
            # re: 淺談哈希思想的應用[未登錄]
            2011-10-04 23:19 | Hero
            文章言簡意賅,建議代碼用Coure New 字體,看起來舒服些。  回復  更多評論
              

            <2025年5月>
            27282930123
            45678910
            11121314151617
            18192021222324
            25262728293031
            1234567

            常用鏈接

            留言簿

            隨筆檔案

            文章檔案

            搜索

            •  

            最新評論

            閱讀排行榜

            評論排行榜

            久久精品国产AV一区二区三区| 欧美无乱码久久久免费午夜一区二区三区中文字幕 | 欧美国产成人久久精品| 伊人久久精品影院| 国产精品一久久香蕉国产线看观看| 97久久久久人妻精品专区| 久久国产综合精品五月天| 国产A三级久久精品| 久久AⅤ人妻少妇嫩草影院| 久久久久久国产精品无码下载| 国产精品久久久久久搜索| 中文字幕无码av激情不卡久久| 久久婷婷五月综合97色| 精品久久人人做人人爽综合| 亚洲国产精品久久久天堂| 久久国产成人午夜AV影院| 久久国产精品99国产精| 亚洲人成网站999久久久综合| www久久久天天com| 亚洲欧美伊人久久综合一区二区 | 中文字幕热久久久久久久| 精品久久人人妻人人做精品| 99国产欧美久久久精品蜜芽| 欧美性大战久久久久久| 91精品免费久久久久久久久| 中文字幕久久精品无码| 2021国内久久精品| 一本久道久久综合狠狠躁AV| 国产精品欧美亚洲韩国日本久久 | 久久午夜无码鲁丝片| 久久久午夜精品| 无码八A片人妻少妇久久| 四虎国产精品成人免费久久| 国产精品成人99久久久久| 日本免费一区二区久久人人澡| 午夜天堂精品久久久久| 精产国品久久一二三产区区别| 一个色综合久久| 热re99久久6国产精品免费| 人妻精品久久久久中文字幕一冢本 | 久久人妻少妇嫩草AV无码蜜桃|