• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            天行健 君子當自強而不息

            【ZT】哈希的原理和代價

            哈希表和哈希函數是大學數據結構中的課程,實際開發中我們經常用到Hashtable這種結構,當遇到鍵-值對存儲,采用Hashtable比ArrayList查找的性能高。為什么呢?我們在享受高性能的同時,需要付出什么代價,那么使用Hashtable是否就是一樁無本萬利的買賣呢?就此疑問,做以下分析,希望能拋磚引玉。

            1)hash它為什么對于鍵-值查找性能高

            學 過數據結構的,都應該曉得,線性表和樹中,記錄在結構中的相對位置是隨機的,記錄和關鍵字之間不存在明確的關系,因此在查找記錄的時候,需要進行一系列的 關鍵字比較,這種查找方式建立在比較的基礎之上,在.net中(Array,ArrayList,List)這些集合結構采用了上面的存儲方式。
            比如,現在我們有一個班同學的數據,包括姓名,性別,年齡,學號等。假如數據有

            姓名 性別 年齡 學號
            張三 15 1
            李四 14 2
            王五 14 3

            假如,我們按照姓名來查找,假設查找函數FindByName(string name);

            1)查找“張三”
            只需在第一行匹配一次。
            2)查找"王五"
                在第一行匹配,失敗,
                在第二行匹配,失敗,
                在第三行匹配,成功

            上面兩種情況,分別分析了最好的情況,和最壞的情況,那么平均查找次數應該為 (1+3)/2=2次,即平均查找次數為(記錄總數+1)的1/2。
            盡管有一些優化的算法,可以使查找排序效率增高,但是復雜度會保持在log2n的范圍之內。

            如 何更更快的進行查找呢?我們所期望的效果是一下子就定位到要找記錄的位置之上,這時候時間復雜度為1,查找最快。如果我們事先為每條記錄編一個序號,然后 讓他們按號入位,我們又知道按照什么規則對這些記錄進行編號的話,如果我們再次查找某個記錄的時候,只需要先通過規則計算出該記錄的編號,然后根據編號, 在記錄的線性隊列中,就可以輕易的找到記錄了 。

            注意,上述的描述包含了兩個概念,一個是用于對學生進行編號的規則,在數據結構中,稱之為哈希函數,另外一個是按照規則為學生排列的順序結構,稱之為哈希表。

            仍以上面的學生為例,假設學號就是規則,老師手上有一個規則表,在排座位的時候也按照這個規則來排序,查找李四,首先該教師會根據規則判斷出,李四的編號為2,就是在座位中的2號位置,直接走過去,“李四,哈哈,你小子,就是在這!”

            看看大體流程:


            從上面的圖中,可以看出哈希表可以描述為兩個筒子,一個筒子用來裝記錄的位置編號,另外一個筒子用來裝記錄,另外存在一套規則,用來表述記錄與編號之間的聯系。這個規則通常是如何制定的呢?

            a)直接定址法:

                我在前一篇文章對GetHashCode()性能比較的問題中談到,對于整形的數據GetHashCode()函數返回的就是整形   本身,其實就是基于直接定址的方法,比如有一組0-100的數據,用來表示人的年齡

            那么,采用直接定址的方法構成的哈希表為:

            0 1 2 3 4 5
            0歲 1歲 2歲 3歲 4歲 5歲

            .....
            這樣的一種定址方式,簡單方便,適用于元數據能夠用數字表述或者原數據具有鮮明順序關系的情形。

            b)數字分析法:

               有這樣一組數據,用于表述一些人的出生日期

            75 10
            75 12 10
            75 02 14

            分析一下,年和月的第一位數字基本相同,造成沖突的幾率非常大,而后面三位差別比較大,所以采用后三位

            c)平方取中法
             取關鍵字平方后的中間幾位作為哈希地址

            d) 折疊法:
             將關鍵字分割成位數相同的幾部分,最后一部分位數可以不相同,然后去這幾部分的疊加和(取出進位)作為哈希地址,比如有這樣的數據20-1445-4547-3
            可以
                     5473
            +       4454
            +         201
            =     10128
            取出進位1,取0128為哈希地址

            e)取余法
            取關鍵字被某個不大于哈希表表長m的數p除后所得余數為哈希地址。H(key)=key MOD p (p<=m)

            f) 隨機數法
             選擇一個隨機函數,取關鍵字的隨機函數值為它的哈希地址,即H(key)=random(key) ,其中random為隨機函數。通常用于關鍵字長度不等時采用此法。

            總之,哈希函數的規則是:通過某種轉換關系,使關鍵字適度的分散到指定大小的的順序結構中。越分散,則以后查找的時間復雜度越小,空間復雜度越高。

            2)使用hash,我們付出了什么?

            hash 是一種典型以空間換時間的算法,比如原來一個長度為100的數組,對其查找,只需要遍歷且匹配相應記錄即可,從空間復雜度上來看,假如數組存儲的是 byte類型數據,那么該數組占用100byte空間。現在我們采用hash算法,我們前面說的hash必須有一個規則,約束鍵與存儲位置的關系,那么就 需要一個固定長度的hash表,此時,仍然是100byte的數組,假設我們需要的100byte用來記錄鍵與位置的關系,那么總的空間為 200byte,而且用于記錄規則的表大小會根據規則,大小可能是不定的,比如在lzw算法中,如果一個很長的用于記錄像素的byte數組,用來記錄位置 與鍵關系的表空間,算法推薦為一個12bit能表述的整數大小,那么足夠長的像素數組,如何分散到這樣定長的表中呢,lzw算法采用的是可變長編碼,具體 會在深入介紹lzw算法的時候介紹。

            注:hash表最突出的問題在于沖突,就是兩個鍵值經過哈希函數計算出來的索引位置很可能相同,這個問題,下篇文章會令作闡述。
            注:之所以會簡單得介紹了hash,是為了更好的學習lzw算,學習lzw算法是為了更好的研究gif文件結構,最后,我將詳細的闡述一下gif文件是如何構成的,如何高效操作此種類型文件。


            posted on 2008-06-14 12:56 lovedday 閱讀(5119) 評論(5)  編輯 收藏 引用 所屬分類: ▲ Data Structure And Algorithm

            評論

            # re: 【ZT】哈希的原理和代價 2010-05-28 15:30 欣萌

            cool  回復  更多評論   

            # re: 【ZT】哈希的原理和代價 2010-06-28 12:12 學生

            Very Cool  回復  更多評論   

            # re: 【ZT】哈希的原理和代價 2013-03-14 16:24 kim

            cool  回復  更多評論   

            # re: 【ZT】哈希的原理和代價[未登錄] 2016-01-31 02:03 張東升

            博客為什么這么久不更新了啊  回復  更多評論   

            公告

            導航

            統計

            常用鏈接

            隨筆分類(178)

            3D游戲編程相關鏈接

            搜索

            最新評論

            久久99毛片免费观看不卡 | 亚洲人成无码www久久久| 91久久成人免费| 亚洲欧洲久久久精品| 性欧美丰满熟妇XXXX性久久久| 奇米综合四色77777久久| 久久久久久无码Av成人影院| 国产精品对白刺激久久久| 精品水蜜桃久久久久久久| 97精品国产97久久久久久免费| 久久er国产精品免费观看2| 亚洲国产精品无码久久青草| 久久超碰97人人做人人爱| 无码人妻少妇久久中文字幕 | 久久婷婷五月综合国产尤物app| 久久国产色AV免费看| 久久综合给合综合久久| 2021久久精品国产99国产精品 | 亚洲AV无码久久精品成人| 伊人色综合久久天天| 久久99国内精品自在现线| 综合久久给合久久狠狠狠97色| 久久久噜噜噜久久熟女AA片 | 久久se这里只有精品| 久久婷婷久久一区二区三区| 超级碰碰碰碰97久久久久| 久久国产一片免费观看| 九九精品99久久久香蕉| 一本一本久久A久久综合精品 | 久久久久国色AV免费看图片| 精品人妻久久久久久888| 亚洲国产成人久久综合一区77| 秋霞久久国产精品电影院| 99久久中文字幕| 久久精品国产91久久综合麻豆自制| 久久人人添人人爽添人人片牛牛| 日韩电影久久久被窝网| 久久亚洲国产最新网站| 久久人人爽人人爽人人片AV麻烦| 久久青青草原精品国产不卡| 久久午夜综合久久|