在线免费观看一区二区三区,狠狠色香婷婷久久亚洲精品,欧美午夜精品

散列2

3 不使用鏈表的散列表
    分離鏈接散列算法的缺點是使用一些鏈表。由于給新單元分配地址需要時間，因此這就導致算法的速度有些緩慢，同時算法實際上還要求第二種數據結構的實現。解決沖突的另一個方法是當沖突發生時就嘗試選擇另一個單元，直到找到空的單元。更正式地，單元h_i(x)=(hash(x)+f(i))mod TableSize,且f(0)=0.函數f是沖突解決函數。因為所有的數據都要置入表內，所以使用這個方案所需要的表要比分離鏈接散列需要的表大。一般說來，對不使用分離鏈接法的散列表來說，其裝填因子應該低于λ=0.5。我們稱這樣的表為探測散列表(probing hash tables)。
    (1)當f是i的線性函數時，為線性探測，一般情況下f(i)=i，線性探測容易在占據的單元形成一些區塊，其結果成為一次聚集(primary clustering)。
    (2)平方探測是消除線性探測中一次聚集問題的沖突解決方法。平方探測就是沖突函數為二次函數的探測方法。流行的選擇是f(i)=i².
               定理：如果使用平方探測，且表的大小是素數，那么當表至少有一半是空的時候，總能夠插入一個新的元素。
        如果哪怕表有比一半多一個的位置被填滿，那么插入都有可能失敗(雖然這種可能性極小)。另外，表的大小是素數也非常重要。如果表的大小不是素數，則備選單元
       的個數可能會銳減。例如，若表的大小是16，那么備選單元只能在距散列值1，4或9遠處。
        在探測散列表中標準的刪除操作不能執行，因為相應的單元可能已經引起過沖突，元素繞過它存儲在別處。因此，探測散列表需要懶惰刪除。
        實現探測散列表所需要的類接口在下圖中給出。這里不使用鏈表數組，而是使用散列表項單元數組。嵌套的類HashEntry存儲在info成員中一個項的狀態，這個狀態可
       以是ACTIVE,EMPTY或DELETED。

1

//使用探測策略的散列表的類接口，包括嵌套的HashEntry
2

類
3

template <typename HashedObj>
4

class HashTable
5

{
6

public:
7

explicit HashTable( int size = 101 );
8

9

bool contains( const HashedObj &x ) const;
10

11

void makeEmpty();
12

bool insert( const HashedObj &x );
13

bool remove( const HashedObj &x );
14

15

emum EntryType (ACTIVE,EMPTY,DELETED );
16

17

private:
18

struct HashEntry
19

{
20

HashedObj element;
21

EntryType info;
22

HashEntry( const HashedObj & e = HashedObj(), EntryType i = EMPTY ) : element(e), info(i) { }
23

};
24

25

vector<HashEntry> array;
26

int currentSize;
27

28

bool isActive( int currentPos ) const;
29

int findPos( const HashedObj &x ) const;
30

void rehash();
31

int myhash( const HashedObj &x ) const;
32

};

1

//初始化平方探測散列表的例程
2

explicit HashTable( int size = 101 ) : array(nextPrime( size ) )
3

{ makeEmpty(); }
4

5

void makeEmpty()
6

{
7

currentSize = 0;
8

for( int i = 0; i<array.size(); i++ )
9

array[i].info = EMPTY;
10

}

1

//使用平方探測進行散列的contains例程
2

bool contains( const HashedObj &x ) const
3

{
4

return isActive( findPos(x) ); }
5

6

int findPos( const HashedObj &x ) const
7

{
8

int offset = 1;
9

int currentPos = myhash(x);
10

11

//下面是一個小小的trick
12

while ( array[ currentPos ].info != EMPTY && array[ currentPos ].element != x )
13

{
14

currentPos += offset;
15

offset += 2;
16

if( currentPos >= array.size() )
17

currentPos -= array.size();
18

}
19

20

return currentPos;
21

}
22

23

bool isActive( int currentPos ) const
24

{
25

return array[ currentPos ].info == ACTIVE; }

1

//使用平方探測的散列表的insert和remove例程
2

bool insert ( const HashedObj &x )
3

{
4

int currentPos = findPos( x );
5

if ( isActive ( currentPos ) )
6

return false;
7

8

array[ currentPos ] = hashEntry( x, ACTIVE );
9

if( ++currentSize > array.size() / 2 )
10

rehash();
11

12

return true;
13

}
14

15

bool remove( const HashedObj &x )
16

{
17

int currentPos = findPos(x);
18

if ( !isActive( currentPos ) )
19

return false;
20

21

array[ currentPos ].info = DELETED;//傳說中的懶惰刪除
22

return true;
23

}

  (3)最后一個沖突解決方法是雙散列(double hashing)。對于雙散列，一種流行的選擇是f(i)=i*hash₂(x)。這個公式是說，將第二個散列函數應用到x并在距離hash₂(x),2hash₂(x),
      ...等處探測。hash₂(x)選擇不好將會非常糟糕。

.

posted on 2009-11-26 20:20 小羅羅閱讀(504) 評論(0) 編輯收藏引用

只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

step by step

散列2

導航

統計

常用鏈接

留言簿

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜