首頁(yè) 新隨筆新文章聯(lián)系

常用鏈接

隨筆分類

Blog

jingjiaguo
new blog
MyStorage
OpenMP
unix
weibo4android

Company

novem
novem

Friends&Acmers

kikoqiu
linle
sunny_fable
tianyu
zhoulin
楓之羽

QT

CuteQt
Qt-src

搜索

閱讀排行榜

素?cái)?shù)的判定（轉(zhuǎn)）

第一章素?cái)?shù)判定法現(xiàn)狀

現(xiàn)在，確定性素?cái)?shù)判定法已經(jīng)有很多種，常用的有試除法、威廉斯方法、艾德利曼和魯梅利法。它們的適用范圍各不相同，威廉斯方法比較適合10^20到10^50之間的數(shù)，艾德利曼和魯梅利法適合大于10^50的數(shù)，對(duì)于32位機(jī)器數(shù)，由于都小于10^10，所以一般都用試除法來(lái)判定。

也許有人會(huì)問(wèn)：“你為什么沒(méi)有提馬寧德拉.阿格拉瓦法呢？不是有人說(shuō)它是目前最快的素?cái)?shù)判定法嗎？” 其實(shí)這是一個(gè)很大的誤解，阿格拉瓦法雖然是log(n)的多項(xiàng)式級(jí)算法，但目前只有理論上的意義，根本無(wú)法實(shí)用，因?yàn)樗臅r(shí)間復(fù)雜度是O(log(n)^12)，這個(gè)多項(xiàng)式的次數(shù)太高了。就拿最慢的試除法跟它來(lái)比吧，試除法的時(shí)間復(fù)雜度為O(n^(1/2)*log(n)^2)，當(dāng)n = 16時(shí)，log(n)^12 = 16777216，而n^(1/2)*log(n)^2 = 64，你看相差有多么大！如果要讓兩者速度相當(dāng)，即log(n)^12 = n^(1/2)*log(n)^2，得出n = 10^43.1214，此時(shí)需要進(jìn)行的運(yùn)算次數(shù)為log(n)^12 = 10^25.873（注意：本文中log（）函數(shù)缺省以2為底），這樣的運(yùn)算次數(shù)在一臺(tái)主頻3GHz的計(jì)算機(jī)上運(yùn)行也要10^8.89707年才能運(yùn)行完，看來(lái)我們這輩子是別指望看到阿格拉瓦法比試除法快的這一天啦！

除了這些確定性素?cái)?shù)判定法外，還有基于概率的非確定性素?cái)?shù)判定法，最常用的就是米勒-拉賓法。

對(duì)于32位機(jī)器數(shù)（四則運(yùn)算均為常數(shù)時(shí)間完成），試除法的時(shí)間復(fù)雜度是O(n^(1/2))，而米勒-拉賓法的時(shí)間復(fù)雜度只有O(log(n))。所以后者要比前者快得多，但是由于米勒-拉賓法的非確定性，往往我們?cè)谛枰_定解時(shí)仍然要依靠速度較慢的試除法。那是否可以通過(guò)擴(kuò)展米勒-拉賓法，來(lái)找到一種更快的確定性素?cái)?shù)判定法呢？結(jié)論是肯定的，本文就帶你一起尋找這樣一種方法。

第二章 2-偽素?cái)?shù)表的生成

既然要擴(kuò)展米勒-拉賓法，那首先我們應(yīng)該知道為什么米勒-拉賓法是個(gè)非確定性素?cái)?shù)判定法？答案很簡(jiǎn)單，由于偽素?cái)?shù)的存在。由于米勒-拉賓法使用費(fèi)爾馬小定理的逆命題進(jìn)行判斷，而該逆命題對(duì)極少數(shù)合數(shù)并不成立，從而產(chǎn)生誤判，這些使費(fèi)爾馬小定理的逆命題不成立的合數(shù)就是偽素?cái)?shù)。為了研究偽素?cái)?shù)，我們首先需要生成偽素?cái)?shù)表，原理很簡(jiǎn)單，就是先用篩法得出一定范圍內(nèi)的所有素?cái)?shù)，然后逐一判定該范圍內(nèi)所有合數(shù)是否使以2為底數(shù)的費(fèi)爾馬小定理的逆命題不成立，從而得出該范圍內(nèi)的2-偽素?cái)?shù)表。我的程序運(yùn)行了100分鐘，得出了32位機(jī)器數(shù)范圍內(nèi)的2-偽素?cái)?shù)表，如下：

341

561

645

1105

1387

1729

1905

2047

2465

2701

...

4286813749

4288664869

4289470021

4289641621

4289884201

4289906089

4293088801

4293329041

4294868509

4294901761

（共10403個(gè)，由于篇幅所限，中間部分省略。）

第三章尋找2-偽素?cái)?shù)的最小可判定底數(shù)

對(duì)于2-偽素?cái)?shù)表的每一個(gè)偽素?cái)?shù)，尋找最小的可以判定它們是合數(shù)的底數(shù)，我把這個(gè)底數(shù)稱之為最小可判定底數(shù)。特別地，對(duì)于絕對(duì)偽素?cái)?shù)，它的最小質(zhì)因子即是它的最小可判定底數(shù)。由于已經(jīng)證明了絕對(duì)偽素?cái)?shù)至少有三個(gè)質(zhì)因子，所以這個(gè)最小質(zhì)因子一定不大于n^(1/3)。下面就是我找到的最小可判定底數(shù)列表：

341 3

561 3

645 3

1105 5

1387 3

1729 7

1905 3

2047 3

2465 5

2701 5

...

4286813749 3

4288664869 3

4289470021 5

4289641621 3

4289884201 3

4289906089 3

4293088801 3

4293329041 3

4294868509 7

4294901761 3

通過(guò)統(tǒng)計(jì)這個(gè)列表，我發(fā)現(xiàn)了一個(gè)規(guī)律，那就是所有的最小可判定底數(shù)都不大于n^(1/3)，由前述可知，對(duì)于絕對(duì)偽素?cái)?shù)，這個(gè)結(jié)論顯然成立。而對(duì)于非絕對(duì)偽素?cái)?shù)，雖然直觀上覺(jué)得它應(yīng)該比絕對(duì)偽素?cái)?shù)好判定出來(lái)，但是我無(wú)法證明出它的最小可判定底數(shù)都不大于n^(1/3)。不過(guò)沒(méi)關(guān)系，這個(gè)問(wèn)題就作為一個(gè)猜想留給數(shù)學(xué)家來(lái)解決吧，更重要的是我已經(jīng)通過(guò)實(shí)驗(yàn)證明了在32位機(jī)器數(shù)范圍內(nèi)這個(gè)結(jié)論成立。

我們還有沒(méi)有更好的方法來(lái)進(jìn)一步減小最小可判定底數(shù)的范圍呢？有的！我們可以在計(jì)算平方數(shù)時(shí)進(jìn)行二次檢測(cè)，下面是進(jìn)行了二次檢測(cè)后重新計(jì)算的最小可判定底數(shù)列表：

341 2

561 2

645 2

1105 2

1387 2

1729 2

1905 2

2047 3

2465 2

2701 2

...

4286813749 2

4288664869 2

4289470021 2

4289641621 2

4289884201 2

4289906089 2

4293088801 2

4293329041 2

4294868509 2

4294901761 3

很顯然，二次檢測(cè)是有效果的，經(jīng)過(guò)統(tǒng)計(jì)，我發(fā)現(xiàn)了新的規(guī)律，那就是經(jīng)過(guò)二次檢測(cè)后所有的最小可判定底數(shù)都不大于n^(1/6)，真的是開(kāi)了一個(gè)平方呀，哈哈！這個(gè)結(jié)論的數(shù)學(xué)證明仍然作為一個(gè)猜想留給數(shù)學(xué)家們吧。我把這兩個(gè)猜想叫做費(fèi)爾馬小定理可判定上界猜想。而我已經(jīng)完成了對(duì)32位機(jī)器數(shù)范圍內(nèi)的證明。

通過(guò)上面總結(jié)的規(guī)律，我們已經(jīng)可以設(shè)計(jì)出一個(gè)對(duì)32位機(jī)器數(shù)進(jìn)行素?cái)?shù)判定的 O(n^(1/6)*log(n)) 的確定性方法。但是這還不夠，我們還可以優(yōu)化，因?yàn)榇藭r(shí)的最小可判定底數(shù)列表去重后只剩下了5個(gè)數(shù)（都是素?cái)?shù)）：{2,3,5,7,11}。天哪，就是前5個(gè)素?cái)?shù)，這也太容易記憶了吧。

不過(guò)在實(shí)現(xiàn)算法時(shí)，需要注意這些結(jié)論都是在2-偽素?cái)?shù)表基礎(chǔ)上得來(lái)的，也就是說(shuō)不管如何對(duì)2的判定步驟必不可少，即使當(dāng)2>n^(1/6)時(shí)。

還有一些優(yōu)化可以使用，經(jīng)過(guò)實(shí)驗(yàn)，當(dāng)n>=7^6時(shí)，可以不進(jìn)行n^(1/6)上界限制，而固定地用{2,5,7,11}去判定，也是100%正確的。這樣就可以把判定次數(shù)降為4次以下，而每次判定只需要進(jìn)行4log(n)次乘除法（把取余運(yùn)算也看作除法），所以總的計(jì)算次數(shù)不會(huì)超過(guò)16log(n)。經(jīng)過(guò)實(shí)驗(yàn)，最大的計(jì)算次數(shù)在n=4294967291時(shí)出現(xiàn)，為496次。

自己寫(xiě)了個(gè)隨機(jī)化素?cái)?shù)判定算法：

1 #include <iostream>
2 #include <cmath>
3 #include <algorithm>
4
5 using namespace std;
6 typedef unsigned __int64 longlong_t;
7
8 bool _IsLikePrime(longlong_t n, longlong_t base)
9 {
10     longlong_t power = n-1;
11     longlong_t result = 1;
12     longlong_t x = result;
13     longlong_t bits = 0;
14     longlong_t power1 = power;
15     //統(tǒng)計(jì)二進(jìn)制位數(shù)
16     while (power1 > 0)
17     {
18         power1 >>= 1;
19         bits++;
20     }
21     //從高位到低位依次處理power的二進(jìn)制位
22     while(bits > 0)
23     {
24         bits--;
25         result = (x*x)%n;
26         //二次檢測(cè)
27         if(result==1&&x!=1&&x!=n-1)
28             return false;
29
30         if ((power&((longlong_t)1<<bits)) != 0)
31             result = (result*base)%n;
32
33         x = result;
34     }
35     //費(fèi)爾馬小定理逆命題判定
36     return result == 1;
37 }
38 inline bool JudgePrime(int n,int s)
39 {
40     srand(20);
41     for(int i=0;i<s;i++){
42         int a=rand()%(n-1)+1;
43         if(!_IsLikePrime(n,a))
44             return false;
45     }
46     return true;
47 }
48 int main()
49 {
50     int n;
51     while(scanf("%d",&n)!=EOF){
52         int num=0;
53         int cnt=0;
54         for(int i=0;i<n;i++){
55             scanf("%d",&num);
56             if(JudgePrime(num,20))
57                 cnt++;
58         }
59         printf("%d\n",cnt);
60     }
61     return 0;
62 }

s越大，穩(wěn)定性越好，但效率會(huì)低點(diǎn)。原作者有更好的判定算法，對(duì)作者表示感謝。。

posted @ 2008-01-26 09:37 小果子閱讀(1219) | 評(píng)論 (0) | 編輯收藏

hash_map(2)

1

#include <iostream>
2

#include <string>
3

#include <algorithm>
4

#include <hash_map>
5

6

using namespace std;
7

8

struct hashable{
9

string i;
10

hashable(string iv):i(iv){}
11

operator size_t()const{
12

int ret=i.size();
13

for(int k=0;k!=i.size();++k){
14

ret*=10;
15

ret+=i[k]-'A';
16

}
17

return ret;
18

}
19

bool operator< (hashable r)const {
20

return i<r.i;
21

}
22

};
23

int main()
24

{
25

hash_map<hashable,string> hm;
26

hashable a("1");
27

hm[a]="T";
28

cout<<hm[a]<<endl;
29

}

對(duì)自定義類型到string的示例

posted @ 2008-01-26 09:20 小果子閱讀(290) | 評(píng)論 (0) | 編輯收藏

iterator_traits( 轉(zhuǎn))

Reference Type 和 Pointer Type

所謂左值（lValue）：是用來(lái)代表某個(gè)對(duì)象的一個(gè)東西。如果p是指向類型為T的某個(gè)對(duì)象，那么表達(dá)式*p不能只是返回類型為T的對(duì)象，而必須是返回一個(gè)lValue（左值）。

平時(shí)總是拿起*p就直接賦值（對(duì)于簡(jiǎn)單基本類型，例如int *p = &I ; *p=3），沒(méi)想什么*p返回左值那么多。但是當(dāng)在自定義類中重栽*運(yùn)算符的時(shí)候，我們就要特別小心，要注意到這點(diǎn)，返回為T& 才對(duì)。

言規(guī)正傳

iterator_traits的某些機(jī)制所蘊(yùn)涵的意義十分微妙而深遠(yuǎn)，不過(guò)它的實(shí)現(xiàn)卻不是很復(fù)雜，不過(guò)這些東西看起來(lái)比較容易看懂，真正能夠靈活使用就需要花時(shí)間領(lǐng)悟了，為什么會(huì)采取這種方法解決問(wèn)題，和其它的方法對(duì)比有什么好處和提高？這種明白這些問(wèn)題才算掌握了trait的實(shí)質(zhì)。

template< class Iterator>

struct iterator_traits

{

typedef typename Iterator::iterator_category iterator_category;

typedef typename Iterator::value_type value_type;

typedef typename Iterator::difference_type difference_type;

typedef typename Iterator::pointer pointer;

typedef typename Iterator::reference reference ;

};

template< class T>

struct iterator_traits

{

typedef random_access_iterator_tag iterator_category;

typedef T value_type;

typedef ptrdiff_t difference_type;

typedef T* pointer;

typedef T& reference ;

};

template< class T>

struct iterator_traits

{

typedef random_access_iterator_tag iterator_category;

typedef T value_type;

typedef ptrdiff_t difference_type;

typedef T* pointer;

typedef T& reference ;

};

當(dāng)你定義一個(gè)自己的算法，你需要關(guān)注這個(gè)機(jī)制，下面兩個(gè)理由就是你可能要用到iterator_traits：

① 你必須返回某值，或者是申明臨時(shí)變量，而其它型別與iterator的value type 或者different type或者reference type 或者pointer type一致。

② 你的算法類似與advance，必須根據(jù)iterator的分類來(lái)決定不同的實(shí)現(xiàn)方法（提高效率，在編譯時(shí)候進(jìn)行判斷而不是在運(yùn)行的時(shí)候進(jìn)行判斷），沒(méi)有traits機(jī)制，你只好在‘一般化但是沒(méi)效率’或者‘有效率但是過(guò)度狹隘’中進(jìn)行抉擇。

當(dāng)定義一個(gè)Iterator 類，就得在改類中定義五個(gè)嵌套的類型，如上面的五個(gè)所示。要不然就得針對(duì)你的Iterator類，明白的令iterator_traits為Iterator特化，就像iterator_traits要明白的針對(duì)指針而特化一樣。第一種做法總是比較簡(jiǎn)單，尤其是STL的一個(gè)輔助類，base class iterator，讓事情變得更簡(jiǎn)單了。

template< class Category,

class Value,

class Distance =ptrdiff_t,

class Pointer = Value*,

class Reference = Value &

>

struct iterator

{

typedef Category iterator_category;

typedef Value value_type;

typedef Distance difference_type;

typedef Pointer pointer;

typedef Reference reference;

};

為了確保iterator_traits能夠?qū)π碌?/span>iterator class有適當(dāng)?shù)亩x，最簡(jiǎn)單的方法就是從iterator類派生自己的iterator。基類iterator不含任何成員函數(shù)和成員變量，所以繼承不存在額外的開(kāi)銷。

posted @ 2008-01-13 11:34 小果子閱讀(1948) | 評(píng)論 (1) | 編輯收藏

hash_map(2003)(轉(zhuǎn))

說(shuō)來(lái)慚愧，使用了很久Visual Stdio 2003了，只知道MFC升級(jí)到了7.0，ATL也升級(jí)到了7.0，對(duì)于這兩個(gè)經(jīng)典的類庫(kù)做了一些研究，但一直沒(méi)有注意C++標(biāo)準(zhǔn)庫(kù)的變化。

今天嘗試的使用了stdext::hash_map這個(gè)庫(kù)，果然不錯(cuò)。下面寫(xiě)下一些心得。

hash_map類在頭文件hash_map中，和所有其它的C++標(biāo)準(zhǔn)庫(kù)一樣，頭文件沒(méi)有擴(kuò)展名。如下聲明：

          #include <hash_map>
          using namespace std;
          using namespace stdext;

hash_map是一個(gè)聚合類，它繼承自_Hash類，包括一個(gè)vector，一個(gè)list和一個(gè)pair，其中vector用于保存桶，list用于進(jìn)行沖突處理，pair用于保存key->value結(jié)構(gòu)，簡(jiǎn)要地偽碼如下：

          class hash_map<class _Tkey, class _Tval>
          {
          private:
               typedef pair<_Tkey, _Tval> hash_pair;
               typedef list<hash_pair>    hash_list;
               typedef vector<hash_list> hash_table;
          };

當(dāng)然，這只是一個(gè)簡(jiǎn)單模型，C++標(biāo)準(zhǔn)庫(kù)的泛型模版一向以嵌套復(fù)雜而聞名，初學(xué)時(shí)看類庫(kù)，無(wú)疑天書(shū)啊。微軟的hash_map類還聚合了hash_compare仿函數(shù)類，hash_compare類里有聚合了less仿函數(shù)類，亂七八糟的。

下面說(shuō)說(shuō)使用方法：

     一、簡(jiǎn)單變量作為索引：整形、實(shí)性、指針型
     其實(shí)指針型也就是整形，算法一樣。但是hash_map會(huì)對(duì)char*, const char*, wchar_t*, const wchar_t*做特殊處理。
     這種情況最簡(jiǎn)單，下面代碼是整形示例：
            hash_map<int, int> IntHash;
            IntHash[1] = 123;
            IntHash[2] = 456;

            int val = IntHash[1];
            int val = IntHash[2];
     實(shí)型和指針型用法和整形一樣，原理如下：
     1、使用簡(jiǎn)單類型作索引聲明hash_map的時(shí)候，不需要聲明模版的后兩個(gè)參數(shù)（最后一個(gè)參數(shù)指名hash_map節(jié)點(diǎn)的存儲(chǔ)方式，默認(rèn)為pair，我覺(jué)得這就挺好，沒(méi)必要修改），使用默認(rèn)值就好。
     2、對(duì)于除過(guò)字符串的其它簡(jiǎn)單類型，hash_map使用模版函數(shù) size_t hash_value(const _Kty& _Keyval) 計(jì)算hash值，計(jì)算方法是經(jīng)典的掩碼異或法，自動(dòng)溢出得到索引hash值。微軟的工程師也許開(kāi)了一個(gè)玩笑，這個(gè)掩碼被定義為0xdeadbeef(死牛肉，抑或是某個(gè)程序員的外號(hào)）。
     3、對(duì)于字符串指針作索引的時(shí)候，使用定類型函數(shù)inline size_t hash_value(const char *_Str)或inline size_t hash_value(const wchar_t *_Str)計(jì)算hash值，計(jì)算方法是取出每一個(gè)字符求和，自動(dòng)溢出得到hash值。對(duì)于字符串型的hash索引，要注意需要自定義less仿函數(shù)。
     因?yàn)槲覀冇欣碛烧J(rèn)為，人們使用hash表進(jìn)行快速查找的預(yù)期成本要比在hash表中插入的預(yù)期成本低得多，所以插入可以比查找昂貴些；基于這個(gè)假設(shè)，hash_map在有沖突時(shí)，插入鏈表是進(jìn)行排序插入的，這樣在進(jìn)行查詢沖突解決的時(shí)候就能夠更快捷的找到需要的索引。
     但是，基于泛型編程的原則，hash_map也有理由認(rèn)為每一種類型都支持使用"<"來(lái)判別兩個(gè)類型值的大小，這種設(shè)計(jì)恰好讓字符串類型無(wú)所適從，眾所周知，兩個(gè)字符串指針的大小并不代表字符串值的大小。見(jiàn)如下代碼：
          hash_map<const char*, int> CharHash;
          CharHash["a"] = 123;
          CharHash["b"] = 456;

char szInput[64] = "";
scanf("%s", szInput);

int val = CharHash[szInput];

最終的結(jié)果就是無(wú)論輸入任何字符串，都無(wú)法找到對(duì)應(yīng)的整數(shù)值。因?yàn)檩斎氲淖址羔樖莝zInput指針，和"a"或"b"字符串常量指針的大小是絕對(duì)不會(huì)相同。解決方法如下：
首先寫(xiě)一個(gè)仿函數(shù)CharLess，繼承自仿函數(shù)基類binary_function（當(dāng)然也可以不繼承，這樣寫(xiě)只是符合標(biāo)準(zhǔn)，而且寫(xiě)起來(lái)比較方便，不用被類似于指針的指針和指針的引用搞暈。

          struct CharLess : public binary_function<const char*, const char*, bool>
          {
          public:
               result_type operator()(const first_argument_type& _Left, const second_argument_type& _Right) const
               {
                    return(stricmp(_Left, _Right) < 0 ? true : false);
               }
          };

很好，有了這個(gè)仿函數(shù)，就可以正確的使用字符串指針型hash_map了。如下：

          hash_map<const char*, int, hash_compare<const char*, CharLess> > CharHash;
          CharHash["a"] = 123;
          CharHash["b"] = 456;

char szInput[64] = "";
scanf("%s", szInput);

          int val = CharHash[szInput];

     現(xiàn)在就可以正常工作了。至此，簡(jiǎn)單類型的使用方法介紹完畢。

     二、用戶自定義類型：比如對(duì)象類型，結(jié)構(gòu)體。
     這種情況比價(jià)復(fù)雜，我們先說(shuō)簡(jiǎn)單的，對(duì)于C++標(biāo)準(zhǔn)庫(kù)的string類。

     慶幸的是，微軟為basic_string（string類的基類）提供了hash方法，這使得使用string對(duì)象做索引簡(jiǎn)單了許多。值得注意（也值得郁悶）的是，雖然支持string的hash，string類卻沒(méi)有重載比較運(yùn)算符，所以標(biāo)準(zhǔn)的hash_compare仿函數(shù)依舊無(wú)法工作。我們繼續(xù)重寫(xiě)less仿函數(shù)。

          struct string_less : public binary_function<const string, const string, bool>
          {
          public:
               result_type operator()(const first_argument_type& _Left, const second_argument_type& _Right) const
               {
                    return(_Left.compare(_Right) < 0 ? true : fase);
               }
          };

     好了，我們可以書(shū)寫(xiě)如下代碼：

          hash_map<string, int, hash_compare<string, string_less> > StringHash;
          StringHash["a"] = 123;
          StringHash["b"] = 456;

string strKey = "a";

          int val = CharHash[strKey];

     這樣就可以了。

     對(duì)于另外的一個(gè)常用的字符串類CString（我認(rèn)為微軟的CString比標(biāo)準(zhǔn)庫(kù)的string設(shè)計(jì)要灑脫一些）更加復(fù)雜一些。很顯然，標(biāo)準(zhǔn)庫(kù)里不包含對(duì)于CString的支持，但CString卻重載了比較運(yùn)算符（郁悶）。我們必須重寫(xiě)hash_compare仿函數(shù)。值得一提的是，在Virtual Stdio 2003中，CString不再是MFC的成員，而成為ATL的成員，使用#include <atlstr.h>就可以使用。我沒(méi)有采用重寫(xiě)hash_compare仿函數(shù)的策略，而僅僅是繼承了它，在模版庫(kù)中的繼承是沒(méi)有性能損耗的，而且能讓我偷一點(diǎn)懶。
     首先重寫(xiě)一個(gè)hash_value函數(shù)：

          inline size_t CString_hash_value(const CString& str)
          {
               size_t value = _HASH_SEED;
               size_t size = str.GetLength();
               if (size > 0) {
                    size_t temp = (size / 16) + 1;
                    size -= temp;
                    for (size_t idx = 0; idx <= size; idx += temp) {
                         value += (size_t)str[(int)idx];
                    }
               }
               return(value);
          }

     其次重寫(xiě)hash_compare仿函數(shù)：

          class CString_hash_compare : public hash_compare<CString>
          {
          public:
               size_t operator()(const CString& _Key) const
               {
                    return((size_t)CString_hash_value(_Key));
               }

               bool operator()(const CString& _Keyval1, const CString& _Keyval2) const
               {
                    return (comp(_Keyval1, _Keyval2));
               }
          };

     上面的重載忽略了基類對(duì)于less仿函數(shù)的引入，因?yàn)镃String具備比較運(yùn)算符，我們可以使用默認(rèn)的less仿函數(shù)，在這里映射為comp。好了，我們可以聲明新的hash_map對(duì)象如下：

hash_map<CString, int, CString_hash_compare> CStringHash;

其余的操作一樣一樣的。

     下來(lái)就說(shuō)說(shuō)對(duì)于自定義對(duì)象的使用方法：首先定義

          struct IHashable
          {
               virtual unsigned long hash_value() const = 0;
               virtual bool operator < (const IHashable& val) const = 0;
               virtual IHashable& operator = (const IHashable& val) = 0;
          };

     讓我們自寫(xiě)的類都派生自這里，有一個(gè)標(biāo)準(zhǔn)，接下來(lái)定義我們的類：

          class CTest : public IHashable
          {
          public:
               int m_value;
               CString m_message;
          public:
               CTest() : m_value(0)
               {
               }

               CTest(const CTest& obj)
               {
                    m_value = obj.m_value;
                    m_message = obj.m_message;
               }
          public:
               virtual IHashable& operator = (const IHashable& val)
               {
                    m_value   = ((CTest&)val).m_value;
                    m_message = ((CTest&)val).m_message;
                    return(*this);
               }

               virtual unsigned long hash_value() const
               {
                    // 這里使用類中的m_value域計(jì)算hash值，也可以使用更復(fù)雜的函數(shù)計(jì)算所有域總的hash值
                    return(m_value ^ 0xdeadbeef
               }

               virtual bool operator < (const IHashable& val) const
               {
                    return(m_value < ((CTest&)val).m_value);
               }
          };

     用這個(gè)類的對(duì)象做為hash索引準(zhǔn)備工作如下，因?yàn)榻涌谥幸?guī)定了比較運(yùn)算符，所以這里可以使用標(biāo)準(zhǔn)的less仿函數(shù)，所以這里忽略：

          template<class _Tkey>
          class MyHashCompare : public hash_compare<_Tkey>
          {
          public:
               size_t operator()(const _Tkey& _Key) const
               {
                    return(_Key.hash_value());
               }

               bool operator()(const _Tkey& _Keyval1, const _Tkey& _Keyval2) const
               {
                    return (comp(_Keyval1, _Keyval2));
               }
          };

     下來(lái)就這樣寫(xiě)：

          CTest test;
          test.m_value = 123;
          test.m_message = "This is a test";

          MyHash[test] = 2005;

          int val = MyHash[test];

     可以看到正確的數(shù)字被返回。

     三、關(guān)于hash_map的思考：

     1、性能分析：采用了內(nèi)聯(lián)代碼和模版技術(shù)的hash_map在效率上應(yīng)該是非常優(yōu)秀的，但我們還需要注意如下幾點(diǎn)：

     * 經(jīng)過(guò)查看代碼，字符串索引會(huì)比簡(jiǎn)單類型索引速度慢，自定義類型索引的性能則和我們選擇hash的內(nèi)容有很大關(guān)系，簡(jiǎn)單為主，這是使用hash_map的基本原則。
     * 可以通過(guò)重寫(xiě)hash_compair仿函數(shù)，更改里面關(guān)于桶數(shù)量的定義，如果取值合適，也可以得到更優(yōu)的性能。如果桶數(shù)量大于10，則牢記它應(yīng)該是一個(gè)質(zhì)數(shù)。
     * 在自定義類型是，重載的等號(hào)（或者拷貝構(gòu)造）有可能成為性能瓶頸，使用對(duì)象指針最為索引將是一個(gè)好的想法，但這就必須重寫(xiě)less仿函數(shù)，理由同使用字符串指針作為索引。

posted @ 2008-01-12 18:31 小果子閱讀(9710) | 評(píng)論 (0) | 編輯收藏

慢慢品味<>

想自己開(kāi)始學(xué)語(yǔ)言的時(shí)候，因?yàn)楦静恢朗裁磿?shū)好，所以看到基本是一些國(guó)內(nèi)的，水平一般的書(shū)，如果你剛開(kāi)始學(xué)c or c++,推薦c++創(chuàng)始人寫(xiě)的<<the c++ programming language>>,即使是學(xué)有所成的人，再看此書(shū)也有很大收獲我想，慢慢品味，會(huì)有收獲的。。。以后我會(huì)將自己學(xué)習(xí)此書(shū)的筆記寫(xiě)在此，各位路過(guò)的大牛指點(diǎn)指點(diǎn)。。。^_^

posted @ 2007-12-15 23:22 小果子閱讀(228) | 評(píng)論 (0) | 編輯收藏

僅列出標(biāo)題

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

常用鏈接

隨筆分類

Blog

Company

Friends&Acmers

QT

搜索

最新評(píng)論

閱讀排行榜