費馬小定理:
a^(p-1) mod p = 1(p是素數&&a<p&&a>0)
首先我們證明這樣一個結論:如果p是一個素數的話,那么對任意一個小于p的正整數a,a, 2a, 3a, …, (p-1)a
除以p的余數正好是一個1到p-1的
排列。例如,5是素數,3, 6, 9, 12除以5的余數分別為3, 1, 4, 2,正好就是1到4這四個數。
反證法,假如結論不成立的話,那么就是說有兩個小于p的正整數m和n使得na和ma除以p的余數相同。不妨假設n>m,
則p可以整除a(n-m)。但p是素
數,那么a和n-m中至少有一個含有因子p。這顯然是不可能的,因為a和n-m都比p小。
用同余式表述,我們證明了:
(p-1)! ≡ a * 2a * 3a * … * (p-1)a (mod p)
也即:
(p-1)! ≡ (p-1)! * a^(p-1) (mod p)
兩邊同時除以(p-1)!,就得到了我們的最終結論:
1 ≡ a^(p-1) (mod p)
費馬小定里的歐拉推廣:a^φ(m) ≡ 1 (mod m)(其中φ(m)為與m互質的數的個數)
證明與費馬小定理類似
但是費馬小定理的逆命題并不正確,即,當滿足a^(p-1) mod p = 1的數p不一定是素數,例如p=341,a=2,
而此時p=11*13
后來,人們又發現了561, 645, 1105等數都表明a=2時Fermat小定理的逆命題不成立。雖然這樣的數不多,
但不能忽視它們的存在。于是,人們把所
有能整除2^(n-1)-1的合數n叫做偽素數(pseudoprime),意思就是告訴人們這個素數是假的。
不滿足2^(n-1) mod n = 1的n一定不是素數;如果滿足的話則多半是素數。這樣,一個比試除法效率更高的
素性判斷方法出現了:制作一張偽素數
表,記錄某個范圍內的所有偽素數,那么所有滿足2^(n-1) mod n = 1且不在偽素數表中的n就是素數。之所以
這種方法更快,是因為我們可以使用
二分法快速計算2^(n-1) mod n 的值,這在計算機的幫助下變得非常容易;在計算機中也可以用二分查找有序
數列、Hash表開散列、構建Trie樹等
方法使得查找偽素數表效率更高。
有人自然會關心這樣一個問題:偽素數的個數到底有多少?換句話說,如果我只計算2^(n-1) mod n的值,事先
不準備偽素數表,那么素性判斷出
錯的概率有多少?研究這個問題是很有價值的,畢竟我們是OIer,不可能背一個長度上千的常量數組帶上考場。
統計表明,在前10億個自然數中共
有50847534個素數,而滿足2^(n-1) mod n = 1的合數n有5597個。這樣算下來,算法出錯的可能性約為0.00011。
這個概率太高了,如果想免去建
立偽素數表的工作,我們需要改進素性判斷的算法。
最簡單的想法就是,我們剛才只考慮了a=2的情況。對于式子a^(n-1) mod n,取不同的a可能導致不同的結果。一
個合數可能在a=2時通過了測試,
但a=3時的計算結果卻排除了素數的可能。于是,人們擴展了偽素數的定義,稱滿足 a^(n-1) mod n = 1的合數n叫
做以a為底的偽素數(pseudoprime to base a)
。前10億個自然數中同時以2和3為底的偽素數只有1272個,這個數目不到剛才的1/4。這告訴我們如果同時驗證a=2
和a=3兩種情況,算法出錯的概率
降到了0.000025。容易想到,選擇用來測試的a越多,算法越準確。通常我們的做法是,隨機選擇
若干個小于待測數的正整數作為底數a進行若干次測試,只要有一次沒有通過測試就立即把這個數扔回合數的世界。
這就是Fermat素性測試。
人們自然會想,如果考慮了所有小于n的底數 a,出錯的概率是否就可以降到0呢?沒想到的是,居然就有這樣的合數,
它可以通過所有a的測試
(這個說法不準確,詳見我在地核樓層的回復)。 Carmichael第一個發現這樣極端的偽素數,他把它們稱作Carmichael數。
你一定會以為這樣的數一定很大。錯。第一個Carmichael 數小得驚人,僅僅是一個三位數,561。前10億個自然數中
Carmichael數也有600個之多。Carmichael數的存在說明,我們還需要繼續加強素性判斷的算法。
Miller和Rabin兩個人的工作讓Fermat素性測試邁出了革命性的一步,建立了傳說中的 Miller-Rabin素性測試算法。新的測
試基于下面的定理:如果p是素數,x是小于p的正整數,且x^2 mod p = 1,那么要么x=1,要么x=p-1。這是顯然的,因為
x^2 mod p = 1相當于p能整除x^2-1,也即p能整除(x+1)(x-1)。由于p是素數,那么只可能是x-1能被p整除(此時x=1)或x+1能
被p整除(此時x =p-1)。
這就是Miller-Rabin素性測試的方法。不斷地提取指數n-1中的因子2,把n-1表示成d*2^r(其中d是一個奇數)。那么
我們需要計算的東西就變成了a的d*2^r次方除以n的余數。于是,a^(d * 2^(r-1))要么等于1,要么等于n-1。
如果a^(d * 2^(r-1))等于1,定理繼續適用于a^(d * 2^(r-2)),這樣不斷開方開下去,直到對于某個i滿足
a^(d * 2^i) mod n = n-1或者最后指數中的2用完了得到的a^d mod n=1或n-1。這樣,Fermat小定理加強為如下形式:
盡可能提取因子 2,把n-1表示成d*2^r,如果n是一個素數,那么或者a^d mod n=1,或者存在某個i使得a^(d*2^i) mod n=n-1 ( 0<=i<r )
(注意i可以等于0,這就把a^d mod n=n-1的情況統一到后面去了)
Miller-Rabin 素性測試同樣是不確定算法,我們把可以通過以a為底的Miller-Rabin測試的合數稱作以a為底的強偽素
數(strong pseudoprime)。
第一個以2為底的強偽素數為2047。第一個以2和3為底的強偽素數則大到1 373 653。
Miller- Rabin算法的代碼也非常簡單:計算d和r的值(可以用位運算加速),然后二分計算a^d mod n的值
,最后把它平方r次。程序的代碼比想像中的更簡單,我寫一份放在下邊。雖然我已經轉C了,但我相信還有很多
人看不懂C語言。我再寫一次Pascal 吧。函數IsPrime返回對于特定的底數a,n是否是能通過測試。如果函數返回
False,那說明n不是素數;如果函數返回True,那么n極有可能是素數。注意這個代碼的數據范圍限制在longint,
你很可能需要把它們改成int64或高精度計算。
我們下面來演示一下上面的定理如何應用在Fermat素性測試上。前面說過341可以通過以2為底的Fermat測試,
因為 2^340 mod 341=1。如果341真是素數的話,那么2^170 mod 341只可能是1或340;當算得2^170 mod 341確實等于
1時,我們可以繼續查看2^85除以341的結果。我們發現,2^85 mod 341=32,這一結果摘掉了341頭上的素數皇冠,
面具后面真實的嘴臉顯現了出來
對于大數的素性判斷,目前Miller-Rabin算法應用最廣泛。一般底數仍然是隨機選取,但當待測數不太大時,
選擇測試底數就有一些技巧了。比如,如果被測數小于4 759 123 141,那么只需要測試三個底數2, 7和61就足
夠了。當然,你測試的越多,正確的范圍肯定也越大。如果你每次都用前7個素數(2, 3, 5, 7, 11, 13和17)進行
測試,所有不超過341 550 071 728 320的數都是正確的。如果選用2, 3, 7, 61和24251作為底數,那么10^16內
唯一的強偽素數為46 856 248 255 981。這樣的一些結論使得Miller-Rabin算法在OI中非常實用。通常認為,Miller-Rabin素性測試
的正確率可以令人接受,隨機選取 k個底數進行測試算法的失誤率大概為4^(-k)。
posted on 2008-09-23 13:26
zoyi 閱讀(3538)
評論(6) 編輯 收藏 引用 所屬分類:
acm 、
數學