MD5的全稱是Message-Digest Algorithm 5,在90年代初由MIT的計算機(jī)科學(xué)實(shí)驗(yàn)室和RSA Data Security Inc發(fā)明,經(jīng)MD2、MD3和MD4發(fā)展而來。 MD5將任意長度的“字節(jié)串”變換成一個128bit的大整數(shù),并且它是一個不可逆的字符串變換算法,換句話說就是,即使你看到源程序和算法描述,也無法將一個MD5的值變換回原始的字符串,從數(shù)學(xué)原理上說,是因?yàn)樵嫉淖址袩o窮多個,這有點(diǎn)象不存在反函數(shù)的數(shù)學(xué)函數(shù)。
簡介 WinMD5 MD5簡介
Message-Digest泛指字節(jié)串(Message)的Hash變換,就是把一個任意長度的字節(jié)串變換成一定長的大整數(shù)。請注意我使用了“字節(jié)串”而不是“字符串”這個詞,是因?yàn)檫@種變換只與字節(jié)的值有關(guān),與字符集或編碼方式無關(guān)。
補(bǔ)位
MD5算法先對輸入的數(shù)據(jù)進(jìn)行補(bǔ)位,使得數(shù)據(jù)位長度LEN對512求余的結(jié)果是448。即數(shù)據(jù)擴(kuò)展至K*512+448位。即K*64+56個字節(jié),K為整數(shù)。
具體補(bǔ)位操作:補(bǔ)一個1,然后補(bǔ)0至滿足上述要求。
補(bǔ)數(shù)據(jù)長度
用一個64位的數(shù)字表示數(shù)據(jù)的原始長度B,把B用兩個32位數(shù)表示。這時,數(shù)據(jù)就被填補(bǔ)成長度為512位的倍數(shù)。
初始化MD5參數(shù)
四個32位整數(shù) (A,B,C,D) 用來計算信息摘要,初始化使用的是十六進(jìn)制表示的數(shù)字
A=0X01234567
B=0X89abcdef
C=0Xfedcba98
D=0X76543210
處理位操作函數(shù)
X,Y,Z為32位整數(shù)。
F(X,Y,Z) = X&Y|NOT(X)&Z
G(X,Y,Z) = X&Z|Y?(Z)
H(X,Y,Z) = X xor Y xor Z
I(X,Y,Z) = Y xor (X|not(Z))
主要變換過程
使用常數(shù)組T[1 ... 64], T為32位整數(shù)用16進(jìn)制表示,數(shù)據(jù)用16個32位的整數(shù)數(shù)組M[]表示。
具體過程如下:
/* 處理數(shù)據(jù)原文 */
For i = 0 to N/16-1 do
/*每一次,把數(shù)據(jù)原文存放在16個元素的數(shù)組X中. */
For j = 0 to 15 do
Set X[j] to M[i*16+j].
end /結(jié)束對J的循環(huán)
/* Save A as AA, B as BB, C as CC, and D as DD.*/
AA = A
BB = B
CC = C
DD = D
/* 第1輪*/
/* 以 [abcd k s i]表示如下操作 a = b + ((a + F(b,c,d) + X[k] + T) <<< s). */
/* Do the following 16 operations. */
[ABCD 0 7 1] [DABC 1 12 2] [CDAB 2 17 3] [BCDA 322 4]
[ABCD 4 7 5] [DABC 5 12 6] [CDAB 6 17 7] [BCDA 722 8]
[ABCD 8 7 9] [DABC 9 12 10] [CDAB 10 17 11] [BCDA11 22 12]
[ABCD 12 7 13] [DABC 13 12 14] [CDAB 14 17 15] [BCDA 15 22 16]
/* 第2輪* */
/* 以 [abcd k s i]表示如下操作 a = b + ((a + G(b,c,d) + X[k] + T) <<< s). */
/* Do the following 16 operations. */
[ABCD 1 5 17] [DABC 6 9 18] [CDAB 11 14 19] [BCDA0 20 20]
[ABCD 5 5 21] [DABC 10 9 22] [CDAB 15 14 23] [BCDA 4 20 24]
[ABCD 9 5 25] [DABC 14 9 26] [CDAB 3 14 27] [BCDA8 20 28]
[ABCD 13 5 29] [DABC 2 9 30] [CDAB 7 14 31] [BCDA12 20 32]
/* 第3輪*/
/* 以 [abcd k s i]表示如下操作 a = b + ((a + H(b,c,d) + X[k] + T) <<< s). */
/* Do the following 16 operations. */
[ABCD 5 4 33] [DABC 8 11 34] [CDAB 11 16 35] [BCDA 14 23 36]
[ABCD 1 4 37] [DABC 4 11 38] [CDAB 7 16 39] [BCDA10 23 40]
[ABCD 13 4 41] [DABC 0 11 42] [CDAB 3 16 43] [BCDA 6 23 44]
[ABCD 9 4 45] [DABC 12 11 46] [CDAB 15 16 47] [BCDA 2 23 48]
/* 第4輪*/
/* 以 [abcd k s i]表示如下操作 a = b + ((a + I(b,c,d) + X[k] + T) <<< s). */
/* Do the following 16 operations. */
[ABCD 0 6 49] [DABC 7 10 50] [CDAB 14 15 51] [BCDA 5 21 52]
[ABCD 12 6 53] [DABC 3 10 54] [CDAB 10 15 55] [BCDA 1 21 56]
[ABCD 8 6 57] [DABC 15 10 58] [CDAB 6 15 59] [BCDA 13 21 60]
[ABCD 4 6 61] [DABC 11 10 62] [CDAB 2 15 63] [BCDA 9 21 64]
輸出結(jié)果
/* 然后進(jìn)行如下操作,輸出結(jié)果 */
A = A + AA
B = B + BB
C = C + CC
D = D + DD
end /* 結(jié)束對I的循環(huán)*/
輸出結(jié)果
應(yīng)用
數(shù)字簽名
MD5的典型應(yīng)用是對一段Message(字節(jié)串)產(chǎn)生fingerprint(指紋),以防止被“篡改”。舉個例子,你將一段話寫在一個叫 readme.txt文件中,并對這個readme.txt產(chǎn)生一個MD5的值并記錄在案,然后你可以傳播這個文件給別人,別人如果修改了文件中的任何內(nèi)容,你對這個文件重新計算MD5時就會發(fā)現(xiàn)。如果再有一個第三方的認(rèn)證機(jī)構(gòu),用MD5還可以防止文件作者的“抵賴”,這就是所謂的數(shù)字簽名應(yīng)用。
加密和解密
MD5還廣泛用于加密和解密技術(shù)上,在很多操作系統(tǒng)中,用戶的密碼是以MD5值(或類似的其它算法)的方式保存的, 用戶Login的時候,系統(tǒng)是把用戶輸入的密碼計算成MD5值,然后再去和系統(tǒng)中保存的MD5值進(jìn)行比較,而系統(tǒng)并不“知道”用戶的密碼是什么。
一些黑客破獲這種密碼的方法是一種被稱為“跑字典”的方法。有兩種方法得到字典,一種是日常搜集的用做密碼的字符串表,另一種是用排列組合方法生成的,先用MD5程序計算出這些字典項的MD5值,然后再用目標(biāo)的MD5值在這個字典中檢索。
即使假設(shè)密碼的最大長度為8,同時密碼只能是字母和數(shù)字,共26+26+10=62個字符,排列組合出的字典的項數(shù)則是P(62,1)+P (62,2)….+P(62,8),那也已經(jīng)是一個很天文的數(shù)字了,存儲這個字典就需要TB級的磁盤組,而且這種方法還有一個前提,就是能獲得目標(biāo)賬戶的密碼MD5值的情況下才可以。
在很多電子商務(wù)和社區(qū)應(yīng)用中,管理用戶的Account是一種最常用的基本功能,盡管很多 Application Server提供了這些基本組件,但很多應(yīng)用開發(fā)者為了管理的更大的靈活性還是喜歡采用關(guān)系數(shù)據(jù)庫來管理用戶,懶惰的做法是用戶的密碼往往使用明文或簡單的變換后直接保存在數(shù)據(jù)庫中,因此這些用戶的密碼對軟件開發(fā)者或系統(tǒng)管理員來說可以說毫無保密可言。