簡介
MD5(RFC 1321)的全稱是Message-Digest Algorithm 5,在90年代初由MIT的計算機科學(xué)實驗室和RSA Data Security Inc發(fā)明,經(jīng)MD2、MD3和MD4發(fā)展而來。它對輸入仍以512位分組,其輸出是4個32位字的級聯(lián),與 MD4 相同。MD5比MD4來得復(fù)雜,并且速度較之要慢一點,但更安全,在抗分析和抗差分方面表現(xiàn)更好。
原理
Message-Digest泛指字節(jié)串(Message)的Hash變換,就是把一個任意長度的字節(jié)串變換成一定長的大整數(shù)。請注意我使用了“字節(jié)串”而不是“字符串”這個詞,是因為這種變換只與字節(jié)的值有關(guān),與字符集或編碼方式無關(guān)。
MD5將任意長度的“字節(jié)串”變換成一個128bit的大整數(shù),并且它是一個不可逆的字符串變換算法,換句話說就是,即使你看到源程序和算法描述,也無法將一個MD5的值變換回原始的字符串,從數(shù)學(xué)原理上說,是因為原始的字符串有無窮多個,這有點象不存在反函數(shù)的數(shù)學(xué)函數(shù)。
應(yīng)用
1. 防止被篡改:
1) 比如發(fā)送一個電子文檔,發(fā)送前,我先得到MD5的輸出結(jié)果a。然后在對方收到電子文檔后,對方也得到一個MD5的輸出結(jié)果b。如果a與b一樣就代表中 途未被篡改。
2)比如我提供文件下載,為了防止不法分子在安裝程序中添加木馬,我可以在網(wǎng)站上公布由安裝文件得到的MD5輸出結(jié)果。
3)SVN在檢測文件 是否在CheckOut后被修改過,也是用到了MD5.
2. 防止直接看到明文:
現(xiàn)在很多網(wǎng)站在數(shù)據(jù)庫存儲用戶的密碼的時候都是存儲用戶密碼的MD5值。這樣就算不法分子得到數(shù)據(jù)庫的用戶密碼的MD5值,也無法知道用戶的密碼(其實這樣是不安全的,后面我會提到)。(比如在UNIX系統(tǒng)中用戶的密碼就是以MD5(或其它類似的算法)經(jīng)加密后存儲在文件系統(tǒng)中。當(dāng)用戶登錄的時候,系統(tǒng)把用戶輸入的密碼計算成MD5值,然后再去和保存在文件系統(tǒng)中的MD5值進(jìn)行比較,進(jìn)而確定輸入的密碼是否正確。通過這樣的步驟,系統(tǒng)在并不知道用戶密碼的明碼的情況下就可以確定用戶登錄系統(tǒng)的合法性。這不但可以避免用戶的密碼被具有系統(tǒng)管理員權(quán)限的用戶知道,而且還在一定程度上增加了密碼被破解的難度。)
3. 防止抵賴(數(shù)字簽名):
這需要一個第三方認(rèn)證機構(gòu)。例如A寫了一個文件,認(rèn)證機構(gòu)對此文件用MD5算法產(chǎn)生摘要信息并做好記錄。若以后A說這文件不是他寫的,權(quán)威機構(gòu)只需對此文件重新產(chǎn)生摘要信息,然后跟記錄在冊的摘要信息進(jìn)行比對,相同的話,就證明是A寫的了。這就是所謂的“數(shù)字簽名”。
C源代碼
http://people.csail.mit.edu/rivest/Md5.c
C API用法
在MD5的C源碼里,由一個struct和三個函數(shù)協(xié)同完成工作:
/* typedef a 32 bit type */typedef unsigned long int UINT4;/* Data structure for MD5 (Message Digest) computation */typedef struct {UINT4 i[2]; /* number of _bits_ handled mod 2^64 */UINT4 buf[4]; /* scratch buffer */unsigned char in[64]; /* 512bit input buffer */ unsigned char digest[16]; /* actual digest after MD5Final call */} MD5_CTX;void MD5Init(MD5_CTX *mdContext);void MD5Update(MD5_CTX *mdContext, unsigned char *inBuf, unsigned int inLen);void MD5Final(MD5_CTX *mdContext);像下面這樣使用:
void TestMD5() { // 初始化一次 MD5_CTX mdContext; MD5Init(&mdContext); // 獲取輸入緩沖區(qū),可以重復(fù)調(diào)用此函數(shù)以應(yīng)對多個緩沖區(qū) // 其內(nèi)部以MD5Transform迭代數(shù)次以對若干512bits分組加密 unsigned char inBuffer[] = "hello, world!"; MD5Update(&mdContext, inBuffer, sizeof(inBuffer)/sizeof(*inBuffer)); // 產(chǎn)生最終128位(16字節(jié))加密結(jié)果,保存在mdContext.digest MD5Final(&mdContext); }下面是個簡單的計算文件MD5的函數(shù)
void TestGUtMD5( const char* fileName ) { MD5Context mdContext; MD5Init( &mdContext ); FILE* filePointer = fopen( fileName, "rb" ); unsigned char buffer[ 1024 ] = { 0 }; while ( true ) { int readByteCount = fread( buffer, 1, 1024, filePointer ); if ( readByteCount <= 0 ) { break; } MD5Update( &mdContext, buffer, readByteCount ); } fclose( filePointer ); MD5Final( &mdContext ); for ( int i = 0 ;i < 16; ++i) { cout << hex << (int)mdContext.digest[i]; }}