本文是一篇軟件加密技術的基礎性文章,簡要介紹了軟件加密的一些基本常識和一些加密產品,適用于國內軟件開發商或者個人共享軟件開發者閱讀參考。
1、加密技術概述
一個密碼系統的安全性只在于密鑰的保密性,而不在算法的保密性。
對純數據的加密的確是這樣。對于你不愿意讓他看到這些數據(數據的明文)的人,用可靠的加密算法,只要破解者不知道被加密數據的密碼,他就不可解讀這些數據。
但是,軟件的加密不同于數據的加密,它只能是“隱藏”。不管你愿意不愿意讓他(合法用戶,或 Cracker)看見這些數據(軟件的明文),軟件最終總要在機器上運行,對機器,它就必須是明文。既然機器可以“看見”這些明文,那么 Cracker,通過一些技術,也可以看到這些明文。
于是,從理論上,任何軟件加密技術都可以破解。只是破解的難度不同而已。有的要讓最高明的 Cracker 忙上幾個月,有的可能不費吹灰之力,就被破解了。
所以,反盜版的任務(技術上的反盜版,而非行政上的反盜版)就是增加 Cracker 的破解難度。讓他們花費在破解軟件上的成本,比他破解這個軟件的獲利還要高。這樣 Cracker 的破解變得毫無意義——誰會花比正版軟件更多的錢去買盜版軟件?
2、密碼學簡介
2.1?? 概念
(1) 發送者和接收者
假設發送者想發送消息給接收者,且想安全地發送信息:她想確信偷聽者不能閱讀發送的消息。
(2) 消息和加密
消息被稱為明文。用某種方法偽裝消息以隱藏它的內容的過程稱為加密,加了密的消息稱為密文,而把密文轉變為明文的過程稱為解密。
明文用M(消息)或P(明文)表示,它可能是比特流(文本文件、位圖、數字化的語音流或數字化的視頻圖像)。至于涉及到計算機,P是簡單的二進制數據。明文可被傳送或存儲,無論在哪種情況,M指待加密的消息。
密文用C表示,它也是二進制數據,有時和M一樣大,有時稍大(通過壓縮和加密的結合,C有可能比P小些。然而,單單加密通常達不到這一點)。加密函數E作用于M得到密文C,用數學表示為:
E(M)=C.
相反地,解密函數D作用于C產生M
D(C)=M.
先加密后再解密消息,原始的明文將恢復出來,下面的等式必須成立:
D(E(M))=M
(3) 鑒別、完整性和抗抵賴
除了提供機密性外,密碼學通常有其它的作用:.
(a) 鑒別
消息的接收者應該能夠確認消息的來源;入侵者不可能偽裝成他人。
?。╞) 完整性檢驗
消息的接收者應該能夠驗證在傳送過程中消息沒有被修改;入侵者不可能用假消息代替合法消息。
?。╟) 抗抵賴
發送者事后不可能虛假地否認他發送的消息。
(4) 算法和密鑰
密碼算法也叫密碼,是用于加密和解密的數學函數。(通常情況下,有兩個相關的函數:一個用作加密,另一個用作解密)
如果算法的保密性是基于保持算法的秘密,這種算法稱為受限制的算法。受限制的算法具有歷史意義,但按現在的標準,它們的保密性已遠遠不夠。大的或經常變換的用戶組織不能使用它們,因為每有一個用戶離開這個組織,其它的用戶就必須改換另外不同的算法。如果有人無意暴露了這個秘密,所有人都必須改變他們的算法。
更糟的是,受限制的密碼算法不可能進行質量控制或標準化。每個用戶組織必須有他們自己的唯一算法。這樣的組織不可能采用流行的硬件或軟件產品。但竊聽者卻可以買到這些流行產品并學習算法,于是用戶不得不自己編寫算法并予以實現,如果這個組織中沒有好的密碼學家,那么他們就無法知道他們是否擁有安全的算法。
盡管有這些主要缺陷,受限制的算法對低密級的應用來說還是很流行的,用戶或者沒有認識到或者不在乎他們系統中內在的問題。
現代密碼學用密鑰解決了這個問題,密鑰用K表示。K可以是很多數值里的任意值。密鑰K的可能值的范圍叫做密鑰空間。加密和解密運算都使用這個密鑰(即運算都依賴于密鑰,并用K作為下標表示),這樣,加/解密函數現在變成:
EK(M)=C
DK(C)=M.
DK(EK(M))=M.
有些算法使用不同的加密密鑰和解密密鑰,也就是說加密密鑰K1與相應的解密密鑰K2不同,在這種情況下:
EK1(M)=C
DK2(C)=M
DK2 (EK1(M))=M
所有這些算法的安全性都基于密鑰的安全性;而不是基于算法的細節的安全性。這就意味著算法可以公開,也可以被分析,可以大量生產使用算法的產品,即使偷聽者知道你的算法也沒有關系;如果他不知道你使用的具體密鑰,他就不可能閱讀你的消息。
密碼系統由算法、以及所有可能的明文、密文和密鑰組成的。
基于密鑰的算法通常有兩類:對稱算法和公開密鑰算法。下面將分別介紹:
2.2?? 對稱密碼算法
對稱算法有時又叫傳統密碼算法,就是加密密鑰能夠從解密密鑰中推算出來,反過來也成立。在大多數對稱算法中,加/解密密鑰是相同的。這些算法也叫秘密密鑰算法或單密鑰算法,它要求發送者和接收者在安全通信之前,商定一個密鑰。對稱算法的安全性依賴于密鑰,泄漏密鑰就意味著任何人都能對消息進行加/解密。只要通信需要保密,密鑰就必須保密。
對稱算法的加密和解密表示為:
EK(M)=C
DK(C)=M
對稱算法可分為兩類。一次只對明文中的單個比特(有時對字節)運算的算法稱為序列算法或序列密碼。另一類算法是對明文的一組比特亞行運算,這些比特組稱為分組,相應的算法稱為分組算法或分組密碼?,F代計算機密碼算法的典型分組長度為64比特——這個長度大到足以防止分析破譯,但又小到足以方便使用(在計算機出現前,算法普遍地每次只對明文的一個字符運算,可認為是序列密碼對字符序列的運算)。
2.3?? 公開密碼算法
公開密鑰算法(也叫非對稱算法)是這樣設計的:用作加密的密鑰不同于用作解密的密鑰,而且解密密鑰不能根據加密密鑰計算出來(至少在合理假定的長時間內)。之所以叫做公開密鑰算法,是因為加密密鑰能夠公開,即陌生者能用加密密鑰加密信息,但只有用相應的解密密鑰才能解密信息。在這些系統中,加密密鑰叫做公開密鑰(簡稱公鑰),解密密鑰叫做私人密鑰(簡稱私鑰)。私人密鑰有時也叫秘密密鑰。為了避免與對稱算法混淆,此處不用秘密密鑰這個名字。
用公開密鑰K加密表示為
EK(M)=C.
雖然公開密鑰和私人密鑰是不同的,但用相應的私人密鑰解密可表示為:
DK(C)=M
有時消息用私人密鑰加密而用公開密鑰解密,這用于數字簽名(后面將詳細介紹),盡管可能產生混淆,但這些運算可分別表示為:
EK(M)=C
DK(C)=M
當前的公開密碼算法的速度,比起對稱密碼算法,要慢的多,這使得公開密碼算法在大數據量的加密中應用有限。
2.4?? 單向散列函數
單向散列函數 H(M) 作用于一個任意長度的消息 M,它返回一個固定長度的散列值 h,其中 h 的長度為 m .
輸入為任意長度且輸出為固定長度的函數有很多種,但單向散列函數還有使其單向的其它特性:
?。?) 給定 M ,很容易計算 h ;
?。?) 給定 h ,根據 H(M) = h 計算 M 很難 ;
?。?) 給定 M ,要找到另一個消息 M‘ 并滿足 H(M) = H(M’) 很難。
在許多應用中,僅有單向性是不夠的,還需要稱之為“抗碰撞”的條件:
要找出兩個隨機的消息 M 和 M‘,使 H(M) = H(M’) 滿足很難。
由于散列函數的這些特性,由于公開密碼算法的計算速度往往很慢,所以,在一些密碼協議中,它可以作為一個消息 M 的摘要,代替原始消息 M,讓發送者為 H(M) 簽名而不是對 M 簽名 .
如 SHA 散列算法用于數字簽名協議 DSA中。
2.5?? 數字簽名
提到數字簽名就離不開公開密碼系統和散列技術。
有幾種公鑰算法能用作數字簽名。在一些算法中,例如RSA,公鑰或者私鑰都可用作加密。用你的私鑰加密文件,你就擁有安全的數字簽名。在其它情況下,如DSA,算法便區分開來了??數字簽名算法不能用于加密。這種思想首先由Diffie和Hellman提出 .
基本協議是簡單的 :
(1) A 用她的私鑰對文件加密,從而對文件簽名。
(2) A 將簽名的文件傳給B.
(3) B用A的公鑰解密文件,從而驗證簽名。
這個協議中,只需要證明A的公鑰的確是她的。如果B不能完成第(3)步,那么他知道簽名是無效的。
這個協議也滿足以下特征:
?。?) 簽名是可信的。當B用A的公鑰驗證信息時,他知道是由A簽名的。
(2) 簽名是不可偽造的。只有A知道她的私鑰。
?。?) 簽名是不可重用的。簽名是文件的函數,并且不可能轉換成另外的文件。
?。?) 被簽名的文件是不可改變的。如果文件有任何改變,文件就不可能用A的公鑰驗證。
?。?) 簽名是不可抵賴的。B不用A的幫助就能驗證A的簽名。
在實際應用中,因為公共密碼算法的速度太慢,簽名者往往是對消息的散列簽名而不是對消息本身簽名。這樣做并不會降低簽名的可信性。
3??? 當前流行的一些軟件保護技術
3.1?? 序列號保護
數學算法一項都是密碼加密的核心,但在一般的軟件加密中,它似乎并不太為人們關心,因為大多數時候軟件加密本身實現的都是一種編程的技巧。但近幾年來隨著序列號加密程序的普及,數學算法在軟件加密中的比重似乎是越來越大了。
看看在網絡上大行其道的序列號加密的工作原理。當用戶從網絡上下載某個shareware——共享軟件后,一般都有使用時間上的限制,當過了共享軟件的試用期后,你必須到這個軟件的公司去注冊后方能繼續使用。注冊過程一般是用戶把自己的私人信息(一般主要指名字)連同信用卡號碼告訴給軟件公司,軟件公司會根據用戶的信息計算出一個序列碼,在用戶得到這個序列碼后,按照注冊需要的步驟在軟件中輸入注冊信息和注冊碼,其注冊信息的合法性由軟件驗證通過后,軟件就會取消掉本身的各種限制,這種加密實現起來比較簡單,不需要額外的成本,用戶購買也非常方便,在互聯網上的軟件80%都是以這種方式來保護的。
軟件驗證序列號的合法性過程,其實就是驗證用戶名和序列號之間的換算關系是否正確的過程。其驗證最基本的有兩種,一種是按用戶輸入的姓名來生成注冊碼,再同用戶輸入的注冊碼比較,公式表示如下:
序列號 = F(用戶名)
但這種方法等于在用戶軟件中再現了軟件公司生成注冊碼的過程,實際上是非常不安全的,不論其換算過程多么復雜,解密者只需把你的換算過程從程序中提取出來就可以編制一個通用的注冊程序。
另外一種是通過注冊碼來驗證用戶名的正確性,公式表示如下:
用戶名稱 = F逆(序列號) (如ACDSEE)
這其實是軟件公司注冊碼計算過程的反算法,如果正向算法與反向算法不是對稱算法的話,對于解密者來說,的確有些困難,但這種算法相當不好設計。
于是有人考慮到以下的算法:
F1(用戶名稱) = F2(序列號)
F1、F2是兩種完全不同的的算法,但用戶名通過F1算法計算出的特征字等于序列號通過F2算法計算出的特征字,這種算法在設計上比較簡單,保密性相對以上兩種算法也要好的多。如果能夠把F1、F2算法設計成不可逆算法的話,保密性相當的好;可一旦解密者找到其中之一的反算法的話,這種算法就不安全了。一元算法的設計看來再如何努力也很難有太大的突破,那么二元呢?
特定值 = F(用戶名,序列號)
這個算法看上去相當不錯,用戶名稱與序列號之間的關系不再那么清晰了,但同時也失去了用戶名于序列號的一一對應關系,軟件開發者必須自己維護用戶名稱與序列號之間的唯一性,但這似乎不是難以辦到的事,建個數據庫就可以了。當然也可以把用戶名稱和序列號分為幾個部分來構造多元的算法。
特定值 = F(用戶名1,用戶名2,...序列號1,序列號2...)
現有的序列號加密算法大多是軟件開發者自行設計的,大部分相當簡單。而且有些算法作者雖然下了很大的功夫,效果卻往往得不到它所希望的結果。
3.2?? 時間限制
有些程序的試用版每次運行都有時間限制,例如運行10分鐘或20分鐘就停止工作,必須重新運行該程序才能正常工作。這些程序里面自然有個定時器來統計程序運行的時間。
這種方法使用的較少。
3.3?? Key File 保護
Key File(注冊文件)是一種利用文件來注冊軟件的保護方式。Key File一般是一個小文件,可以是純文本文件,也可以是包含不可顯示字符的二進制文件,其內容是一些加密過或未加密的數據,其中可能有用戶名、注冊碼等信息。文件格式則由軟件作者自己定義。試用版軟件沒有注冊文件,當用戶向作者付費注冊之后,會收到作者寄來的注冊文件,其中可能包含用戶的個人信息。用戶只要將該文件放入指定的目錄,就可以讓軟件成為正式版。該文件一般是放在軟件的安裝目錄中或系統目錄下。軟件每次啟動時,從該文件中讀取數據,然后利用某種算法進行處理,根據處理的結果判斷是否為正確的注冊文件,如果正確則以注冊版模式來運行。
這種保護方法使用也不多。
3.4?? CD-check
即光盤保護技術。程序在啟動時判斷光驅中的光盤上是否存在特定的文件,如果不存在則認為用戶沒有正版光盤,拒絕運行。在程序運行的過程當中一般不再檢查光盤的存在與否。Windows下的具體實現一般是這樣的:先用GetLogicalDriveStrings( )或GetLogicalDrives( )得到系統中安裝的所有驅動器的列表,然后再用GetDriveType( )檢查每一個驅動器,如果是光驅則用CreateFileA( )或FindFirstFileA( )等函數檢查特定的文件存在與否,并可能進一步地檢查文件的屬性、大小、內容等。
3.5?? 軟件狗
軟件狗是一種智能型加密工具。它是一個安裝在并口、串口等接口上的硬件電路,同時有一套使用于各種語言的接口軟件和工具軟件。當被狗保護的軟件運行時,程序向插在計算機上的軟件狗發出查詢命令,軟件狗迅速計算查詢并給出響應,正確的響應保證軟件繼續運行。如果沒有軟件狗,程序將不能運行,復雜的軟硬件技術結合在一起防止軟件盜版。真正有商業價值得軟件一般都用軟件狗來保護。
平時常見的狗主要有“洋狗”(國外狗)和“土狗”(國產狗)。這里“洋狗”主要指美國的彩虹和以色列的HASP,“土狗”主要有金天地(現在與美國彩虹合資,叫“彩虹天地”)、深思、尖石??偟恼f來,“洋狗”在軟件接口、加殼、反跟蹤等“軟”方面沒有“土狗”好,但在硬件上破解難度非常大;而“土狗”在軟的方面做的很好,但在硬件上不如“洋狗”,稍有單片機功力的人,都可以復制。
3.6?? 軟盤加密
通過在軟盤上格式化一些非標準磁道,在這些磁道上寫入一些數據,如軟件的解密密鑰等等。這種軟盤成為“鑰匙盤”。軟件運行時用戶將軟盤插入,軟件讀取這些磁道中的數據,判斷是否合法的“鑰匙盤”。
軟盤加密還有其它一些技術,如弱位加密等等。
隨著近年來軟盤的沒落,這種方法基本上退出了歷史舞臺。
3.7?? 將軟件與機器硬件信息結合
用戶得到(買到或從網上下載)軟件后,安裝時軟件從用戶的機器上取得該機器的一些硬件信息(如硬盤序列號、BOIS序列號等等),然后把這些信息和用戶的序列號、用戶名等進行計算,從而在一定程度上將軟件和硬件部分綁定。用戶需要把這一序列號用Email、電話或郵寄等方法寄給軟件提供商或開發商,軟件開發商利用注冊機(軟件)產生該軟件的注冊號寄給用戶即可。軟件加密雖然加密強度比硬件方法較弱,但它具有非常廉價的成本、方便的使用方法等優點。非常適合做為采用光盤(CDROM)等方式發授軟件的加密方案。
此種加密算法的優點
·??? 不同機器注冊碼不同。用戶獲得一個密碼只能在一臺機器上注冊使用軟件。不同于目前大多軟件采用的注冊方法,即只要知道注冊碼,可在任何機器上安裝注冊。
·??? 不需要任何硬件或軟盤
·??? 可以選擇控制軟件運行在什么機器、運行多長時間或次數等
·??? 可讓軟件在不注冊前的功能為演示軟件,只能運行一段時間或部分功能。注冊后就立即變為正式軟件
·??? 采用特別技術,解密者很難找到產生注冊號碼的規律
·??? 在使用注冊號產生軟件(注冊機)時可采用使用密碼、密鑰盤、總次數限制等方法
·??? 方便易用,價格低廉。
這種加密還有以下特點
1、 注冊加密的軟件,只能在一臺機器上安裝使用。把軟件拷貝到其它機器上不能運行。
2、 若用戶想在另一機器上安裝運行,必須把軟件在這一機器上運行時的序列號,寄給軟件出版商換取注冊密碼。當然應再交一份軟件費用。
3、 此加密方法特別適應在因特網上發布的軟件及用光盤發布的軟件。
注釋:
1、“加密技術概述”部分內容參考了大學教材“密碼學基礎”。
2、“當前流行的一些軟件保護技術”部分內容參考了“加密與解密--軟件保護技術及完全解決方案”一文。