加密算法的分類
- 對(duì)稱加密
采用對(duì)稱秘鑰的加密系統(tǒng),加密、解密過(guò)程均采用同一把秘鑰箩艺,通信雙方必須同時(shí)獲得這把鑰匙進(jìn)行加密解密操作居凶。
常見(jiàn)對(duì)稱加密:DES药蜻,3DES视卢,AES - 非對(duì)稱加密
非對(duì)稱加密系統(tǒng)采用的加密解密秘鑰是不同的蝶俱,加密的稱為公鑰庸队,解密的稱為私鑰宾尚。公鑰加密私鑰解密锥忿、私鑰簽名公鑰驗(yàn)證钉答。
常見(jiàn)的非對(duì)稱算法:RSA虏缸,DSA宰缤,ECC - 哈希函數(shù)加密算法
無(wú)需借助任何秘鑰氧骤,Hash算法嚴(yán)格上來(lái)說(shuō)并不屬于加密算法并思,而是與加密算法屬于并列關(guān)系的一種算法仙畦。概括來(lái)說(shuō)碉京,哈希(Hash)是將目標(biāo)文本轉(zhuǎn)換成具有相同長(zhǎng)度的界弧、不可逆的雜湊字符串(或叫做消息摘要)帅掘,而加密(Encrypt)是將目標(biāo)文本轉(zhuǎn)換成具有不同長(zhǎng)度的委煤、可逆的密文。
常見(jiàn)的哈希加密算法:MD5,SHA-1寓免,SHA-2
哈希函數(shù)特點(diǎn)
- 單向不可逆
哈希算法是一種單向密碼體制,即只有加密過(guò)程,沒(méi)有解密過(guò)程欠母,很難通過(guò)結(jié)果推算出輸入值,而對(duì)稱和非對(duì)稱加密算法都是通過(guò)秘鑰反向推導(dǎo)密碼原文。 - 可重復(fù)性
相同輸入經(jīng)過(guò)同一哈希函數(shù)得到相同散列值阵谚,但并非散列值相同則輸入結(jié)果相同。 - 抗沖突性
不同的輸入數(shù)據(jù)烟具,經(jīng)過(guò)同一散列函數(shù)梢什,產(chǎn)生的散列值不相同,相同則產(chǎn)生哈希沖突朝聋,嗡午。對(duì)原始信息的任何一點(diǎn)改變都會(huì)導(dǎo)致結(jié)果的哈希值巨大的不同。舉個(gè)例子冀痕,假如原始數(shù)據(jù)是幾百萬(wàn)字的文章荔睹,你在其中哪怕改動(dòng)一個(gè)標(biāo)點(diǎn)狸演,計(jì)算出的哈希值都會(huì)有很大的變化。 - 輸出長(zhǎng)度固定
無(wú)論輸入的源數(shù)據(jù)的長(zhǎng)度是多少僻他,同一種Hash算法轉(zhuǎn)換后結(jié)果的長(zhǎng)度都相同宵距,而加密轉(zhuǎn)換后結(jié)果的長(zhǎng)度一般與源數(shù)據(jù)的長(zhǎng)度正相關(guān)。MD5的返回值總是128bit,SHA-1的返回值是160bit,都是固定長(zhǎng)度献联,MD5如果按十六進(jìn)制表示的話是32位十六進(jìn)制的數(shù),SHA-1是40位十六進(jìn)制的數(shù)哨鸭。
MD5
MD5即Message-Digest Algorithm 5(信息摘要算法5),是計(jì)算機(jī)廣泛使用的散列算法之一娇妓。經(jīng)MD2像鸡、MD3和MD4發(fā)展而來(lái),誕生于20世紀(jì)90年代初哈恰。用于確保信息傳輸完整一致只估。雖然已被破解,但仍然具有較好的安全性蕊蝗,加之可以免費(fèi)使用仅乓,所以仍廣泛運(yùn)用于數(shù)字簽名、文件完整性驗(yàn)證以及口令加密等領(lǐng)域蓬戚。
算法原理:
- 數(shù)據(jù)填充
對(duì)消息進(jìn)行數(shù)據(jù)填充,使消息的長(zhǎng)度對(duì)512取模得448宾抓,設(shè)消息長(zhǎng)度為X子漩,即滿足X mod 512=448。根據(jù)此公式得出需要填充的數(shù)據(jù)長(zhǎng)度石洗。填充方法:在消息后面進(jìn)行填充幢泼,填充第一位為1,其余為0讲衫。 - 添加消息長(zhǎng)度
在第一步結(jié)果之后再填充上原消息的長(zhǎng)度缕棵,可用來(lái)進(jìn)行的存儲(chǔ)長(zhǎng)度為64位。如果消息長(zhǎng)度大于264涉兽,則只使用其低64位的值招驴,即(消息長(zhǎng)度 對(duì) 264取模)。在此步驟進(jìn)行完畢后枷畏,最終消息長(zhǎng)度就是512的整數(shù)倍别厘。 - 數(shù)據(jù)處理
準(zhǔn)備需要用到的數(shù)據(jù):
4個(gè)常數(shù): A = 0x67452301, B = 0x0EFCDAB89, C = 0x98BADCFE, D = 0x10325476;
4個(gè)函數(shù):F(X,Y,Z)=(X & Y) | ((~X) & Z); G(X,Y,Z)=(X & Z) | (Y & (~Z)); H(X,Y,Z)=X ^ Y ^ Z; I(X,Y,Z)=Y ^ (X | (~Z));
把消息分以512位為一分組進(jìn)行處理,每一個(gè)分組進(jìn)行4輪變換拥诡,以上面所說(shuō)4個(gè)常數(shù)為起始變量進(jìn)行計(jì)算触趴,重新輸出4個(gè)變量氮发,以這4個(gè)變量再進(jìn)行下一分組的運(yùn)算,如果已經(jīng)是最后一個(gè)分組冗懦,則這4個(gè)變量為最后的結(jié)果爽冕,即MD5值。
哈希沖突(碰撞)
散列算法得到的結(jié)果位數(shù)是有限的披蕉,比如MD5算法計(jì)算出的結(jié)果字長(zhǎng)為128位颈畸,意味著只要我們窮舉2^128次,就肯定能得到一組碰撞嚣艇,下面讓我們來(lái)看看一個(gè)真實(shí)的碰撞案例承冰。我們之所以說(shuō)MD5過(guò)時(shí),是因?yàn)樗谀承r(shí)候已經(jīng)很難表現(xiàn)出散列算法的某些優(yōu)勢(shì)——比如在應(yīng)對(duì)文件的微小修改時(shí)食零,散列算法得到的指紋結(jié)果應(yīng)當(dāng)有顯著的不同困乒,而下面的程序說(shuō)明了MD5并不能實(shí)現(xiàn)這一點(diǎn)。
import hashlib
# 兩段HEX字節(jié)串贰谣,注意它們有細(xì)微差別
a = bytearray.fromhex("0e306561559aa787d00bc6f70bbdfe3404cf03659e704f8534c00ffb659c4c8740cc942feb2da115a3f4155cbb8607497386656d7d1f34a42059d78f5a8dd1ef")
b = bytearray.fromhex("0e306561559aa787d00bc6f70bbdfe3404cf03659e744f8534c00ffb659c4c8740cc942feb2da115a3f415dcbb8607497386656d7d1f34a42059d78f5a8dd1ef")
# 輸出MD5娜搂,它們的結(jié)果一致
print(hashlib.md5(a).hexdigest())
print(hashlib.md5(b).hexdigest())
### a和b輸出結(jié)果都為:
cee9a457e790cf20d4bdaa6d69f01e41
cee9a457e790cf20d4bdaa6d69f01e41
而諸如此類的碰撞案例還有很多,上面只是原始文件相對(duì)較小的一個(gè)例子吱抚。事實(shí)上現(xiàn)在我們用智能手機(jī)只要數(shù)秒就能找到MD5的一個(gè)碰撞案例百宇,因此,MD5在數(shù)年前就已經(jīng)不被推薦作為應(yīng)用中的散列算法方案秘豹,取代它的是SHA家族算法携御,也就是安全散列算法(Secure Hash Algorithm,縮寫為SHA)既绕。
SHA
SHA實(shí)際包括有一系列算法啄刹,分別是SHA-1、SHA-224凄贩、SHA-256誓军、SHA-384以及SHA-512。而我們所說(shuō)的SHA2實(shí)際是對(duì)后面4中的統(tǒng)稱疲扎。各種SHA算法的數(shù)據(jù)比較如下表昵时,其中的長(zhǎng)度單位均為位:
MD5和SHA1,它們都有4個(gè)邏輯函數(shù)椒丧,而在SHA2的一系列算法中都采用了6個(gè)邏輯函數(shù)壹甥。
以SHA-1為例,算法包括有如下的處理過(guò)程:
- 對(duì)輸入信息進(jìn)行處理及填充長(zhǎng)度信息
和MD5處理輸入方式相同
- 信息分組處理
經(jīng)過(guò)添加位數(shù)處理的明文瓜挽,其長(zhǎng)度正好為512位的整數(shù)倍盹廷,然后按512位的長(zhǎng)度進(jìn)行分組,可以得到一定數(shù)量的明文分組,我們用Y0俄占,Y1管怠,……YN-1表示這些明文分組。對(duì)于每一個(gè)明文分組缸榄,都要重復(fù)反復(fù)的處理渤弛,這些與MD5都是相同的。
而對(duì)于每個(gè)512位的明文分組甚带,SHA1將其再分成16份更小的明文分組她肯,稱為子明文分組,每個(gè)子明文分組為32位鹰贵,我們且使用M[t](t= 0, 1,……15)來(lái)表示這16個(gè)子明文分組晴氨。然后需要將這16個(gè)子明文分組擴(kuò)充到80個(gè)子明文分組,我們將其記為W[t](t= 0, 1,……79)碉输,擴(kuò)充的具體方法是:當(dāng)0≤t≤15時(shí)籽前,Wt = Mt;當(dāng)16≤t≤79時(shí)敷钾,Wt = ( Wt-3 ⊕ Wt-8⊕ Wt-14⊕ Wt-16) <<< 1枝哄,從而得到80個(gè)子明文分組。
- 初始化緩存
所謂初始化緩存就是為鏈接變量賦初值阻荒。前面我們實(shí)現(xiàn)MD5算法時(shí)挠锥,說(shuō)過(guò)由于摘要是128位,以32位為計(jì)算單位侨赡,所以需要4個(gè)鏈接變量蓖租。同樣SHA-1采用160位的信息摘要,也以32位為計(jì)算長(zhǎng)度羊壹,就需要5個(gè)鏈接變量菜秦。我們記為A、B舶掖、C、D尔店、E眨攘。其初始賦值分別為:A = 0x67452301、B = 0xEFCDAB89嚣州、C = 0x98BADCFE鲫售、D = 0x10325476、E = 0xC3D2E1F0该肴。
如果我們對(duì)比前面說(shuō)過(guò)的MD5算法就會(huì)發(fā)現(xiàn)情竹,前4個(gè)鏈接變量的初始值是一樣的,因?yàn)樗鼈儽緛?lái)就是同源的匀哄。
- 計(jì)算信息摘要
經(jīng)過(guò)前面的準(zhǔn)備秦效,接下來(lái)就是計(jì)算信息摘要了雏蛮。SHA1有4輪運(yùn)算,每一輪包括20個(gè)步驟阱州,一共80步挑秉,最終產(chǎn)生160位的信息摘要,這160位的摘要存放在5個(gè)32位的鏈接變量中苔货。
在SHA1的4論運(yùn)算中犀概,雖然進(jìn)行的就具體操作函數(shù)不同,但邏輯過(guò)程卻是一致的夜惭。首先姻灶,定義5個(gè)變量,假設(shè)為H0诈茧、H1产喉、H2、H3若皱、H4镊叁,對(duì)其分別進(jìn)行如下操作:
(A)、將A左移5為與 函數(shù)的結(jié)果求和走触,再與對(duì)應(yīng)的子明文分組晦譬、E以及計(jì)算常數(shù)求和后的結(jié)果賦予H0。
(B)互广、將A的值賦予H1敛腌。
(C)、將B左移30位惫皱,并賦予H2像樊。
(D)、將C的值賦予H3旅敷。
(E)生棍、將D的值賦予H4。
(F)媳谁、最后將H0涂滴、H1、H2晴音、H3柔纵、H4的值分別賦予A、B锤躁、C搁料、D
這一過(guò)程表示如下:
而在4輪80步的計(jì)算中使用到的函數(shù)和固定常數(shù)如下表所示:
經(jīng)過(guò)4輪80步計(jì)算后得到的結(jié)果,再與各鏈接變量的初始值求和,就得到了我們最終的信息摘要郭计。而對(duì)于有多個(gè)明文分組的霸琴,則將前面所得到的結(jié)果作為初始值進(jìn)行下一明文分組的計(jì)算,最終計(jì)算全部的明文分組就得到了最終的結(jié)果拣宏。