哈希算法
- 什么是hash函數(shù)?
- 常見的hash算法
- hashlib的用法
- hash算法的用途
什么是hash函數(shù)组橄?
哈希函數(shù)荞膘,又稱哈希算法,它通過一個(gè)函數(shù)玉工,把任意長(zhǎng)度的數(shù)據(jù)轉(zhuǎn)換為一個(gè)長(zhǎng)度固定的數(shù)據(jù)串(通常用16進(jìn)制的字符串表示)羽资。
Hash算法特別的地方在于它是一種單向算法,用戶可以通過Hash算法對(duì)目標(biāo)信息生成一段特定長(zhǎng)度的唯一的Hash值遵班,卻不能通過這個(gè)Hash值重新獲得目標(biāo)信息屠升。因此Hash算法常用在不可還原的密碼存儲(chǔ)、信息完整性校驗(yàn)等狭郑。
hash值的兩個(gè)特性
抗碰撞能力:對(duì)于任意兩個(gè)不同的數(shù)據(jù)塊腹暖,其hash值相同的可能性極小翰萨;對(duì)于一個(gè)給定的數(shù)據(jù)塊脏答,找到和它hash值相同的數(shù)據(jù)塊極為困難。
抗篡改能力:對(duì)于一個(gè)數(shù)據(jù)塊亩鬼,哪怕只改動(dòng)其一個(gè)比特位殖告,其hash值的改動(dòng)也會(huì)非常大。
常用的hash算法
常見的Hash算法有MD2雳锋、MD4丛肮、MD5、SHA1魄缚、SHA256和SHA512
加密算法的效能通潮τ耄可以按照算法本身的復(fù)雜程度、密鑰長(zhǎng)度(密鑰越長(zhǎng)越安全)冶匹、加解密速度等來衡量习劫。上述的算法中,MD2速度較慢已逐漸被淘汰外嚼隘,其他算法仍在目前的加密系統(tǒng)產(chǎn)品中使用诽里。
MD5的全稱是Message-Digest Algorithm 5(信息-摘要算法)。
MD5的結(jié)果是128bit字節(jié)飞蛹,通常由32位16進(jìn)制字符串表示谤狡。
具有很高的安全性灸眼。它對(duì)應(yīng)任何字符串都可以加密成一段唯一的固定長(zhǎng)度的代碼。
SHA1的全稱是Secure Hash Algorithm(安全哈希算法) 。SHA1基于MD5,加密后的數(shù)據(jù)長(zhǎng)度更長(zhǎng)伟件,
它對(duì)長(zhǎng)度小于264的輸入援奢,產(chǎn)生長(zhǎng)度為160bit的散列值呜袁,比MD5多32bit,通常由40位的16進(jìn)制字符串表示。
因此,比MD5更加安全闪唆,但SHA1的運(yùn)算速度就比MD5要慢了。
hashlib的用法
下面以算法MD5為例钓葫,計(jì)算一個(gè)字符串的MD5值:
import hashlib
md5 = hashlib.md5()
md5.update("how to use md5 in python hashlib?")
print md5.hexdigest() # digest的意思是摘要悄蕾,hex是16進(jìn)制的意思
計(jì)算結(jié)果如下:
d26a53750bc40b38b65a520292f69306
另一種常見的摘要算法是SHA1:
import hashlib
sha1 = hashlib.sha1()
sha1.update("how to use sha1 in python hashlib?")
print sha1.hexdigest()
hash算法的用途
1.加密網(wǎng)站注冊(cè)用戶的密碼
在密碼學(xué)中,hash算法的主要作用是用于消息摘要和簽名础浮,主要用于消息的完整性校驗(yàn)笼吟。
hash算法不可逆,用于密文保存密碼的簽名霸旗,網(wǎng)站后臺(tái)只保存簽名值。
在上述場(chǎng)景下戚揭,對(duì)于抗碰撞和抗篡改能力要求極高诱告,對(duì)于速度要求在其次。
2.網(wǎng)站用戶上傳圖片/文件后民晒,計(jì)算出MD5值作為文件名
MD5可以保證唯一性精居。
3.key-value數(shù)據(jù)庫(kù)中使用MD5作為key
在使用hash進(jìn)行管理的數(shù)據(jù)結(jié)構(gòu)中,比如hashmap潜必,hash值(key)存在的目的是加速鍵值對(duì)的查找靴姿,key的作用是為了將元素適當(dāng)?shù)姆旁诟鱾€(gè)桶里,對(duì)抗碰撞的要求不是那么高磁滚。換句話說佛吓,hash出來的key,只要保證value大致均勻的放在不同的桶里就可以了垂攘。但整個(gè)算法的set性能维雇,直接與hash值產(chǎn)生的速度有關(guān),所以這時(shí)候的hash值的產(chǎn)生速度就尤為重要晒他。
4.比較兩個(gè)文件是否相同
大家在下載一些資源的時(shí)候吱型,就會(huì)發(fā)現(xiàn)網(wǎng)站提供了MD5值,就是用來檢測(cè)文件是否被篡改陨仅。
參考(侵刪):
1.python2.7 hashlib
2.到底什么是hash? - 之幽的回答 - 知乎
3.hashlib
4.常見的加密算法有哪些津滞?
5.在線加密解密
6.python中的MD5和SHA1加密