【作者】張輝,就職于攜程技術(shù)中心信息安全部刽射,負(fù)責(zé)安全產(chǎn)品的設(shè)計(jì)與研發(fā)轻掩。
作為互聯(lián)網(wǎng)公司的信息安全從業(yè)人員經(jīng)常要處理撞庫(kù)掃號(hào)事件织咧,產(chǎn)生撞庫(kù)掃號(hào)的根本原因是一些企業(yè)發(fā)生了信息泄露事件,且這些泄露數(shù)據(jù)未加密或者加密方式比較弱漠秋,導(dǎo)致黑客可以還原出原始的用戶密碼笙蒙。目前已經(jīng)曝光的信息泄露事件至少上百起,其中包括多家一線互聯(lián)網(wǎng)公司庆锦,泄露總數(shù)據(jù)超過(guò)10億條捅位。
要完全防止信息泄露是非常困難的事情,除了防止黑客外搂抒,還要防止內(nèi)部人員泄密艇搀。但如果采用合適的算法去加密用戶密碼,即使信息泄露出去求晶,黑客也無(wú)法還原出原始的密碼(或者還原的代價(jià)非常大)焰雕。也就是說(shuō)我們可以將工作重點(diǎn)從防止泄露轉(zhuǎn)換到防止黑客還原出數(shù)據(jù)。下面我們將分別介紹用戶密碼的加密方式以及主要的破解方法芳杏。
一矩屁、用戶密碼加密
用戶密碼保存到數(shù)據(jù)庫(kù)時(shí),常見(jiàn)的加密方式有哪些爵赵,我們?cè)摬捎檬裁捶绞絹?lái)保護(hù)用戶的密碼呢档插?以下幾種方式是常見(jiàn)的密碼保存方式:
1、直接明文保存亚再,比如用戶設(shè)置的密碼是“123456”郭膛,直接將“123456”保存在數(shù)據(jù)庫(kù)中,這種是最簡(jiǎn)單的保存方式氛悬,也是最不安全的方式则剃。但實(shí)際上不少互聯(lián)網(wǎng)公司,都可能采取的是這種方式如捅。 2棍现、使用對(duì)稱加密算法來(lái)保存,比如3DES镜遣、AES等算法己肮,使用這種方式加密是可以通過(guò)解密來(lái)還原出原始密碼的,當(dāng)然前提條件是需要獲取到密鑰悲关。不過(guò)既然大量的用戶信息已經(jīng)泄露了谎僻,密鑰很可能也會(huì)泄露,當(dāng)然可以將一般數(shù)據(jù)和密鑰分開(kāi)存儲(chǔ)寓辱、分開(kāi)管理艘绍,但要完全保護(hù)好密鑰也是一件非常復(fù)雜的事情,所以這種方式并不是很好的方式秫筏。
3诱鞠、使用MD5挎挖、SHA1等單向HASH算法保護(hù)密碼,使用這些算法后航夺,無(wú)法通過(guò)計(jì)算還原出原始密碼蕉朵,而且實(shí)現(xiàn)比較簡(jiǎn)單,因此很多互聯(lián)網(wǎng)公司都采用這種方式保存用戶密碼阳掐,曾經(jīng)這種方式也是比較安全的方式始衅,但隨著彩虹表技術(shù)的興起,可以建立彩虹表進(jìn)行查表破解锚烦,目前這種方式已經(jīng)很不安全了。
4帝雇、特殊的單向HASH算法涮俄,由于單向HASH算法在保護(hù)密碼方面不再安全,于是有些公司在單向HASH算法基礎(chǔ)上進(jìn)行了加鹽尸闸、多次HASH等擴(kuò)展彻亲,這些方式可以在一定程度上增加破解難度,對(duì)于加了“固定鹽”的HASH算法吮廉,需要保護(hù)“鹽”不能泄露苞尝,這就會(huì)遇到“保護(hù)對(duì)稱密鑰”一樣的問(wèn)題,一旦“鹽”泄露宦芦,根據(jù)“鹽”重新建立彩虹表可以進(jìn)行破解宙址,對(duì)于多次HASH,也只是增加了破解的時(shí)間调卑,并沒(méi)有本質(zhì)上的提升抡砂。
5、PBKDF2算法恬涧,該算法原理大致相當(dāng)于在HASH算法基礎(chǔ)上增加隨機(jī)鹽注益,并進(jìn)行多次HASH運(yùn)算,隨機(jī)鹽使得彩虹表的建表難度大幅增加溯捆,而多次HASH也使得建表和破解的難度都大幅增加丑搔。使用PBKDF2算法時(shí),HASH算法一般選用sha1或者sha256提揍,隨機(jī)鹽的長(zhǎng)度一般不能少于8字節(jié)啤月,HASH次數(shù)至少也要1000次,這樣安全性才足夠高劳跃。一次密碼驗(yàn)證過(guò)程進(jìn)行1000次HASH運(yùn)算顽冶,對(duì)服務(wù)器來(lái)說(shuō)可能只需要1ms,但對(duì)于破解者來(lái)說(shuō)計(jì)算成本增加了1000倍售碳,而至少8字節(jié)隨機(jī)鹽强重,更是把建表難度提升了N個(gè)數(shù)量級(jí)绞呈,使得大批量的破解密碼幾乎不可行,該算法也是美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院推薦使用的算法间景。
6佃声、bcrypt、scrypt等算法倘要,這兩種算法也可以有效抵御彩虹表圾亏,使用這兩種算法時(shí)也需要指定相應(yīng)的參數(shù),使破解難度增加封拧。
下表對(duì)比了各個(gè)算法的特性:
二志鹃、用戶密碼破解
用戶密碼破解需要針對(duì)具體的加密方式來(lái)實(shí)施,如果使用對(duì)稱加密泽西,并且算法足夠安全(比如AES)曹铃,必須獲取到密鑰才能解密,沒(méi)有其它可行的破解方式捧杉。
如果采用HASH算法(包括特殊HASH)陕见,一般使用彩虹表的方式來(lái)破解,彩虹表的原理是什么呢味抖?我們先來(lái)了解下如何進(jìn)行HASH碰撞评甜。單向HASH算法由于不能進(jìn)行解密運(yùn)算,只能通過(guò)建表仔涩、查表的方式進(jìn)行碰撞忍坷,即將常用的密碼及其對(duì)應(yīng)的HASH值全計(jì)算出來(lái)并存儲(chǔ),當(dāng)獲取到HASH值是熔脂,直接查表獲取原始密碼承匣,假設(shè)用MD5算法來(lái)保護(hù)6位數(shù)字密碼,可以建如下表:
全表共100W條記錄锤悄,因?yàn)閿?shù)據(jù)量不大韧骗,這種情況建表、查表都非常容易零聚。但是當(dāng)密碼并不是6位純數(shù)字密碼袍暴,而是數(shù)字、大小寫(xiě)字母結(jié)合的10位密碼時(shí)隶症,建立一個(gè)這樣的表需要(26+26+10)^ 10 ≈ 83億億(條記錄)政模,存儲(chǔ)在硬盤(pán)上至少要占用2000W TB的空間,這么大的存儲(chǔ)空間蚂会,成本太大淋样,幾乎不可行。有什么辦法可以減少存儲(chǔ)空間胁住?一種方法是“預(yù)計(jì)算哈希鏈”趁猴,“預(yù)計(jì)算哈希鏈”可以大幅減少HASH表的存儲(chǔ)空間刊咳,但相應(yīng)的增加了查表時(shí)的計(jì)算量,其原理大致如下:
建表過(guò)程:
先對(duì)原始數(shù)據(jù)“000000”進(jìn)行一次HASH運(yùn)算得到“670B1E”儡司,再對(duì)HASH值進(jìn)行一次R運(yùn)算娱挨,R是一個(gè)定制的算法可以將HASH值映射到明文空間上(這里我們的明文空間是000000~999999),R運(yùn)算后得到“283651”捕犬,再對(duì)“283651”進(jìn)行hash運(yùn)算得到“1A99CD”跷坝,然后在進(jìn)行R運(yùn)算得到“819287”,如此重復(fù)多次碉碉,得到一條哈希鏈柴钻。然后再選用其它原始數(shù)據(jù)建立多條哈希鏈。最終僅將鏈頭和鏈尾保存下來(lái)垢粮,中間節(jié)點(diǎn)全都去掉贴届。
查表過(guò)程:假設(shè)拿到了一條HASH值“670B1E”,首先進(jìn)行一次R運(yùn)算足丢,得到了“283651”粱腻,查詢所有鏈尾是否有命中庇配,如果沒(méi)有斩跌,則再進(jìn)行一次HASH、一次R捞慌,得到了“819287”耀鸦,再次所有鏈尾,可以得到看出已經(jīng)命中啸澡。這樣我們就可以基本確認(rèn)“670B1E”對(duì)應(yīng)的明文就在這條鏈上袖订,然后我們把這條鏈的生成過(guò)程進(jìn)行重新計(jì)算,計(jì)算過(guò)程中可以發(fā)現(xiàn)“000000”的HASH值就是“670B1E”嗅虏,這樣就完成了整個(gè)查表過(guò)程洛姑。這種表就是“預(yù)計(jì)算哈希鏈”。這種方式存在一個(gè)問(wèn)題皮服,多條鏈之間可能存在大量的重復(fù)數(shù)據(jù)楞艾,如下圖所示:
為了解決這個(gè)問(wèn)題,我們將R算法進(jìn)行擴(kuò)展龄广,一條鏈上的多次R運(yùn)算采用不同的算法,如下圖:
一條鏈上的每個(gè)R算法都不一樣硫眯,就像彩虹的每層顏色一樣,因此取名的為彩虹表择同。
當(dāng)然彩虹表除了可以用戶破解HASH算法外两入,理論上還可以用于破解對(duì)稱加密算法,比如DES算法敲才,由于DES算法密鑰比較短裹纳,建立彩虹表破解是完全可行的择葡;但對(duì)于AES算法,由于密鑰比較長(zhǎng)痊夭,建表幾乎不可行(需要耗時(shí)N億年)刁岸。
三、小結(jié)
采用PBKDF2她我、bcrypt虹曙、scrypt等算法可以有效抵御彩虹表攻擊,即使數(shù)據(jù)泄露番舆,最關(guān)鍵的“用戶密碼”仍然可以得到有效的保護(hù)酝碳,黑客無(wú)法大批量破解用戶密碼,從而切斷撞庫(kù)掃號(hào)的根源恨狈。當(dāng)然疏哗,對(duì)于已經(jīng)泄露的密碼,還是需要用戶盡快修改密碼禾怠,不要再使用已泄露的密碼返奉。