很多人一提到 HTTPS福铅,第一反應(yīng)就是安全萝毛,對(duì)于普通用戶(hù)來(lái)說(shuō)這就足夠了,對(duì)于程序員來(lái)說(shuō)滑黔,有必要了解下 HTTP 到底有什么問(wèn)題笆包?HTTPS 是如何解決的?其背后的解決思路和方法是什么略荡?下面坐下簡(jiǎn)單的描述庵佣,HTTPS 體系非常復(fù)雜,自己無(wú)法做到很詳細(xì)和精準(zhǔn)的分析汛兜。
性能
HTTP 有典型的幾個(gè)問(wèn)題秧了,第一就是性能,HTTP 是基于 TCP 的序无,所以網(wǎng)絡(luò)層就不說(shuō)了(快慢不是 HTTP 的問(wèn)題)验毡。比較嚴(yán)重的問(wèn)題在于 HTTP 頭是不能壓縮的,每次要傳遞很大的數(shù)據(jù)包帝嗡。另外 HTTP 的請(qǐng)求模型是每個(gè)連接只能支持一個(gè)請(qǐng)求晶通,所以會(huì)顯得很慢。
那么 HTTPS 是解決這些問(wèn)題的嗎哟玷?不是狮辽,實(shí)際上 HTTPS 是在 HTTP 協(xié)議上又加了一層,會(huì)更慢巢寡,相信未來(lái)會(huì)逐步解決的喉脖。同時(shí) HTTPS 用到了很多加密算法,這些算法的執(zhí)行也是會(huì)影響速度的抑月。
為什么說(shuō) HTTPS 提升了性能呢树叽,因?yàn)橹挥兄С至?HTTPS,才能部署 HTTP/2谦絮,而 HTTP/2 協(xié)議會(huì)提升速度题诵,能夠有效減輕客戶(hù)端和服務(wù)器端的壓力,讓響應(yīng)更快速层皱,HTTP/2 未來(lái)會(huì)寫(xiě)一篇文章說(shuō)說(shuō)性锭,這里只要知道一點(diǎn):HTTP/2 能夠加快速度的主要原因在于多路復(fù)用,同一個(gè)連接能夠并行發(fā)送和接收多個(gè)請(qǐng)求叫胖。
安全性
當(dāng)用戶(hù)在瀏覽器輸入一個(gè)網(wǎng)址的時(shí)候草冈,在地址欄上看到小鎖圖標(biāo),就會(huì)安心,潛意識(shí)的認(rèn)為自己的上網(wǎng)行為是安全的怎棱,當(dāng)然對(duì)于小白用戶(hù)來(lái)說(shuō)可能還不明白方淤,但是未來(lái)會(huì)慢慢改善的(萬(wàn)事開(kāi)頭難嗎)。
那么 HTTP 到底有什么安全問(wèn)題呢蹄殃,看幾個(gè)例子:
(1)由于互聯(lián)網(wǎng)傳輸是能夠被攔截的携茂,所以假如你的上網(wǎng)方式被別人控制了(沒(méi)有絕對(duì)的安全),那么你的任何行為和信息攻擊者都會(huì)知道诅岩,比如我們連上一個(gè)匿名的 WIFI讳苦,當(dāng)你上網(wǎng)的時(shí)候,輸入的網(wǎng)站密碼可能就已經(jīng)泄漏了吩谦。
(2)當(dāng)我們?cè)谏弦粋€(gè)網(wǎng)站的時(shí)候鸳谜,莫名其妙跳出一個(gè)廣告(這個(gè)廣告并不是這個(gè)網(wǎng)站的),那是因?yàn)樵L問(wèn)的頁(yè)面可能被運(yùn)營(yíng)商強(qiáng)制修改了(加入了他自己的內(nèi)容式廷,比如廣告)咐扭。
HTTP 最大的問(wèn)題就在于數(shù)據(jù)沒(méi)有加密,以及通信雙方?jīng)]有辦法進(jìn)行身份驗(yàn)證( confidentiality and authentication)滑废,由于數(shù)據(jù)沒(méi)有加密蝗肪,那么只要數(shù)據(jù)包被攻擊者劫持,信息就泄漏了蠕趁。身份驗(yàn)證的意思就是服務(wù)器并不知道連接它的客戶(hù)端到底是誰(shuí)薛闪,而客戶(hù)端也不確定他連接的服務(wù)器就是他想連接的服務(wù)器,雙方之間沒(méi)有辦法進(jìn)行身份確認(rèn)俺陋。
HTTPS 背后的密碼學(xué)
為了解決 HTTP 的兩個(gè)核心問(wèn)題豁延,HTTPS 出現(xiàn)了,HTTPS 包含了核心的幾個(gè)部分腊状,TLS 協(xié)議诱咏、OpenSSL,證書(shū)缴挖。什么是 OpenSSL 呢袋狞,它實(shí)現(xiàn)了世界上非常重要和多的密碼算法,而密碼學(xué)是解決問(wèn)題最重要的一個(gè)環(huán)節(jié)醇疼。TLS 最重要的是握手的處理方式硕并。證書(shū)的體系也很大法焰,但是他們背后都是基于同樣的密碼學(xué)秧荆。
(1)既然 HTTP 沒(méi)有數(shù)據(jù)加密,那么我們就加密下埃仪,對(duì)稱(chēng)加密算法上場(chǎng)了乙濒,這種算法加密和解密要使用同一個(gè)密鑰,通信雙方需要知道這個(gè)密鑰(或者每次協(xié)商一個(gè)),實(shí)際上這種方法不太可能颁股,這涉及到密鑰保密和配送的問(wèn)題么库,一旦被攻擊者知道了密鑰,那么傳輸?shù)臄?shù)據(jù)等同沒(méi)有加密甘有。
(2)這個(gè)時(shí)候非對(duì)稱(chēng)加密算法上場(chǎng)了诉儒,公鑰和私鑰是分開(kāi)的,客戶(hù)端保存公鑰亏掀,服務(wù)器保存私鑰(不會(huì)公開(kāi))忱反,這時(shí)候好像能夠完美解決問(wèn)題了。但實(shí)際上會(huì)存在兩個(gè)問(wèn)題滤愕,第一就是非對(duì)稱(chēng)加密算法運(yùn)算很慢温算,第二就是會(huì)遇到中間人攻擊問(wèn)題。先說(shuō)說(shuō)中間人攻擊的問(wèn)題间影,假如使用非對(duì)稱(chēng)加密算法注竿,對(duì)于客戶(hù)端來(lái)說(shuō)它拿到的公鑰可能并不是真正服務(wù)器的公鑰,因?yàn)榭蛻?hù)端上網(wǎng)的時(shí)候可能不會(huì)仔細(xì)分辨某個(gè)公鑰是和某個(gè)公司綁定的魂贬,假如錯(cuò)誤的拿到攻擊者的公鑰巩割,那么他發(fā)送出去的數(shù)據(jù)包被劫持后,攻擊者用自己的私鑰就能反解了付燥。
(5)接下來(lái)如何解決公鑰認(rèn)證的問(wèn)題呢喂分?證書(shū)出現(xiàn)了,證書(shū)是由 CA 機(jī)構(gòu)認(rèn)證的机蔗,客戶(hù)端都充分信任它蒲祈,它能夠證明你拿到的公鑰是特定機(jī)構(gòu)的,然后就能使用非對(duì)稱(chēng)加密算法加密了萝嘁。證書(shū)是怎么加密的呢梆掸?實(shí)際上也是通過(guò)非對(duì)稱(chēng)加密算法,但是區(qū)別在于證書(shū)是用私鑰加密牙言,公鑰解密酸钦。CA 機(jī)構(gòu)會(huì)用自己的私鑰加密服務(wù)器用戶(hù)的公鑰,而客戶(hù)端則用 CA 機(jī)構(gòu)的公鑰解出服務(wù)器的公鑰咱枉。聽(tīng)上去有點(diǎn)暈卑硫,仔細(xì)體會(huì)下。
(6)上面說(shuō)了非對(duì)稱(chēng)加密算法加密解密非常耗時(shí)蚕断,對(duì)于 HTTP 這樣的大數(shù)據(jù)包欢伏,速度就更慢了,這時(shí)候可以使用對(duì)稱(chēng)加密算法亿乳,這個(gè)密鑰是由客戶(hù)端和服務(wù)器端協(xié)商出來(lái)硝拧,并由服務(wù)器的公鑰進(jìn)行加密傳遞径筏,所以不存在安全問(wèn)題。
(7)另外客戶(hù)端拿到證書(shū)后會(huì)驗(yàn)證證書(shū)是否正確障陶,它驗(yàn)證的手段就是通過(guò) Hash 摘要算法滋恬,CA 機(jī)構(gòu)會(huì)將證書(shū)信息通過(guò) Hash 算法運(yùn)算后再用私鑰加密,客戶(hù)端用 CA 的公鑰解出后抱究,再計(jì)算證書(shū)的 Hash 摘要值恢氯,兩者一致就說(shuō)明驗(yàn)證身份通過(guò)。
(8)HTTPS 解決的第三個(gè)問(wèn)題是完整性問(wèn)題鼓寺,就是信息有沒(méi)有被篡改(信息能夠被反解)酿雪,用的是 HMAC 算法,這個(gè)算法和 Hash 方法差不多侄刽,但是需要傳遞一個(gè)密鑰指黎,這個(gè)密鑰就是客戶(hù)端和服務(wù)器端上面協(xié)商出來(lái)的。