發(fā)展史
1、很久很久以前泣特,Web 基本上就是文檔的瀏覽而已挑随, 既然是瀏覽勒叠,作為服務(wù)器眯分, 不需要記錄誰在某一段時(shí)間里都瀏覽了什么文檔柒桑,每次請求都是一個(gè)新的HTTP協(xié)議, 就是請求加響應(yīng)飘诗, 尤其是我不用記住是誰剛剛發(fā)了HTTP請求界逛, 每個(gè)請求對我來說都是全新的。這段時(shí)間很嗨皮溉潭。
2少欺、但是隨著交互式Web應(yīng)用的興起,像在線購物網(wǎng)站畏陕,需要登錄的網(wǎng)站等等仿滔,馬上就面臨一個(gè)問題,那就是要管理會(huì)話仁讨,必須記住哪些人登錄系統(tǒng)实昨, 哪些人往自己的購物車中放商品, 也就是說我必須把每個(gè)人區(qū)分開荒给,這就是一個(gè)不小的挑戰(zhàn),因?yàn)镠TTP請求是無狀態(tài)的曙咽,所以想出的辦法就是給大家發(fā)一個(gè)會(huì)話標(biāo)識(shí)(session id), 說白了就是一個(gè)隨機(jī)的字串挑辆,每個(gè)人收到的都不一樣孝情, 每次大家向我發(fā)起HTTP請求的時(shí)候箫荡,把這個(gè)字符串給一并捎過來渔隶, 這樣我就能區(qū)分開誰是誰了
3、這樣大家很嗨皮了绞灼,可是服務(wù)器就不嗨皮了呈野,每個(gè)人只需要保存自己的session id,而服務(wù)器要保存所有人的session id 商佛!如果訪問服務(wù)器多了姆打, 就得由成千上萬肠虽,甚至幾十萬個(gè)。
這對服務(wù)器說是一個(gè)巨大的開銷 闲延, 嚴(yán)重的限制了服務(wù)器擴(kuò)展能力韩玩, 比如說我用兩個(gè)機(jī)器組成了一個(gè)集群, 小F通過機(jī)器A登錄了系統(tǒng)找颓, 那session id會(huì)保存在機(jī)器A上, 假設(shè)小F的下一次請求被轉(zhuǎn)發(fā)到機(jī)器B怎么辦击狮?機(jī)器B可沒有小F的 session id啊。
有時(shí)候會(huì)采用一點(diǎn)小伎倆:session sticky 寸莫, 就是讓小F的請求一直粘連在機(jī)器A上档冬, 但是這也不管用桃纯, 要是機(jī)器A掛掉了慈参, 還得轉(zhuǎn)到機(jī)器B去刮萌。
那只好做session 的復(fù)制了, 把session id 在兩個(gè)機(jī)器之間搬來搬去壮锻, 快累死了涮阔。
后來有個(gè)叫Memcached的支了招:把session id 集中存儲(chǔ)到一個(gè)地方, 所有的機(jī)器都來訪問這個(gè)地方的數(shù)據(jù)掰邢, 這樣一來伟阔,就不用復(fù)制了, 但是增加了單點(diǎn)失敗的可能性怀估, 要是那個(gè)負(fù)責(zé)session 的機(jī)器掛了合搅, 所有人都得重新登錄一遍, 估計(jì)得被人罵死康铭。
也嘗試把這個(gè)單點(diǎn)的機(jī)器也搞出集群从藤,增加可靠性春弥, 但不管如何, 這小小的session 對我來說是一個(gè)沉重的負(fù)擔(dān)
4扫责、于是有人就一直在思考, 我為什么要保存這可惡的session呢鳖孤, 只讓每個(gè)客戶端去保存該多好?
可是如果不保存這些session id , 怎么驗(yàn)證客戶端發(fā)給我的session id 的確是我生成的呢苏揣??如果不去驗(yàn)證,我們都不知道他們是不是合法登錄的用戶框沟, 那些不懷好意的家伙們就可以偽造session id , 為所欲為了增炭。
嗯,對了梅垄,關(guān)鍵點(diǎn)就是驗(yàn)證 输玷!
比如說, 小F已經(jīng)登錄了系統(tǒng)机久, 我給他發(fā)一個(gè)令牌(token)貌虾, 里邊包含了小F的 user id裙犹, 下一次小F 再次通過Http 請求訪問我的時(shí)候, 把這個(gè)token 通過Http header 帶過來不就可以了袄膏。
不過這和session id沒有本質(zhì)區(qū)別啊掺冠, 任何人都可以可以偽造, 所以我得想點(diǎn)兒辦法德崭, 讓別人偽造不了。
那就對數(shù)據(jù)做一個(gè)簽名吧锌奴, 比如說我用HMAC-SHA256 算法憾股,加上一個(gè)只有我才知道的密鑰箕慧, 對數(shù)據(jù)做一個(gè)簽名颠焦, 把這個(gè)簽名和數(shù)據(jù)一起作為token 往枣, 由于密鑰別人不知道, 就無法偽造token了似忧。
這個(gè)token 我不保存丈秩, 當(dāng)小F把這個(gè)token 給我發(fā)過來的時(shí)候,我再用同樣的HMAC-SHA256 算法和同樣的密鑰饺著,對數(shù)據(jù)再計(jì)算一次簽名肠牲, 和token 中的簽名做個(gè)比較, 如果相同渡嚣, 我就知道小F已經(jīng)登錄過了肥印,并且可以直接取到小F的user id , 如果不相同, 數(shù)據(jù)部分肯定被人篡改過腹鹉, 我就告訴發(fā)送者:對不起敷硅,沒有認(rèn)證。
Token 中的數(shù)據(jù)是明文保存的(雖然我會(huì)用Base64做下編碼力奋, 但那不是加密)幽七, 還是可以被別人看到的, 所以我不能在其中保存像密碼這樣的敏感信息滨彻。
當(dāng)然, 如果一個(gè)人的token 被別人偷走了休偶, 那我也沒辦法辜羊, 我也會(huì)認(rèn)為小偷就是合法用戶, 這其實(shí)和一個(gè)人的session id 被別人偷走是一樣的八秃。
這樣一來,?我就不保存session id 了疹尾,?我只是生成token , 然后驗(yàn)證token 骤肛,?我用我的CPU計(jì)算時(shí)間獲取了我的session 存儲(chǔ)空間 !
解除了session id這個(gè)負(fù)擔(dān)繁成, 可以說是無事一身輕淑玫, 我的機(jī)器集群現(xiàn)在可以輕松地做水平擴(kuò)展, 用戶訪問量增大尊搬, 直接加機(jī)器就行歌径。這種無狀態(tài)的感覺實(shí)在是太好了亲茅!
Cookie
cookie 是一個(gè)非常具體的東西,指的就是瀏覽器里面能永久存儲(chǔ)的一種數(shù)據(jù)克锣,僅僅是瀏覽器實(shí)現(xiàn)的一種數(shù)據(jù)存儲(chǔ)功能。
cookie由服務(wù)器生成验残,發(fā)送給瀏覽器巾乳,瀏覽器把cookie以kv形式保存到某個(gè)目錄下的文本文件內(nèi)鸟召,下一次請求同一網(wǎng)站時(shí)會(huì)把該cookie發(fā)送給服務(wù)器氨鹏。由于cookie是存在客戶端上的,所以瀏覽器加入了一些限制確保cookie不會(huì)被惡意使用跟继,同時(shí)不會(huì)占據(jù)太多磁盤空間镣丑,所以每個(gè)域的cookie數(shù)量是有限的。
Session
session 從字面上講金吗,就是會(huì)話趣竣。這個(gè)就類似于你和一個(gè)人交談,你怎么知道當(dāng)前和你交談的是張三而不是李四呢跟匆?對方肯定有某種特征(長相等)表明他就是張三通砍。
session 也是類似的道理,服務(wù)器要知道當(dāng)前發(fā)請求給自己的是誰迹冤。為了做這種區(qū)分虎忌,服務(wù)器就要給每個(gè)客戶端分配不同的“身份標(biāo)識(shí)”,然后客戶端每次向服務(wù)器發(fā)請求的時(shí)候膜蠢,都帶上這個(gè)“身份標(biāo)識(shí)”,服務(wù)器就知道這個(gè)請求來自于誰了礁竞。至于客戶端怎么保存這個(gè)“身份標(biāo)識(shí)”杉辙,可以有很多種方式,對于瀏覽器客戶端狂男,大家都默認(rèn)采用 cookie 的方式。
服務(wù)器使用session把用戶的信息臨時(shí)保存在了服務(wù)器上寓搬,用戶離開網(wǎng)站后session會(huì)被銷毀县耽。這種用戶信息存儲(chǔ)方式相對cookie來說更安全,可是session有一個(gè)缺陷:如果web服務(wù)器做了負(fù)載均衡唾琼,那么下一個(gè)操作請求到了另一臺(tái)服務(wù)器的時(shí)候session會(huì)丟失澎剥。
Token
在Web領(lǐng)域基于Token的身份驗(yàn)證隨處可見。在大多數(shù)使用Web API的互聯(lián)網(wǎng)公司中哑姚,tokens 是多用戶下處理認(rèn)證的最佳方式。
以下幾點(diǎn)特性會(huì)讓你在程序中使用基于Token的身份驗(yàn)證
無狀態(tài)倡蝙、可擴(kuò)展
支持移動(dòng)設(shè)備
跨程序調(diào)用
安全
那些使用基于Token的身份驗(yàn)證的大佬們
大部分你見到過的API和Web應(yīng)用都使用tokens绞佩。例如Facebook, Twitter, Google+, GitHub等。
Token的起源
在介紹基于Token的身份驗(yàn)證的原理與優(yōu)勢之前胆建,不妨先看看之前的認(rèn)證都是怎么做的肘交。
基于服務(wù)器的驗(yàn)證
我們都是知道HTTP協(xié)議是無狀態(tài)的,這種無狀態(tài)意味著程序需要驗(yàn)證每一次請求凉驻,從而辨別客戶端的身份魄懂。
在這之前,程序都是通過在服務(wù)端存儲(chǔ)的登錄信息來辨別請求的。這種方式一般都是通過存儲(chǔ)Session來完成。
隨著Web蛛淋,應(yīng)用程序,已經(jīng)移動(dòng)端的興起褐荷,這種驗(yàn)證的方式逐漸暴露出了問題嘹悼。尤其是在可擴(kuò)展性方面。
基于服務(wù)器驗(yàn)證方式暴露的一些問題
Seesion:每次認(rèn)證用戶發(fā)起請求時(shí)其监,服務(wù)器需要去創(chuàng)建一個(gè)記錄來存儲(chǔ)信息限匣。當(dāng)越來越多的用戶發(fā)請求時(shí),內(nèi)存的開銷也會(huì)不斷增加锌历。
可擴(kuò)展性:在服務(wù)端的內(nèi)存中使用Seesion存儲(chǔ)登錄信息峦筒,伴隨而來的是可擴(kuò)展性問題。
CORS(跨域資源共享):當(dāng)我們需要讓數(shù)據(jù)跨多臺(tái)移動(dòng)設(shè)備上使用時(shí)怔揩,跨域資源的共享會(huì)是一個(gè)讓人頭疼的問題。在使用Ajax抓取另一個(gè)域的資源商膊,就可以會(huì)出現(xiàn)禁止請求的情況宠进。
CSRF(跨站請求偽造):用戶在訪問銀行網(wǎng)站時(shí),他們很容易受到跨站請求偽造的攻擊实幕,并且能夠被利用其訪問其他的網(wǎng)站堤器。
在這些問題中,可擴(kuò)展行是最突出的整吆。因此我們有必要去尋求一種更有行之有效的方法。
基于Token的驗(yàn)證原理
基于Token的身份驗(yàn)證是無狀態(tài)的表蝙,我們不將用戶信息存在服務(wù)器或Session中。
這種概念解決了在服務(wù)端存儲(chǔ)信息時(shí)的許多問題
NoSession意味著你的程序可以根據(jù)需要去增減機(jī)器府蛇,而不用去擔(dān)心用戶是否登錄。
基于Token的身份驗(yàn)證的過程如下:
用戶通過用戶名和密碼發(fā)送請求务荆。
程序驗(yàn)證穷遂。
程序返回一個(gè)簽名的token 給客戶端。
客戶端儲(chǔ)存token,并且每次用于每次發(fā)送請求浦箱。
服務(wù)端驗(yàn)證token并返回?cái)?shù)據(jù)祠锣。
每一次請求都需要token。token應(yīng)該在HTTP的頭部發(fā)送從而保證了Http請求無狀態(tài)伴网。我們同樣通過設(shè)置服務(wù)器屬性Access-Control-Allow-Origin:* ,讓服務(wù)器能接受到來自所有域的請求沸伏。
需要主要的是动分,在ACAO頭部標(biāo)明(designating)*時(shí),不得帶有像HTTP認(rèn)證姆另,客戶端SSL證書和cookies的證書坟乾。
實(shí)現(xiàn)思路:
用戶登錄校驗(yàn),校驗(yàn)成功后就返回Token給客戶端明吩。
客戶端收到數(shù)據(jù)后保存在客戶端
客戶端每次訪問API是攜帶Token到服務(wù)器端殷费。
服務(wù)器端采用filter過濾器校驗(yàn)低葫。校驗(yàn)成功則返回請求數(shù)據(jù)氮采,校驗(yàn)失敗則返回錯(cuò)誤碼
當(dāng)我們在程序中認(rèn)證了信息并取得token之后殷绍,我們便能通過這個(gè)Token做許多的事情。
我們甚至能基于創(chuàng)建一個(gè)基于權(quán)限的token傳給第三方應(yīng)用程序茶行,這些第三方程序能夠獲取到我們的數(shù)據(jù)(當(dāng)然只有在我們允許的特定的token)
Tokens的優(yōu)勢
無狀態(tài)登钥、可擴(kuò)展
在客戶端存儲(chǔ)的Tokens是無狀態(tài)的,并且能夠被擴(kuò)展看锉∷ⅲ基于這種無狀態(tài)和不存儲(chǔ)Session信息,負(fù)載負(fù)載均衡器能夠?qū)⒂脩粜畔囊粋€(gè)服務(wù)傳到其他服務(wù)器上轮纫。
如果我們將已驗(yàn)證的用戶的信息保存在Session中,則每次請求都需要用戶向已驗(yàn)證的服務(wù)器發(fā)送驗(yàn)證信息(稱為Session親和性)放前。用戶量大時(shí)糯彬,可能會(huì)造成一些擁堵。
但是不要著急似扔。使用tokens之后這些問題都迎刃而解却舀,因?yàn)閠okens自己hold住了用戶的驗(yàn)證信息。
安全性
請求中發(fā)送token而不再是發(fā)送cookie能夠防止CSRF(跨站請求偽造)挽拔。即使在客戶端使用cookie存儲(chǔ)token,cookie也僅僅是一個(gè)存儲(chǔ)機(jī)制而不是用于認(rèn)證啡氢。不將信息存儲(chǔ)在Session中,讓我們少了對session操作倘是。
token是有時(shí)效的,一段時(shí)間之后用戶需要重新驗(yàn)證搀崭。我們也不一定需要等到token自動(dòng)失效,token有撤回的操作升敲,通過token revocataion可以使一個(gè)特定的token或是一組有相同認(rèn)證的token無效轰传。
可擴(kuò)展性
Tokens能夠創(chuàng)建與其它程序共享權(quán)限的程序。例如获茬,能將一個(gè)隨便的社交帳號(hào)和自己的大號(hào)(Fackbook或是Twitter)聯(lián)系起來。當(dāng)通過服務(wù)登錄Twitter(我們將這個(gè)過程Buffer)時(shí)鹏氧,我們可以將這些Buffer附到Twitter的數(shù)據(jù)流上(we are allowing Buffer to post to our Twitter stream)码俩。
使用tokens時(shí),可以提供可選的權(quán)限給第三方應(yīng)用程序笨篷。當(dāng)用戶想讓另一個(gè)應(yīng)用程序訪問它們的數(shù)據(jù)瓣履,我們可以通過建立自己的API,得出特殊權(quán)限的tokens袖迎。
多平臺(tái)跨域
我們提前先來談?wù)撘幌翪ORS(跨域資源共享),對應(yīng)用程序和服務(wù)進(jìn)行擴(kuò)展的時(shí)候辜贵,需要介入各種各種的設(shè)備和應(yīng)用程序归形。
Having our API just serve data, we can also make the design choice to serve assets from a CDN. This eliminates the issues that CORS brings up after we set a quick header configuration for our application.
只要用戶有一個(gè)通過了驗(yàn)證的token,數(shù)據(jù)和資源就能夠在任何域上被請求到厚棵。
Access-Control-Allow-Origin:?*??????
基于標(biāo)準(zhǔn)創(chuàng)建token的時(shí)候,你可以設(shè)定一些選項(xiàng)婆硬。我們在后續(xù)的文章中會(huì)進(jìn)行更加詳盡的描述,但是標(biāo)準(zhǔn)的用法會(huì)在JSON Web Tokens體現(xiàn)向楼。
最近的程序和文檔是供給JSON Web Tokens的。它支持眾多的語言蜜自。這意味在未來的使用中你可以真正的轉(zhuǎn)換你的認(rèn)證機(jī)制卢佣。