之前寫(xiě)過(guò)一個(gè)篇【HTTP協(xié)議詳解】丑慎,這次繼續(xù)介紹HTTP協(xié)議中的緩存機(jī)制喜喂。HTTP協(xié)議提供了非常強(qiáng)大的緩存機(jī)制, 了解這些緩存機(jī)制竿裂,對(duì)提高網(wǎng)站的性能非常有幫助玉吁。 本文介紹瀏覽器和Web服務(wù)器之間如何處理"瀏覽器緩存",以及控制緩存的http header.
本文會(huì)使用Fiddler來(lái)查看HTTP request和Response, 如果不熟悉這工具腻异,可以先參考[Fiddler教程]进副。在看本文的時(shí)候, 請(qǐng)務(wù)必打開(kāi)Fiddler來(lái)實(shí)踐悔常。
閱讀目錄
緩存這個(gè)東西真的是無(wú)處不在, 有瀏覽器端的緩存矫户, 有服務(wù)器端的緩存片迅,有代理服務(wù)器的緩存, 有ASP.NET頁(yè)面緩存吏垮,對(duì)象緩存障涯。數(shù)據(jù)庫(kù)也有緩存, 等等膳汪。
http中具有緩存功能的是瀏覽器緩存,以及緩存代理服務(wù)器九秀。
http緩存的是指:當(dāng)Web請(qǐng)求抵達(dá)緩存時(shí)遗嗽, 如果本地有“已緩存的”副本,就可以從本地存儲(chǔ)設(shè)備而不是從原始服務(wù)器中提取這個(gè)文檔鼓蜒。
緩存的好處是顯而易見(jiàn)的痹换, 好處有,
1. 減少了冗余的數(shù)據(jù)傳輸都弹,節(jié)省了網(wǎng)費(fèi)娇豫。
2. 減少了服務(wù)器的負(fù)擔(dān), 大大提高了網(wǎng)站的性能
3. 加快了客戶端加載網(wǎng)頁(yè)的速度
Fiddler中把header都分門別類的放在一起畅厢,這樣方便查看冯痢。
Web服務(wù)器通過(guò)2種方式來(lái)判斷瀏覽器緩存是否是最新的。
第一種框杜, 瀏覽器把緩存文件的最后修改時(shí)間通過(guò) header ”If-Modified-Since“來(lái)告訴Web服務(wù)器浦楣。
第二種, 瀏覽器把緩存文件的ETag, 通過(guò)header "If-None-Match", 來(lái)告訴Web服務(wù)器咪辱。
通過(guò)最后修改時(shí)間, 來(lái)判斷緩存新鮮度
1. 瀏覽器客戶端想請(qǐng)求一個(gè)文檔振劳,? 首先檢查本地緩存,發(fā)現(xiàn)存在這個(gè)文檔的緩存油狂,? 獲取緩存中文檔的最后修改時(shí)間历恐,通過(guò): If-Modified-Since, 發(fā)送Request給Web服務(wù)器专筷。
2. Web服務(wù)器收到Request弱贼,將服務(wù)器的文檔修改時(shí)間(Last-Modified): 跟request header
中的,If-Modified-Since相比較仁堪, 如果時(shí)間是一樣的哮洽, 說(shuō)明緩存還是最新的, Web服務(wù)器將發(fā)送304 Not
Modified給瀏覽器客戶端弦聂, 告訴客戶端直接使用緩存里的版本鸟辅。如下圖氛什。
3. 假如該文檔已經(jīng)被更新了。Web服務(wù)器將發(fā)送該文檔的最新版本給瀏覽器客戶端匪凉, 如下圖枪眉。
實(shí)例: 打開(kāi)Fiddler, 然后打開(kāi)博客園首頁(yè)。然后F5刷新幾次瀏覽器再层。 你會(huì)看到博客園首頁(yè)也用了緩存贸铜。
我們來(lái)看看每個(gè)header的具體含義。
Request
Cache-Control: max-age=0以秒為單位
If-Modified-Since: Mon, 19 Nov 2012 08:38:01 GMT緩存文件的最后修改時(shí)間聂受。
If-None-Match: "0693f67a67cc1:0"緩存文件的Etag值
Cache-Control: no-cache不使用緩存
Pragma: no-cache不使用緩存
Response
Cache-Control: public響應(yīng)被緩存蒿秦,并且在多用戶間共享,? (公有緩存和私有緩存的區(qū)別蛋济,請(qǐng)看另一節(jié))
Cache-Control: private響應(yīng)只能作為私有緩存棍鳖,不能在用戶之間共享
Cache-Control:no-cache提醒瀏覽器要從服務(wù)器提取文檔進(jìn)行驗(yàn)證
Cache-Control:no-store絕對(duì)禁止緩存(用于機(jī)密,敏感文件)
Cache-Control: max-age=6060秒之后緩存過(guò)期(相對(duì)時(shí)間)
Date: Mon, 19 Nov 2012 08:39:00 GMT當(dāng)前response發(fā)送的時(shí)間
Expires: Mon, 19 Nov 2012 08:40:01 GMT緩存過(guò)期的時(shí)間(絕對(duì)時(shí)間)
Last-Modified: Mon, 19 Nov 2012 08:38:01 GMT服務(wù)器端文件的最后修改時(shí)間
ETag: "20b1add7ec1cd1:0"服務(wù)器端文件的Etag值
如果同時(shí)存在cache-control和Expires怎么辦呢碗旅?
瀏覽器總是優(yōu)先使用cache-control渡处,如果沒(méi)有cache-control才考慮Expires
ETag是實(shí)體標(biāo)簽(Entity Tag)的縮寫(xiě), 根據(jù)實(shí)體內(nèi)容生成的一段hash字符串(類似于MD5或者SHA1之后的結(jié)果)祟辟,可以標(biāo)識(shí)資源的狀態(tài)医瘫。 當(dāng)資源發(fā)送改變時(shí),ETag也隨之發(fā)生變化旧困。
ETag是Web服務(wù)端產(chǎn)生的醇份,然后發(fā)給瀏覽器客戶端。瀏覽器客戶端是不用關(guān)心Etag是如何產(chǎn)生的叮喳。
為什么使用ETag呢被芳? 主要是為了解決Last-Modified 無(wú)法解決的一些問(wèn)題。
1. 某些服務(wù)器不能精確得到文件的最后修改時(shí)間馍悟, 這樣就無(wú)法通過(guò)最后修改時(shí)間來(lái)判斷文件是否更新了畔濒。
2. 某些文件的修改非常頻繁,在秒以下的時(shí)間內(nèi)進(jìn)行修改. Last-Modified只能精確到秒锣咒。
3. 一些文件的最后修改時(shí)間改變了侵状,但是內(nèi)容并未改變。 我們不希望客戶端認(rèn)為這個(gè)文件修改了毅整。
實(shí)例趣兄, 打開(kāi)Fiddler, 打開(kāi)博客園首頁(yè)。? 你可以看到很多圖片悼嫉,或者CSS文件都是用了緩存艇潭。 這些都是通過(guò)比較ETag的值,來(lái)判斷文件是否更新了。
CTRL+F5強(qiáng)制刷新瀏覽器蹋凝,或者設(shè)置IE鲁纠。? 可以讓瀏覽器不使用緩存。
1. 瀏覽器發(fā)送Http request, 給Web 服務(wù)器鳍寂, header中帶有Cache-Control: no-cache.?? 明確告訴Web服務(wù)器改含,客戶端不使用緩存。
2. Web服務(wù)器將把最新的文檔發(fā)送給瀏覽器客戶端.
實(shí)例:
打開(kāi)Fiddler, 打開(kāi)博客園首頁(yè)迄汛, 然后按CTRL+F5強(qiáng)制刷新瀏覽器捍壤,你將看到
Pragma: no-cache的作用和Cache-Control: no-cache一模一樣。 都是不使用緩存鞍爱。
Pragma: no-cache 是HTTP 1.0中定義的鹃觉, 所以為了兼容HTTP 1.0. 所以會(huì)同時(shí)使用Pragma: no-cache和Cache-Control: no-cache
按F5刷新瀏覽器和在地址欄里輸入網(wǎng)址然后回車睹逃。 這兩個(gè)行為是不一樣的帜慢。
按F5刷新瀏覽器, 瀏覽器會(huì)去Web服務(wù)器驗(yàn)證緩存唯卖。
如果是在地址欄輸入網(wǎng)址然后回車,瀏覽器會(huì)"直接使用有效的緩存", 而不會(huì)發(fā)http request 去服務(wù)器驗(yàn)證緩存躬柬,這種情況叫做緩存命中拜轨,如下圖
實(shí)例: 比較第一次訪問(wèn)博客園主頁(yè)和第二次博客園主頁(yè)
1. 啟動(dòng)Fiddler, 用firefox打開(kāi)博客園主頁(yè), 發(fā)現(xiàn)有50多個(gè)session允青。
2. 按CTRL+X將Fiddler中的所有session刪除橄碾。 關(guān)閉firefox,重新打開(kāi)一個(gè)firefox,打開(kāi)博客園主頁(yè)颠锉。?? 發(fā)現(xiàn)只有30多個(gè)session.
分析法牲;少了的session是因?yàn)閒irefox直接用了緩存,而沒(méi)有發(fā)http request琼掠。
打開(kāi)IE拒垃。點(diǎn)擊工具欄上的, 工具->Internet選項(xiàng)->常規(guī)->瀏覽歷史記錄 設(shè)置. 選擇“從不”瓷蛙。然后保存悼瓮。
然后點(diǎn)擊“刪除”? 把Internet臨時(shí)文件都刪掉 (IE緩存的文件就是Internet臨時(shí)文件)。
Cache-Control: public 指可以公有緩存艰猬, 可以是數(shù)千名用戶共享的横堡。
Cache-Control: private 指只支持私有緩存, 私有緩存是單個(gè)用戶專用的冠桃。