一洋幻、一個(gè)例子
當(dāng)用戶在瀏覽器中輸入www.xxx.com這個(gè)URL時(shí)拟杉,
首先,DNS會(huì)把這個(gè)域名解析成IP地址弄屡,
然后根據(jù)這個(gè)IP找到對(duì)應(yīng)的服務(wù)器题禀,并發(fā)起一個(gè)get請(qǐng)求,
對(duì)于服務(wù)器端而言膀捷,
可能會(huì)有負(fù)載均衡設(shè)備來平均分配用戶請(qǐng)求迈嘹,
而請(qǐng)求的數(shù)據(jù)可能在分布式緩存里,靜態(tài)文件中全庸,或是數(shù)據(jù)庫中秀仲,
當(dāng)數(shù)據(jù)返回給瀏覽器時(shí),瀏覽器解析數(shù)據(jù)發(fā)現(xiàn)還有些靜態(tài)文件(CSS壶笼、JS神僵、圖片...),又會(huì)發(fā)起另外的HTTP請(qǐng)求覆劈,而這些請(qǐng)求保礼,很可能落在CDN上。
不過網(wǎng)絡(luò)架構(gòu)如何變化责语,始終有一些固定不變的原則需要遵守:
- 互聯(lián)網(wǎng)上所有資源都要用一個(gè)URL來表示炮障。
- 必須基于HTTP與服務(wù)端
二、發(fā)起Http請(qǐng)求
發(fā)起一個(gè)Http請(qǐng)求和建立一個(gè)Socket連接區(qū)別不大坤候,只不過outputStream.write寫的二進(jìn)制字節(jié)數(shù)據(jù)格式要符合HTTP铝阐。瀏覽器在建立Socket連接之前,必須根據(jù)地址欄輸入的URL的域名DNS解析出IP地址铐拐,在根據(jù)這個(gè)IP地址和默認(rèn)的80端口與遠(yuǎn)程服務(wù)器建立Socket連接徘键,然后瀏覽器根據(jù)這個(gè)URL組裝成一個(gè)get類型的HTTP請(qǐng)求頭,通過outputStream.write發(fā)送到目標(biāo)服務(wù)器遍蟋,服務(wù)器等待inputStream.read返回?cái)?shù)據(jù)吹害,最后斷開這個(gè)連接。
模擬瀏覽器發(fā)送Http請(qǐng)求:
httpClient
curl
三虚青、Http解析
要理解Http它呀,最重要的就是熟悉Http中的Http Header,Http Header控制著互聯(lián)網(wǎng)上成千上萬的用戶的數(shù)據(jù)的傳輸棒厘。最關(guān)鍵的是纵穿,它控制著用戶瀏覽器的渲染行為和服務(wù)器的執(zhí)行邏輯。
** 瀏覽器緩存機(jī)制:**
在我們?yōu)g覽一個(gè)頁面發(fā)現(xiàn)有異常時(shí)奢人,通澄矫剑考慮是不是瀏覽器做了緩存,一般做法Ctrl+F5(mac chrome為command+shift+R)重新請(qǐng)求一次這個(gè)頁面何乎,該頁面肯定是最新的頁面句惯。
原因:
- 瀏覽器直接向目標(biāo)Url發(fā)送請(qǐng)求,不用瀏覽器緩存支救。
- 即使應(yīng)用服務(wù)器前端部署緩存服務(wù)器抢野,也能看到最新的數(shù)據(jù),因?yàn)橥ㄟ^Http請(qǐng)求頭來控制各墨,具體如下指孤。
請(qǐng)求頭新增兩個(gè)請(qǐng)求項(xiàng):
- Pragma:no-cache
- Cache-Control:no-cache
- Cache-Control/Pragma
這個(gè)Http Head字段用于指定所有緩存機(jī)制在整個(gè)請(qǐng)求/響應(yīng)鏈中必須服從的指令
Expires
Expires通常的使用格式是Expires:Sat, 25 Feb 2012 12:22:17 GMT, 后面跟著一個(gè)日期和時(shí)間,超過這個(gè)時(shí)間后贬堵,緩存的內(nèi)容將失效恃轩,也就是瀏覽器在發(fā)請(qǐng)求之前接著頁面的這個(gè)字段,看頁面是否過期扁瓢,過期就重新向服務(wù)器發(fā)送請(qǐng)求详恼。Last-Modified/Etag
Last-Modified字段用于表示一個(gè)服務(wù)器上的資源的最后修改時(shí)間,一般服務(wù)端在響應(yīng)頭中返回該字段引几,瀏覽器再次請(qǐng)求shi時(shí)在請(qǐng)求頭中增加一個(gè)If-Modified-since字段昧互,詢問當(dāng)前緩存頁面是否最新,若是伟桅,返回304狀態(tài)碼敞掘,告訴瀏覽器是最新,服務(wù)器也不會(huì)傳輸新的數(shù)據(jù)楣铁。
Etag與上述字段相似玖雁,讓服務(wù)端給每個(gè)頁面分配一個(gè)唯一的編號(hào),通過編號(hào)來區(qū)分這個(gè)頁面是否最新盖腕。
四赫冬、DNS域名解析
- 解析過程
當(dāng)用戶在瀏覽器中輸入域名按下回車:
(1)瀏覽器先查緩存浓镜,若緩存中有域名對(duì)應(yīng)IP地址,則解析結(jié)束劲厌。(存活時(shí)間TTL)
(2)若瀏覽器緩存中沒有膛薛,瀏覽器會(huì)查詢操作系統(tǒng)中緩存緩存是否有這個(gè)域名對(duì)應(yīng)的DNS解析結(jié)果。(hosts 文件)
(3)如果在本機(jī)中仍然無法完成域名的解析补鼻,則會(huì)真正請(qǐng)求域名服務(wù)器來解析這個(gè)域名了哄啄。操作系統(tǒng)會(huì)把域名發(fā)送給設(shè)置的LDNS(cat /etc/resolv.conf)。
(4)若LDNS沒有命中风范,就直接到Root Server域名服務(wù)器請(qǐng)求解析咨跌。
(5)根域名服務(wù)器返回本地域名服務(wù)器一個(gè)所查詢域的主域名服務(wù)器(gTLD Server)地址。GTLD是國際頂級(jí)域名服務(wù)器硼婿,如.com锌半、.cn、.org等加酵,全球只有13臺(tái)左右拳喻。
(6)本地域名服務(wù)器(Local DNS Server)再向上一步返回的GTLD服務(wù)器發(fā)送請(qǐng)求。
(7)接受請(qǐng)求的GTLD服務(wù)器查找并返回此域名對(duì)應(yīng)的Name Server域名服務(wù)器猪腕,這個(gè)Name Server通常就是你注冊(cè)的域名服務(wù)器冗澈,例如你在某個(gè)域名服務(wù)提供商申請(qǐng)的域名,那么這個(gè)域名解析任務(wù)就有這個(gè)域名提供商的服務(wù)器來完成陋葡。
(8)Name Server返回IP記錄和TTL(緩存時(shí)間)亚亲。
(9)LDNS緩存該記錄,緩存時(shí)間有TTL控制腐缤。
(10)解析結(jié)果返回給用戶捌归,用戶根據(jù)TTL值緩存在本地系統(tǒng)緩存中,域名解析過程結(jié)束岭粤。
在實(shí)際的DNS解析過程中惜索,可能不止這10步,如Name Server可能有多級(jí)剃浇,或者有一個(gè)GTM來負(fù)載均衡控制等巾兆。
可通過nslookup、dig 命令來跟蹤域名解析過程虎囚。
五角塑、CDN工作機(jī)制
CDN即內(nèi)容分發(fā)網(wǎng)絡(luò)(Content Delivery Network),目的是通過現(xiàn)有的Internet中增加一層新的網(wǎng)絡(luò)架構(gòu),將網(wǎng)站的內(nèi)容發(fā)布到最接近用戶的網(wǎng)絡(luò)邊緣淘讥,使用戶可以就近取得所需內(nèi)容圃伶,提高用戶訪問網(wǎng)站響應(yīng)速度。
CDN = 鏡像(Mirror)+ 緩存(Cache)+ 整體負(fù)載均衡(GSLB)
目前CDN都已緩存網(wǎng)站中靜態(tài)數(shù)據(jù)為主。
**CDN 架構(gòu): **
** CDN動(dòng)態(tài)加速 **
CDN的動(dòng)態(tài)加速技術(shù)也是當(dāng)前比較流行的一種優(yōu)化技術(shù)窒朋,是在CDN的DNS解析中通過動(dòng)態(tài)的鏈路探測來尋找回源最好的一條路徑搀罢,然后通過DNS的調(diào)度將所有請(qǐng)求調(diào)度到選定的這條路徑上回源,從而加速用戶的訪問炼邀。