轉(zhuǎn)自咖啡機(jī)(K.F.J)
最近在看一本關(guān)于網(wǎng)絡(luò)協(xié)議的書《圖解HTTP》
當(dāng)我們在瀏覽器的地址欄輸入 http://www.pwstrick.com 呻此,然后回車榆纽,回車這一瞬間到看到頁面到底發(fā)生了什么呢?
- 域名解析
- 建立TCP連接
- 發(fā)起HTTP請求
- 服務(wù)器響應(yīng)HTTP請求
- 瀏覽器渲染頁面
自己原先不是很了解,通過讀了這本書后了解了些內(nèi)幕祠斧。
接下來將使用工具Chrome领迈、Fiddler压彭、Wireshark运翼。曾經(jīng)寫過一篇Fiddler的教程《移動開發(fā)中Fiddler的那些事兒》双谆。
一壳咕、基礎(chǔ)概念
1)TCP/IP是互聯(lián)網(wǎng)相關(guān)的各類協(xié)議族的總稱
2)TCP/IP分為4層:應(yīng)用層、傳輸層顽馋、網(wǎng)絡(luò)層谓厘、鏈路層。
發(fā)送端從應(yīng)用層網(wǎng)下走寸谜,接收端從鏈路層網(wǎng)上走竟稳。
IP(Internet Protocol):網(wǎng)際協(xié)議位于網(wǎng)絡(luò)層,IP地址可以和MAC地址配對熊痴。
ARP(Address Resolution Protocol):ARP是一種用以解析地址的協(xié)議他爸,根據(jù)通信方的IP地址反查出對應(yīng)的MAC地址。
Routing:路由選擇果善,有點(diǎn)像快遞公司的送貨過程诊笤。
TCP(Transmission Control Protocol):傳輸控制協(xié)議,提供可靠的字節(jié)流傳輸巾陕,將大數(shù)據(jù)分割成報(bào)文段(segment)讨跟,TCP協(xié)議能夠確認(rèn)數(shù)據(jù)最終是否送達(dá)到對方。
3)數(shù)據(jù)信息包裝
4)域名解析DNS服務(wù)
DNS(Domain Name System)位于應(yīng)用層鄙煤,提供域名和IP地址之間的解析服務(wù)晾匠。
5)URI和URL
URI(Uniform Resource Identifier):統(tǒng)一資源標(biāo)識符。
URL(Uniform Resoure Locator):統(tǒng)一資源定位符梯刚,通俗的說法是網(wǎng)址凉馆。
URI表示某一互聯(lián)網(wǎng)資源,而URL表示資源地點(diǎn)亡资,所以URL是URI的子集澜共,下面是幾個URI資源。
6)RFC
RFC(Request For Comments):征求修正意見書沟于,RFC是互聯(lián)網(wǎng)的設(shè)計(jì)文檔咳胃。
要是不按照RFC標(biāo)準(zhǔn)執(zhí)行,就有可能導(dǎo)致無法通信的狀況旷太。
7)HTTP
HTTP是無狀態(tài)協(xié)議展懈,協(xié)議對于發(fā)送過的請求或響應(yīng)都不做持久化處理销睁。
HTTP/1.1為了實(shí)現(xiàn)保持狀態(tài)的功能,引入了Cookie存崖。
二冻记、域名解析
在《What really happens when you navigate to a URL》中曾提到DNS會先在緩存中查找記錄。
瀏覽器緩存来惧、系統(tǒng)緩存冗栗、路由器緩存、ISP DNS 緩存供搀、遞歸搜索隅居。
三、建立TCP連接
1)發(fā)送端發(fā)送一個帶SYN標(biāo)志的數(shù)據(jù)包給對方
Sequence Number:序號葛虐;
Acknowledgment Number:確認(rèn)號胎源。
2)接收端回傳一個帶有SYN和ACK標(biāo)志的數(shù)據(jù)包以示傳達(dá)確認(rèn)信息
3)發(fā)送端再回傳一個帶ACK標(biāo)志的數(shù)據(jù)包,代表“握手結(jié)束”
四屿脐、發(fā)起HTTP請求
HTTP(Hyper Text Transfer Protocol)涕蚤,超文本傳輸協(xié)議,由請求和響應(yīng)構(gòu)成的诵。
在書本的第3章介紹了HTTP信息万栅。
1)請求報(bào)文
報(bào)文首部內(nèi)容如下:
在書本的第6章中有詳細(xì)的HTTP首部說明。
“Connection:keep-alive”:持久連接西疤,只要任意一端沒有明確提出斷開烦粒,就保持TCP連接狀態(tài)。
2)響應(yīng)報(bào)文
報(bào)文首部內(nèi)容如下:
上圖中的200是HTTP狀態(tài)碼瘪阁,在書中的第4章詳細(xì)介紹了狀態(tài)碼撒遣。
五邮偎、服務(wù)器響應(yīng)HTTP請求
從上面的響應(yīng)報(bào)文中可以看到服務(wù)器軟件是Nginx管跺,并且請求的是一張PHP頁面。
以前曾經(jīng)寫過一篇《PHP代碼的執(zhí)行》禾进,不過軟件用的是Apache豁跑。這里就假設(shè)是Apache+PHP(fastcgi)架構(gòu)提供服務(wù)。
1)Apache
Apache對HTTP的請求可以分為連接泻云、處理和斷開連接3個大的階段艇拍。同時也可以分為上圖所示的11個小的階段。
2)FastCGI
FastCGI可以讓一個客戶端宠纯,從網(wǎng)頁瀏覽器向執(zhí)行在Web服務(wù)器上的程序請求數(shù)據(jù)卸夕。
比如現(xiàn)在請求的是“index.php”,根據(jù)配置文件婆瓜,Apache知道這個不是靜態(tài)文 件快集,需要去找PHP解析器來處理贡羔,那么它會把這個請求簡單處理后交給PHP解析器。
Apache會傳url个初、查詢字符串乖寒、POST數(shù)據(jù)、HTTP header等院溺,而CGI就是規(guī)定要傳哪些數(shù)據(jù)楣嘁、以什么樣的格式傳遞給后方處理這個請求的協(xié)議。
3)PHP腳本執(zhí)行
PHP程序完成基本的準(zhǔn)備工作后啟動PHP及Zend引擎珍逸, 加載注冊的擴(kuò)展模塊逐虚。
初始化完成后讀取腳本文件,Zend引擎對腳本文件進(jìn)行詞法分析谆膳,語法分析痊班。
編譯成opcode執(zhí)行。
服務(wù)器最終將生成的HTML代碼返回給瀏覽器摹量。
六涤伐、瀏覽器渲染頁面
從Chrome的網(wǎng)絡(luò)工具中可以看到,瀏覽器會先下載HTML代碼缨称,再去下載CSS或JS外部資源凝果。
網(wǎng)上的很多資料顯示,瀏覽器是邊下載HTML睦尽,邊解析HTML的器净。
有篇文章叫《How browsers work》介紹瀏覽器內(nèi)部工作原理的,文中提到了瀏覽器的渲染引擎——Webkit当凡。
渲染引擎首先通過網(wǎng)絡(luò)獲得所請求文檔的內(nèi)容山害,通常以8K分塊的方式完成,下面是渲染引擎基本流程:
解析HTML以構(gòu)建DOM樹 -> 構(gòu)建Render(渲染)樹 -> 布局Render樹 -> 繪制Render樹
下圖是Webkit的主流程:
參考資料:
Wireshark基本用法
當(dāng)你輸入一個網(wǎng)址沿量,實(shí)際會發(fā)生什么?
一次完整的HTTP事務(wù)是怎樣一個過程
從輸入url到頁面加載完的過程中都發(fā)生了什么事情
當(dāng)在瀏覽器地址欄輸入一個URL后回車浪慌,將會發(fā)生的事情?