HTTP報(bào)文是面向文本的慕趴,報(bào)文中的每一個(gè)字段都是一些ASCII碼串,各個(gè)字段的長(zhǎng)度是不確定的鄙陡。HTTP有兩類報(bào)文:請(qǐng)求報(bào)文和響應(yīng)報(bào)文冕房。
HTTP請(qǐng)求報(bào)文
一個(gè)HTTP請(qǐng)求報(bào)文由請(qǐng)求行(request line)、請(qǐng)求頭部(header)趁矾、空行和請(qǐng)求數(shù)據(jù)4個(gè)部分組成耙册,下圖給出了請(qǐng)求報(bào)文的一般格式。
or
<request-line>
<headers>
<blank line>
<request-body>
1.請(qǐng)求行
請(qǐng)求行由請(qǐng)求方法字段毫捣、URL字段和HTTP協(xié)議版本字段3個(gè)字段組成详拙,它們用空格分隔帝际。例如,GET /index.html HTTP/1.1饶辙。
HTTP協(xié)議的請(qǐng)求方法有GET蹲诀、POST、HEAD弃揽、PUT脯爪、DELETE、OPTIONS矿微、TRACE痕慢、CONNECT。
而常見的有如下幾種:
- GET
最常見的一種請(qǐng)求方式涌矢,當(dāng)客戶端要從服務(wù)器中讀取文檔時(shí)掖举,當(dāng)點(diǎn)擊網(wǎng)頁上的鏈接或者通過在瀏覽器的地址欄輸入網(wǎng)址來瀏覽網(wǎng)頁的,使用的都是GET方式娜庇。GET方法要求服務(wù)器將URL定位的資源放在響應(yīng)報(bào)文的數(shù)據(jù)部分塔次,回送給客戶端。使用GET方法時(shí)思灌,請(qǐng)求參數(shù)和對(duì)應(yīng)的值附加在URL后面俺叭,利用一個(gè)問號(hào)(“?”)代表URL的結(jié)尾與請(qǐng)求參數(shù)的開始,傳遞參數(shù)長(zhǎng)度受限制泰偿。例如熄守,/index.jsp?id=100&op=bind,這樣通過GET方式傳遞的數(shù)據(jù)直接表示在地址中,所以我們可以把請(qǐng)求結(jié)果以鏈接的形式發(fā)送給好友耗跛。以用google搜索domety為例裕照,Request格式如下:
GET /search?hl=zh-CN&source=hp&q=domety&aq=f&oq= HTTP/1.1
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint,
application/msword, application/x-silverlight, application/x-shockwave-flash, */*
Referer: <a >http://www.google.cn/</a>
Accept-Language: zh-cn
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; TheWorld)
Host: <a >www.google.cn</a>
Connection: Keep-Alive
Cookie: PREF=ID=80a06da87be9ae3c:U=f7167333e2c3b714:NW=1:TM=1261551909:LM=1261551917:S=ybYcq2wpfefs4V9g;
NID=31=ojj8d-IygaEtSxLgaJmqSjVhCspkviJrB6omjamNrSm8lZhKy_yMfO2M4QMRKcH1g0iQv9u-2hfBW7bUFwVh7pGaRUb0RnHcJU37y-
FxlRugatx63JLv7CWMD6UB_O_r
可以看到,GET方式的請(qǐng)求一般不包含”請(qǐng)求內(nèi)容”部分调塌,請(qǐng)求數(shù)據(jù)以地址的形式表現(xiàn)在請(qǐng)求行晋南。地址鏈接如下:
<a >http://www.google.cn/search?hl=zh-CN&source=hp
&q=domety&aq=f&oq=</a>
地址中”?”之后的部分就是通過GET發(fā)送的請(qǐng)求數(shù)據(jù),我們可以在地址欄中清楚的看到羔砾,各個(gè)數(shù)據(jù)之間用”&”符號(hào)隔開负间。顯然,這種方式不適合傳送私密數(shù)據(jù)姜凄。另外政溃,由于不同的瀏覽器對(duì)地址的字符限制也有所不同,一般最多只能識(shí)別1024個(gè)字符态秧,所以如果需要傳送大量數(shù)據(jù)的時(shí)候董虱,也不適合使用GET方式。
- POST
對(duì)于上面提到的不適合使用GET方式的情況,可以考慮使用POST方式愤诱,因?yàn)槭褂肞OST方法可以允許客戶端給服務(wù)器提供信息較多云头。POST方法將請(qǐng)求參數(shù)封裝在HTTP請(qǐng)求數(shù)據(jù)中,以名稱/值的形式出現(xiàn)淫半,可以傳輸大量數(shù)據(jù)溃槐,這樣POST方式對(duì)傳送的數(shù)據(jù)大小沒有限制,而且也不會(huì)顯示在URL中撮慨。還以上面的搜索domety為例竿痰,如果使用POST方式的話,格式如下:
POST /search HTTP/1.1
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint,
application/msword, application/x-silverlight, application/x-shockwave-flash, */*
Referer: <a >http://www.google.cn/</a>
Accept-Language: zh-cn
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; TheWorld)
Host: <a >www.google.cn</a>
Connection: Keep-Alive
Cookie: PREF=ID=80a06da87be9ae3c:U=f7167333e2c3b714:NW=1:TM=1261551909:LM=1261551917:S=ybYcq2wpfefs4V9g;
NID=31=ojj8d-IygaEtSxLgaJmqSjVhCspkviJrB6omjamNrSm8lZhKy_yMfO2M4QMRKcH1g0iQv9u-2hfBW7bUFwVh7pGaRUb0RnHcJU37y-
FxlRugatx63JLv7CWMD6UB_O_r
hl=zh-CN&source=hp&q=domety
可以看到砌溺,POST方式請(qǐng)求行中不包含數(shù)據(jù)字符串影涉,這些數(shù)據(jù)保存在”請(qǐng)求內(nèi)容”部分,各數(shù)據(jù)之間也是使用”&”符號(hào)隔開规伐。POST方式大多用于頁面的表單中蟹倾。因?yàn)镻OST也能完成GET的功能,因此多數(shù)人在設(shè)計(jì)表單的時(shí)候一律都使用POST方式猖闪,其實(shí)這是一個(gè)誤區(qū)鲜棠。GET方式也有自己的特點(diǎn)和優(yōu)勢(shì),我們應(yīng)該根據(jù)不同的情況來選擇是使用GET還是使用POST培慌。
- HEAD
HEAD就像GET豁陆,只不過服務(wù)端接受到HEAD請(qǐng)求后只返回響應(yīng)頭,而不會(huì)發(fā)送響應(yīng)內(nèi)容吵护。當(dāng)我們只需要查看某個(gè)頁面的狀態(tài)的時(shí)候盒音,使用HEAD是非常高效的,因?yàn)樵趥鬏數(shù)倪^程中省去了頁面內(nèi)容馅而。
2.請(qǐng)求頭部
請(qǐng)求頭部由關(guān)鍵字/值對(duì)組成祥诽,每行一對(duì),關(guān)鍵字和值用英文冒號(hào)“:”分隔瓮恭。請(qǐng)求頭部通知服務(wù)器有關(guān)于客戶端請(qǐng)求的信息雄坪,典型的請(qǐng)求頭有:
User-Agent:產(chǎn)生請(qǐng)求的瀏覽器類型。
Accept:客戶端可識(shí)別的內(nèi)容類型列表屯蹦。
Host:請(qǐng)求的主機(jī)名维哈,允許多個(gè)域名同處一個(gè)IP地址,即虛擬主機(jī)登澜。
3.空行
最后一個(gè)請(qǐng)求頭之后是一個(gè)空行阔挠,發(fā)送回車符和換行符,通知服務(wù)器以下不再有請(qǐng)求頭帖渠。
4.請(qǐng)求數(shù)據(jù)
請(qǐng)求數(shù)據(jù)不在GET方法中使用谒亦,而是在POST方法中使用竭宰。POST方法適用于需要客戶填寫表單的場(chǎng)合空郊。與請(qǐng)求數(shù)據(jù)相關(guān)的最常使用的請(qǐng)求頭是Content-Type和Content-Length份招。
HTTP響應(yīng)報(bào)文
HTTP響應(yīng)報(bào)文也由四個(gè)部分組成,分別是:狀態(tài)行狞甚、消息報(bào)頭锁摔、空行、響應(yīng)正文哼审。如下所示谐腰,HTTP響應(yīng)報(bào)文的格式與請(qǐng)求報(bào)文的格式十分類似:
or
<status-line>
<headers>
<blank line>
<response-body>
正如你所見,在響應(yīng)中唯一真正的區(qū)別在于第一行中用狀態(tài)信息代替了請(qǐng)求信息涩盾。狀態(tài)行(status line)通過提供一個(gè)狀態(tài)碼來說明所請(qǐng)求的資源情況十气。
狀態(tài)行格式如下:
HTTP-Version Status-Code Reason-Phrase CRLF
其中,HTTP-Version表示服務(wù)器HTTP協(xié)議的版本春霍;Status-Code表示服務(wù)器發(fā)回的響應(yīng)狀態(tài)代碼砸西;Reason-Phrase表示狀態(tài)代碼的文本描述。狀態(tài)代碼由三位數(shù)字組成址儒,第一個(gè)數(shù)字定義了響應(yīng)的類別芹枷,且有五種可能取值。
- 1xx:指示信息--表示請(qǐng)求已接收莲趣,繼續(xù)處理鸳慈。
- 2xx:成功--表示請(qǐng)求已被成功接收、理解喧伞、接受走芋。
- 3xx:重定向--要完成請(qǐng)求必須進(jìn)行更進(jìn)一步的操作。
- 4xx:客戶端錯(cuò)誤--請(qǐng)求有語法錯(cuò)誤或請(qǐng)求無法實(shí)現(xiàn)絮识。
- 5xx:服務(wù)器端錯(cuò)誤--服務(wù)器未能實(shí)現(xiàn)合法的請(qǐng)求绿聘。
常見狀態(tài)代碼、狀態(tài)描述的說明如下次舌。
- 200 OK:客戶端請(qǐng)求成功熄攘。
- 400 Bad Request:客戶端請(qǐng)求有語法錯(cuò)誤,不能被服務(wù)器所理解彼念。
- 401 Unauthorized:請(qǐng)求未經(jīng)授權(quán)挪圾,這個(gè)狀態(tài)代碼必須和WWW-Authenticate報(bào)頭域一起使用。
- 403 Forbidden:服務(wù)器收到請(qǐng)求逐沙,但是拒絕提供服務(wù)哲思。
- 404 Not Found:請(qǐng)求資源不存在,舉個(gè)例子:輸入了錯(cuò)誤的URL吩案。
- 500 Internal Server Error:服務(wù)器發(fā)生不可預(yù)期的錯(cuò)誤棚赔。
- 503 Server Unavailable:服務(wù)器當(dāng)前不能處理客戶端的請(qǐng)求,一段時(shí)間后可能恢復(fù)正常,舉個(gè)例子:HTTP/1.1 200 OK(CRLF)靠益。
下面給出一個(gè)HTTP響應(yīng)報(bào)文例子
HTTP/1.1 200 OK
Date: Sat, 31 Dec 2005 23:59:59 GMT
Content-Type: text/html;charset=ISO-8859-1
Content-Length: 122
<html>
<head>
<title>W(wǎng)rox Homepage</title>
</head>
<body>
<!-- body goes here -->
</body>
</html>
關(guān)于HTTP請(qǐng)求GET和POST的區(qū)別
- GET提交丧肴,請(qǐng)求的數(shù)據(jù)會(huì)附在URL之后(就是把數(shù)據(jù)放置在HTTP協(xié)議頭<request-line>中),以?分割URL和傳輸數(shù)據(jù)胧后,多個(gè)參數(shù)用&連接;例如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD芋浮。如果數(shù)據(jù)是英文字母/數(shù)字,原樣發(fā)送壳快,如果是空格纸巷,轉(zhuǎn)換為+,如果是中文/其他字符眶痰,則直接把字符串用BASE64加密瘤旨,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX為該符號(hào)以16進(jìn)制表示的ASCII竖伯。
POST提交:把提交的數(shù)據(jù)放置在是HTTP包的包體<request-body>中裆站。上文示例中紅色字體標(biāo)明的就是實(shí)際的傳輸數(shù)據(jù)
因此,GET提交的數(shù)據(jù)會(huì)在地址欄中顯示出來黔夭,而POST提交宏胯,地址欄不會(huì)改變。
- 傳輸數(shù)據(jù)的大斜纠选:
首先聲明,HTTP協(xié)議沒有對(duì)傳輸?shù)臄?shù)據(jù)大小進(jìn)行限制肩袍,HTTP協(xié)議規(guī)范也沒有對(duì)URL長(zhǎng)度進(jìn)行限制。 而在實(shí)際開發(fā)中存在的限制主要有:
GET:特定瀏覽器和服務(wù)器對(duì)URL長(zhǎng)度有限制婚惫,例如IE對(duì)URL長(zhǎng)度的限制是2083字節(jié)(2K+35)氛赐。對(duì)于其他瀏覽器,如Netscape先舷、FireFox等艰管,理論上沒有長(zhǎng)度限制,其限制取決于操作系統(tǒng)的支持蒋川。
因此對(duì)于GET提交時(shí)牲芋,傳輸數(shù)據(jù)就會(huì)受到URL長(zhǎng)度的限制。
POST:由于不是通過URL傳值捺球,理論上數(shù)據(jù)不受限缸浦。但實(shí)際各個(gè)WEB服務(wù)器會(huì)規(guī)定對(duì)post提交數(shù)據(jù)大小進(jìn)行限制,Apache氮兵、IIS6都有各自的配置裂逐。
- 安全性:
POST的安全性要比GET的安全性高。注意:這里所說的安全性和上面GET提到的“安全”不是同個(gè)概念泣栈。上面“安全”的含義僅僅是不作數(shù)據(jù)修改卜高,而這里安全的含義是真正的Security的含義弥姻,比如:通過GET提交數(shù)據(jù),用戶名和密碼將明文出現(xiàn)在URL上掺涛,因?yàn)?1)登錄頁面有可能被瀏覽器緩存蚁阳, (2)其他人查看瀏覽器的歷史紀(jì)錄,那么別人就可以拿到你的賬號(hào)和密碼了鸽照,