HTTP協(xié)議
首先學(xué)長們講的非常好东亦,在此我寫一些學(xué)習(xí)的心得。
URL
HTTP使用統(tǒng)一資源標(biāo)識(shí)符(URI)來傳輸數(shù)據(jù)和建立連接唬渗。URL是一種特殊的URI包含了用于查找某一資源的足夠信息典阵。URL中文叫統(tǒng)一資源定位符奋渔。
一個(gè)完整的URL包含了一下部分
http://www.reibang.com/writer#/notebooks/31830095/notes/38005704;
1.協(xié)議部分:這個(gè)URL協(xié)議部分為http:萄喳,這表示該網(wǎng)站用的為HTTP協(xié)議卒稳。在internet中可以使用多種協(xié)議例如HTTP,F(xiàn)TP等等他巨。在協(xié)議后面使用//充坑。
2.域名地址:這個(gè)URL的域名為www.reibang.com,也可以使用IP地址作為域名使用染突。
3.端口部分:在域名后面使用的為端口部分與域名之間使用:連接捻爷,端口不是一個(gè)URL必須的部分,如果不使用端口系統(tǒng)則使用默認(rèn)端口份企。
4.虛擬目錄部分:從域名第一個(gè)/開始到最后一個(gè)/結(jié)束都是虛擬目錄部分也榄,虛擬目錄也不是一個(gè)URL必須的部分。該例中/writer#/notebooks/31830095/notes/為URL的虛擬目錄司志。
5.文件名部分:文件名是從最后一個(gè)/到甜紫?結(jié)束,如果沒有 骂远? 則是從最后一個(gè) / 到 # 結(jié)束囚霸,如果,沒有 激才?拓型,# 則是從最后一個(gè) / 到結(jié)束為止,如果沒有文件名則使用默認(rèn)文件名瘸恼。此URL的文件名為38005704劣挫。
6.錨部分:從#開始到結(jié)束都是錨部分,錨部分也不是一個(gè)URL必須的部分东帅。
7.參數(shù)部分:是從 压固? 到 # 部分之間的部分,也叫搜索部分靠闭。參數(shù)與參數(shù)之間使用 & 連接邓夕。參數(shù)部分可以有多個(gè)參數(shù)。
URL和URI的區(qū)別
URI阎毅,統(tǒng)一資源標(biāo)識(shí)符,用來唯一的標(biāo)識(shí)一個(gè)資源点弯。
web上可用的每種資源如HTML文檔扇调,圖像視頻片段,都可以使用URI來定位抢肛。
URI一般由三部分組成
1.訪問資源的機(jī)制狼钮。
2.存放資源的主機(jī)名
3.資源自身的名稱碳柱,由路徑表示,著重強(qiáng)調(diào)于資源熬芜。
URL統(tǒng)一資源定位器是一種具體的URI莲镣,即可以標(biāo)識(shí)一個(gè)資源又可以定位這個(gè)資源。
URL是Internet上用來描述信息資源的字符串涎拉,主要用在各種WWW客戶程序和服務(wù)器程序上瑞侮,特別是著名的Mosaic。 采用URL可以用一種統(tǒng)一的格式來描述各種信息資源鼓拧,包括文件半火、服務(wù)器的地址和目錄等。URL一般由三部組成:
1.協(xié)議(或稱為服務(wù)方式)
2.存有該資源的主機(jī)IP地址(有時(shí)也包括端口號(hào))
3.主機(jī)資源的具體地址季俩。如目錄和文件名等
URN統(tǒng)一資源命名钮糖,通過名字來標(biāo)識(shí)資源。
URI是以一種抽象的酌住,高層次概念定義統(tǒng)一資源標(biāo)識(shí)店归,而URL和URN則是具體的資源標(biāo)識(shí)的方式。URL和URN都是一種URI酪我∠矗籠統(tǒng)地說,每個(gè) URL 都是 URI祭示,但不一定每個(gè) URI 都是 URL肄满。這是因?yàn)?URI 還包括一個(gè)子類,即統(tǒng)一資源名稱 (URN)质涛,它命名資源但不指定如何定位資源稠歉。上面的 mailto、news 和 isbn URI 都是 URN 的示例汇陆。
HTTP請(qǐng)求消息request
請(qǐng)求格式為 .png
客戶端發(fā)送一個(gè)HTTP請(qǐng)求到服務(wù)器的請(qǐng)求消息包括以下幾個(gè)部分
請(qǐng)求行怒炸,請(qǐng)求頭,空行和請(qǐng)求數(shù)據(jù)毡代。
請(qǐng)求行以一個(gè)方法符號(hào)開頭阅羹,后面緊跟協(xié)議和版本。
get請(qǐng)求例子
GET /562f25980001b1b106000338.jpg HTTP/1.1
Host img.mukewang.com User-Agent Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
Accept image/webp,image/*,*/*;q=0.8 Referer [http://www.imooc.com/](http://www.imooc.com/)
Accept-Encoding gzip, deflate, sdch Accept-Language zh-CN,zh;q=0.8
第一部分:請(qǐng)求行教寂,用來說明請(qǐng)求類型,要訪問的資源以及所使用的HTTP版本.
GET說明請(qǐng)求類型為GET,[/562f25980001b1b106000338.jpg]為要訪問的資源捏鱼,該行的最后一部分說明使用的是HTTP1.1版本。
第二部分:請(qǐng)求頭部酪耕,緊接著請(qǐng)求行(即第一行)之后的部分导梆,用來說明服務(wù)器要使用的附加信息
從第二行起為請(qǐng)求頭部,HOST將指出請(qǐng)求的目的地.
User-Agent,服務(wù)器端和客戶端腳本都能訪問它,它是瀏覽器類型檢測邏輯的重要基礎(chǔ).該信息由你的瀏覽器來定義,并且在每個(gè)請(qǐng)求中自動(dòng)發(fā)送等等
第三部分:空行,請(qǐng)求頭部后面的空行是必須的
即使第四部分的請(qǐng)求數(shù)據(jù)為空看尼,也必須有空行递鹉。
第四部分:請(qǐng)求數(shù)據(jù)也叫主體,可以添加任意的其他數(shù)據(jù)藏斩。
這個(gè)例子中請(qǐng)求部分是空的躏结。
POST請(qǐng)求例子
'''
POST / HTTP1.1
User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)
Content-Type:application/x-www-form-urlencoded
Content-Length:40 Connection: Keep-Alive
name=Professional%20Ajax&publisher=Wiley
'''
第一部分:請(qǐng)求行,第一行明了是post請(qǐng)求狰域,以及http1.1版本媳拴。
第二部分:請(qǐng)求頭部,第二行至第六行北专。
第三部分:空行禀挫,第七行的空行。
第四部分:請(qǐng)求數(shù)據(jù)拓颓,第八行语婴。
HTTP相應(yīng)消息response
一般情況下,服務(wù)器接收并處理客戶端發(fā)過來的請(qǐng)求后會(huì)返回一個(gè)HTTP的響應(yīng)消息驶睦。
http響應(yīng)格式為 . jpg
HTTP/1.1 200 OK
Date: Fri, 22 May 2009 06:07:21 GMT
Content-Type: text/html; charset=UTF-8
<html>
<head></head>
<body>
<!--body gose here-->
</body>
</html>
第一部分:狀態(tài)行砰左,由HTTP協(xié)議版本號(hào), 狀態(tài)碼场航, 狀態(tài)消息 三部分組成缠导。
第一行為狀態(tài)行,(HTTP/1.1)表明HTTP版本為1.1版本溉痢,狀態(tài)碼為200僻造,狀態(tài)消息為(ok)
第二部分:消息報(bào)頭,用來說明客戶端要使用的一些附加信息
第二行和第三行為消息報(bào)頭孩饼, Date:生成響應(yīng)的日期和時(shí)間髓削;Content-Type:指定了MIME類型的HTML(text/html),編碼類型是UTF-8
第三部分:空行,消息報(bào)頭后面的空行是必須的
** 第四部分:響應(yīng)正文镀娶,服務(wù)器返回給客戶端的文本信息立膛。**
空行后面的html部分為響應(yīng)正文。
HTTP狀態(tài)碼
**1xx:指示信息--表示請(qǐng)求已接收梯码,繼續(xù)處理 **
**2xx:成功--表示請(qǐng)求已被成功接收宝泵、理解、接受 **
3xx:重定向--要完成請(qǐng)求必須進(jìn)行更進(jìn)一步的操作
** 4xx:客戶端錯(cuò)誤--請(qǐng)求有語法錯(cuò)誤或請(qǐng)求無法實(shí)現(xiàn)**
** 5xx:服務(wù)器端錯(cuò)誤--服務(wù)器未能實(shí)現(xiàn)合法的請(qǐng)求**
HTTP請(qǐng)求方法
根據(jù)HTTP標(biāo)準(zhǔn)轩娶,HTTP請(qǐng)求可以使用多種請(qǐng)求方法儿奶。
HTTP1.0定義了三種請(qǐng)求方法: GET, POST 和 HEAD方法。
HTTP1.1新增了五種請(qǐng)求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法鳄抒。
GET 請(qǐng)求指定的頁面信息廓握,并返回實(shí)體主體搅窿。
HEAD 類似于get請(qǐng)求,只不過返回的響應(yīng)中沒有具體的內(nèi)容隙券,用于獲取報(bào)頭
POST 向指定資源提交數(shù)據(jù)進(jìn)行處理請(qǐng)求(例如提交表單或者上傳文件)。數(shù)據(jù)被包含在請(qǐng)求體中闹司。POST請(qǐng)求可能會(huì)導(dǎo)致新的資源的建立和/或已有資源的修改娱仔。
PUT 從客戶端向服務(wù)器傳送的數(shù)據(jù)取代指定的文檔的內(nèi)容。
DELETE 請(qǐng)求服務(wù)器刪除指定的頁面游桩。
CONNECT HTTP/1.1協(xié)議中預(yù)留給能夠?qū)⑦B接改為管道方式的代理服務(wù)器牲迫。
OPTIONS 允許客戶端查看服務(wù)器的性能。 TRACE 回顯服務(wù)器收到的請(qǐng)求借卧,主要用于測試或診斷盹憎。
HTTP工作原理
HTTP協(xié)議定義Web客戶端如何從Web服務(wù)器請(qǐng)求Web頁面,以及服務(wù)器如何把Web頁面?zhèn)魉徒o客戶端铐刘。HTTP協(xié)議采用了請(qǐng)求/響應(yīng)模型陪每。客戶端向服務(wù)器發(fā)送一個(gè)請(qǐng)求報(bào)文镰吵,請(qǐng)求報(bào)文包含請(qǐng)求的方法檩禾、URL、協(xié)議版本疤祭、請(qǐng)求頭部和請(qǐng)求數(shù)據(jù)盼产。服務(wù)器以一個(gè)狀態(tài)行作為響應(yīng),響應(yīng)的內(nèi)容包括協(xié)議的版本勺馆、成功或者錯(cuò)誤代碼戏售、服務(wù)器信息、響應(yīng)頭部和響應(yīng)數(shù)據(jù)草穆。
以下是 HTTP 請(qǐng)求/響應(yīng)的步驟:
** 1灌灾、客戶端連接到Web服務(wù)器**
一個(gè)HTTP客戶端,通常是瀏覽器续挟,與Web服務(wù)器的HTTP端口(默認(rèn)為80)建立一個(gè)TCP套接字連接紧卒。例如,http://www.oakcms.cn诗祸。
2跑芳、發(fā)送HTTP請(qǐng)求
通過TCP套接字,客戶端向Web服務(wù)器發(fā)送一個(gè)文本的請(qǐng)求報(bào)文直颅,一個(gè)請(qǐng)求報(bào)文由請(qǐng)求行博个、請(qǐng)求頭部、空行和請(qǐng)求數(shù)據(jù)4部分組成功偿。
** 3盆佣、服務(wù)器接受請(qǐng)求并返回HTTP響應(yīng) **
Web服務(wù)器解析請(qǐng)求往堡,定位請(qǐng)求資源。服務(wù)器將資源復(fù)本寫到TCP套接字共耍,由客戶端讀取虑灰。一個(gè)響應(yīng)由狀態(tài)行蜗元、響應(yīng)頭部损姜、空行和響應(yīng)數(shù)據(jù)4部分組成黔寇。
** 4蔬蕊、釋放連接TCP連接 **
若connection 模式為close地熄,則服務(wù)器主動(dòng)關(guān)閉TCP連接锉矢,客戶端被動(dòng)關(guān)閉連接哟沫,釋放TCP連接;若connection 模式為keepalive欣范,則該連接會(huì)保持一段時(shí)間遗淳,在該時(shí)間內(nèi)可以繼續(xù)接收請(qǐng)求;
5拍柒、客戶端瀏覽器解析HTML內(nèi)容
客戶端瀏覽器首先解析狀態(tài)行,查看表明請(qǐng)求是否成功的狀態(tài)代碼屈暗。然后解析每一個(gè)響應(yīng)頭拆讯,響應(yīng)頭告知以下為若干字節(jié)的HTML文檔和文檔的字符集】纸酰客戶端瀏覽器讀取響應(yīng)數(shù)據(jù)HTML往果,根據(jù)HTML的語法對(duì)其進(jìn)行格式化,并在瀏覽器窗口中顯示一铅。 例如:在瀏覽器地址欄鍵入U(xiǎn)RL陕贮,按下回車之后會(huì)經(jīng)歷以下流程:
1、瀏覽器向 DNS 服務(wù)器請(qǐng)求解析該 URL 中的域名所對(duì)應(yīng)的 IP 地址;
2潘飘、解析出 IP 地址后肮之,根據(jù)該 IP 地址和默認(rèn)端口 80,和服務(wù)器建立TCP連接;
3卜录、瀏覽器發(fā)出讀取文件(URL 中域名后面部分對(duì)應(yīng)的文件)的HTTP 請(qǐng)求戈擒,該請(qǐng)求報(bào)文作為 TCP 三次握手的第三個(gè)報(bào)文的數(shù)據(jù)發(fā)送給服務(wù)器;
4、服務(wù)器對(duì)瀏覽器請(qǐng)求作出響應(yīng)艰毒,并把對(duì)應(yīng)的 html 文本發(fā)送給瀏覽器;
5筐高、釋放 TCP連接;
6、瀏覽器將該 html 文本并顯示內(nèi)容;
GET和POST的區(qū)別
GET請(qǐng)求
GET /books/?sex=man&name=Professional HTTP/1.1
Host: www.wrox.com User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6) Gecko/20050225 Firefox/1.0.1
Connection: Keep-Alive
注意最后一行是空行
POST請(qǐng)求
POST / HTTP/1.1
Host: www.wrox.com User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6) Gecko/20050225 Firefox/1.0.1
Content-Type: application/x-www-form-urlencoded
Content-Length: 40 Connection: Keep-Alive name=Professional%20Ajax&publisher=Wiley
1丑瞧、GET提交柑土,請(qǐng)求的數(shù)據(jù)會(huì)附在URL之后(就是把數(shù)據(jù)放置在HTTP協(xié)議頭中),以?分割URL和傳輸數(shù)據(jù)绊汹,多個(gè)參數(shù)用&連接稽屏;例 如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD。如果數(shù)據(jù)是英文字母/數(shù)字西乖,原樣發(fā)送狐榔,如果是空格坛增,轉(zhuǎn)換為+,如果是中文/其他字符薄腻,則直接把字符串用BASE64加密收捣,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX為該符號(hào)以16進(jìn)制表示的ASCII庵楷。 POST提交:把提交的數(shù)據(jù)放置在是HTTP包的包體中坏晦。上文示例中紅色字體標(biāo)明的就是實(shí)際的傳輸數(shù)據(jù) 因此,GET提交的數(shù)據(jù)會(huì)在地址欄中顯示出來嫁乘,而POST提交,地址欄不會(huì)改變
2球碉、傳輸數(shù)據(jù)的大序迅:首先聲明:HTTP協(xié)議沒有對(duì)傳輸?shù)臄?shù)據(jù)大小進(jìn)行限制,HTTP協(xié)議規(guī)范也沒有對(duì)URL長度進(jìn)行限制睁冬。 而在實(shí)際開發(fā)中存在的限制主要有: GET:特定瀏覽器和服務(wù)器對(duì)URL長度有限制挎春,例如 IE對(duì)URL長度的限制是2083字節(jié)(2K+35)。對(duì)于其他瀏覽器豆拨,如Netscape直奋、FireFox等,理論上沒有長度限制施禾,其限制取決于操作系 統(tǒng)的支持脚线。 因此對(duì)于GET提交時(shí),傳輸數(shù)據(jù)就會(huì)受到URL長度的 限制弥搞。 POST:由于不是通過URL傳值邮绿,理論上數(shù)據(jù)不受 限。但實(shí)際各個(gè)WEB服務(wù)器會(huì)規(guī)定對(duì)post提交數(shù)據(jù)大小進(jìn)行限制攀例,Apache船逮、IIS6都有各自的配置。
3粤铭、安全性 POST的安全性要比GET的安全性高挖胃。比如:通過GET提交數(shù)據(jù),用戶名和密碼將明文出現(xiàn)在URL上梆惯,因?yàn)?1)登錄頁面有可能被瀏覽器緩存酱鸭;(2)其他人查看瀏覽器的歷史紀(jì)錄,那么別人就可以拿到你的賬號(hào)和密碼了加袋,除此之外凛辣,使用GET提交數(shù)據(jù)還可能會(huì)造成Cross-site request forgery攻擊
4、Http get,post,soap協(xié)議都是在http上運(yùn)行的
(1)get:請(qǐng)求參數(shù)是作為一個(gè)key/value對(duì)的序列(查詢字符串)附加到URL上的 查詢字符串的長度受到web瀏覽器和web服務(wù)器的限制(如IE最多支持2048個(gè)字符)职烧,不適合傳輸大型數(shù)據(jù)集同時(shí)扁誓,它很不安全
(2)post:請(qǐng)求參數(shù)是在http標(biāo)題的一個(gè)不同部分(名為entity body)傳輸?shù)姆辣茫@一部分用來傳輸表單信息,因此必須將Content-type設(shè)置為:application/x-www-form- urlencoded蝗敢。post設(shè)計(jì)用來支持web窗體上的用戶字段捷泞,其參數(shù)也是作為key/value對(duì)傳輸。 但是:它不支持復(fù)雜數(shù)據(jù)類型寿谴,因?yàn)閜ost沒有定義傳輸數(shù)據(jù)結(jié)構(gòu)的語義和規(guī)則锁右。
(3)soap:是http post的一個(gè)專用版本,遵循一種特殊的xml消息格式 Content-type設(shè)置為: text/xml 任何數(shù)據(jù)都可以xml化讶泰。 Http協(xié)議定義了很多與服務(wù)器交互的方法咏瑟,最基本的有4種,分別是GET,POST,PUT,DELETE. 一個(gè)URL地址用于描述一個(gè)網(wǎng)絡(luò)上的資源痪署,而HTTP中的GET, POST, PUT, DELETE就對(duì)應(yīng)著對(duì)這個(gè)資源的查码泞,改,增狼犯,刪4個(gè)操作余寥。 我們最常見的就是GET和POST了。GET一般用于獲取/查詢資源信息悯森,而POST一般用于更新資源信息. 我們看看GET和POST的區(qū)別
1. GET提交的數(shù)據(jù)會(huì)放在URL之后宋舷,以?分割URL和傳輸數(shù)據(jù),參數(shù)之間以&相連瓢姻,如EditPosts.aspx?name=test1&id=123456. POST方法是把提交的數(shù)據(jù)放在HTTP包的Body中.
2. GET提交的數(shù)據(jù)大小有限制(因?yàn)闉g覽器對(duì)URL的長度有限制)祝蝠,而POST方法提交的數(shù)據(jù)沒有限制. 3. GET方式需要使用Request.QueryString來取得變量的值,而POST方式通過Request.Form來獲取變量的值汹来。
4. GET方式提交數(shù)據(jù)续膳,會(huì)帶來安全問題,比如一個(gè)登錄頁面收班,通過GET方式提交數(shù)據(jù)時(shí)坟岔,用戶名和密碼將出現(xiàn)在URL上,如果頁面可以被緩存或者其他人可以訪問這臺(tái)機(jī)器摔桦,就可以從歷史記錄獲得該用戶的賬號(hào)和密碼.