HTTP協(xié)議是指計算機通信網(wǎng)絡中兩臺計算機之間進行通信所必須共同遵守的規(guī)定或規(guī)則,超文本傳輸協(xié)議(HTTP)是一種通信協(xié)議,它允許將超文本標記語言(HTML)文檔從Web服務器傳送到客戶端的瀏覽器窒舟。
HTTP協(xié)議岸蜗,即超文本傳輸協(xié)議(Hypertext transfer protocol)。是一種詳細規(guī)定了瀏覽器和萬維網(wǎng)(WWW = World Wide Web)服務器之間互相通信的規(guī)則叠蝇,通過因特網(wǎng)傳送萬維網(wǎng)文檔的數(shù)據(jù)傳送協(xié)議。
HTTP協(xié)議是用于從WWW服務器傳輸超文本到本地瀏覽器的傳送協(xié)議。它可以使瀏覽器更加高效单芜,使網(wǎng)絡傳輸減少。它不僅保證計算機正確快速地傳輸超文本文檔枚冗,還確定傳輸文檔中的哪一部分缓溅,以及哪部分內(nèi)容首先顯示(如文本先于圖形)等赁温。
HTTP是一個應用層協(xié)議,由請求和響應構成袜匿,是一個標準的客戶端服務器模型稚疹。HTTP是一個無狀態(tài)的協(xié)議。
在Internet中所有的傳輸都是通過TCP/IP進行的怪嫌。HTTP協(xié)議作為TCP/IP模型中應用層的協(xié)議也不例外柳沙。HTTP協(xié)議通常承載于TCP協(xié)議之上赂鲤,有時也承載于TLS或SSL協(xié)議層之上,這個時候找爱,就成了我們常說的HTTPS泡孩。如下圖所示:
HTTP默認的端口號為80仑鸥,HTTPS的端口號為443。
瀏覽網(wǎng)頁是HTTP的主要應用薄料,但是這并不代表HTTP就只能應用于網(wǎng)頁的瀏覽泵琳。HTTP是一種協(xié)議获列,只要通信的雙方都遵守這個協(xié)議,HTTP就能有用武之地迫悠。比如咱們常用的QQ巩梢,迅雷這些軟件,都會使用HTTP協(xié)議(還包括其他的協(xié)議)鞠抑。
HTTP協(xié)議工作于客戶端-服務端架構為上搁拙。瀏覽器作為HTTP客戶端通過URL向HTTP服務端即WEB服務器發(fā)送所有請求法绵。Web服務器根據(jù)接收到的請求后,向客戶端發(fā)送響應信息盐茎。
主要特點
1庭呜、簡單快速:客戶向服務器請求服務時犀忱,只需傳送請求方法和路徑阴汇。請求方法常用的有GET、HEAD拐纱、POST哥倔。每種方法規(guī)定了客戶與服務器聯(lián)系的類型不同咆蒿。由于HTTP協(xié)議簡單蚂子,使得HTTP服務器的程序規(guī)模小食茎,因而通信速度很快馏谨。
2、靈活:HTTP允許傳輸任意類型的數(shù)據(jù)對象哎媚。正在傳輸?shù)念愋陀蒀ontent-Type加以標記抄伍。
3.無連接:無連接的含義是限制每次連接只處理一個請求管宵。服務器處理完客戶的請求,并收到客戶的應答后岗喉,即斷開連接钱床。采用這種方式可以節(jié)省傳輸時間埠居。
4.無狀態(tài):HTTP協(xié)議是無狀態(tài)協(xié)議滥壕。無狀態(tài)是指協(xié)議對于事務處理沒有記憶能力。缺少狀態(tài)意味著如果后續(xù)處理需要前面的信息胁孙,則它必須重傳称鳞,這樣可能導致每次連接傳送的數(shù)據(jù)量增大冈止。另一方面,在服務器不需要先前信息時它的應答就較快闺属。
5、支持B/S及C/S模式。
HTTP之URL
HTTP使用統(tǒng)一資源標識符(Uniform Resource Identifiers, URI)來傳輸數(shù)據(jù)和建立連接唉匾。URL是一種特殊類型的URI匠楚,包含了用于查找某個資源的足夠的信息
URL,全稱是UniformResourceLocator, 中文叫統(tǒng)一資源定位符,是互聯(lián)網(wǎng)上用來標識某一處資源的地址芋簿。以下面這個URL為例,介紹下普通URL的各部分組成:
http://www.aspxfans.com:8080/news/index.asp?boardID=5&ID=24618&page=1#name
從上面的URL可以看出肪康,一個完整的URL包括以下幾部分:
1.協(xié)議部分:該URL的協(xié)議部分為“http:”磷支,這代表網(wǎng)頁使用的是HTTP協(xié)議食寡。在Internet中可以使用多種協(xié)議,如HTTP善榛,F(xiàn)TP等等本例中使用的是HTTP協(xié)議移盆。在"HTTP"后面的“//”為分隔符
2.域名部分:該URL的域名部分為“www.aspxfans.com”伤为。一個URL中钮呀,也可以使用IP地址作為域名使用
3.端口部分:跟在域名后面的是端口,域名和端口之間使用“:”作為分隔符蚁署。端口不是一個URL必須的部分蚂四,如果省略端口部分,將采用默認端口
4.虛擬目錄部分:從域名后的第一個“/”開始到最后一個“/”為止晌杰,是虛擬目錄部分筷弦。虛擬目錄也不是一個URL必須的部分烂琴。本例中的虛擬目錄是“/news/”
5.文件名部分:從域名后的最后一個“/”開始到“?”為止梗夸,是文件名部分号醉,如果沒有“?”,則是從域名后的最后一個“/”開始到“#”為止畔派,是文件部分,如果沒有“该酗?”和“#”呜魄,那么從域名后的最后一個“/”開始到結束莱衩,都是文件名部分笨蚁。本例中的文件名是“index.asp”。文件名部分也不是一個URL必須的部分伪很,如果省略該部分锉试,則使用默認的文件名
6.錨部分:從“#”開始到最后览濒,都是錨部分。本例中的錨部分是“name”应又。錨部分也不是一個URL必須的部分
7.參數(shù)部分:從“株扛?”開始到“#”為止之間的部分為參數(shù)部分,又稱搜索部分、查詢部分奖磁。本例中的參數(shù)部分為“boardID=5&ID=24618&page=1”咖为。參數(shù)可以允許有多個參數(shù)稠腊,參數(shù)與參數(shù)之間用“&”作為分隔符架忌。
原文:http://blog.csdn.net/ergouge/article/details/8185219
URI和URL的區(qū)別
URI,是uniform resource identifier饰恕,統(tǒng)一資源標識符埋嵌,用來唯一的標識一個資源俱恶。
Web上可用的每種資源如HTML文檔合是、圖像、視頻片段捶惜、程序等都是一個來URI來定位的
URI一般由三部組成:
①訪問資源的命名機制
②存放資源的主機名
③資源自身的名稱吱七,由路徑表示,著重強調于資源景醇。
URL是uniform resource locator三痰,統(tǒng)一資源定位器窜管,它是一種具體的URI幕帆,即URL可以用來標識一個資源,而且還指明了如何locate這個資源常熙。
URL是Internet上用來描述信息資源的字符串裸卫,主要用在各種WWW客戶程序和服務器程序上墓贿,特別是著名的Mosaic蜓氨。
采用URL可以用一種統(tǒng)一的格式來描述各種信息資源语盈,包括文件、服務器的地址和目錄等代嗤。URL一般由三部組成:
①協(xié)議(或稱為服務方式)
②存有該資源的主機IP地址(有時也包括端口號)
③主機資源的具體地址干毅。如目錄和文件名等
URN硝逢,uniform resource name,統(tǒng)一資源命名叫乌,是通過名字來標識資源徽缚,比如mailto:java-net@java.sun.com凿试。
URI是以一種抽象的那婉,高層次概念定義統(tǒng)一資源標識,而URL和URN則是具體的資源標識的方式盐类。URL和URN都是一種URI傲醉∩肼剩籠統(tǒng)地說礼仗,每個 URL 都是 URI元践,但不一定每個 URI 都是 URL童谒。這是因為 URI 還包括一個子類饥伊,即統(tǒng)一資源名稱 (URN)琅豆,它命名資源但不指定如何定位資源。上面的 mailto蚪拦、news 和 isbn URI 都是 URN 的示例驰贷。
在Java的URI中饱苟,一個URI實例可以代表絕對的,也可以是相對的类垦,只要它符合URI的語法規(guī)則蚤认。而URL類則不僅符合語義糕伐,還包含了定位該資源的信息良瞧,因此它不能是相對的褥蚯。
在Java類庫中,URI類不包含任何訪問資源的方法训挡,它唯一的作用就是解析澜薄。
相反的是肤京,URL類可以打開一個到達資源的流茅特。
HTTP之請求消息Request
客戶端發(fā)送一個HTTP請求到服務器的請求消息包括以下格式:
請求行(request line)温治、請求頭部(header)熬荆、空行和請求數(shù)據(jù)四個部分組成。
請求行以一個方法符號開頭寒矿,以空格分開符相,后面跟著請求的URI和協(xié)議的版本啊终。
Http請求消息結構.png
請求行以一個方法符號開頭傲须,以空格分開泰讽,后面跟著請求的URI和協(xié)議的版本已卸。
Get請求例子,使用Charles抓取的request:
GET /562f25980001b1b106000338.jpg HTTP/1.1
Host img.mukewang.com
User-Agent Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
Accept image/webp,image/*,*/*;q=0.8
Referer http://www.imooc.com/
Accept-Encoding gzip, deflate, sdch
Accept-Language zh-CN,zh;q=0.8
第一部分:請求行,用來說明請求類型,要訪問的資源以及所使用的HTTP版本.
GET說明請求類型為GET,[/562f25980001b1b106000338.jpg]為要訪問的資源惑申,該行的最后一部分說明使用的是HTTP1.1版本。
第二部分:請求頭部人芽,緊接著請求行(即第一行)之后的部分萤厅,用來說明服務器要使用的附加信息
從第二行起為請求頭部惕味,HOST將指出請求的目的地.User-Agent,服務器端和客戶端腳本都能訪問它,它是瀏覽器類型檢測邏輯的重要基礎.該信息由你的瀏覽器來定義,并且在每個請求中自動發(fā)送等等
第三部分:空行名挥,請求頭部后面的空行是必須的
即使第四部分的請求數(shù)據(jù)為空,也必須有空行参淫。
第四部分:請求數(shù)據(jù)也叫主體愧杯,可以添加任意的其他數(shù)據(jù)力九。
這個例子的請求數(shù)據(jù)為空跌前。
POST請求例子,使用Charles抓取的request:
POST / HTTP1.1
Host:www.wrox.com
User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)
Content-Type:application/x-www-form-urlencoded
Content-Length:40
Connection: Keep-Alive
name=Professional%20Ajax&publisher=Wiley
第一部分:請求行程储,第一行明了是post請求章鲤,以及http1.1版本败徊。
第二部分:請求頭部皱蹦,第二行至第六行沪哺。
第三部分:空行辜妓,第七行的空行忌怎。
第四部分:請求數(shù)據(jù),第八行榴啸。
HTTP之響應消息Response
一般情況下孽惰,服務器接收并處理客戶端發(fā)過來的請求后會返回一個HTTP的響應消息。
HTTP響應也由四個部分組成鸥印,分別是:狀態(tài)行勋功、消息報頭腥例、空行和響應正文。
http響應消息格式.jpg
例子
HTTP/1.1 200 OK
Date: Fri, 22 May 2009 06:07:21 GMT
Content-Type: text/html; charset=UTF-8
<html>
<head></head>
<body>
<!--body goes here-->
</body>
</html>
第一部分:狀態(tài)行酝润,由HTTP協(xié)議版本號, 狀態(tài)碼要销, 狀態(tài)消息 三部分組成构回。
第一行為狀態(tài)行,(HTTP/1.1)表明HTTP版本為1.1版本疏咐,狀態(tài)碼為200纤掸,狀態(tài)消息為(ok)
第二部分:消息報頭,用來說明客戶端要使用的一些附加信息
第二行和第三行為消息報頭浑塞,
Date:生成響應的日期和時間借跪;Content-Type:指定了MIME類型的HTML(text/html),編碼類型是UTF-8
第三部分:空行,消息報頭后面的空行是必須的
第四部分:響應正文酌壕,服務器返回給客戶端的文本信息掏愁。
空行后面的html部分為響應正文。
HTTP之狀態(tài)碼
狀態(tài)代碼有三位數(shù)字組成卵牍,第一個數(shù)字定義了響應的類別果港,共分五種類別:
###### 1xx:指示信息--表示請求已接收,繼續(xù)處理
###### 2xx:成功--表示請求已被成功接收糊昙、理解辛掠、接受
###### 3xx:重定向--要完成請求必須進行更進一步的操作
###### 4xx:客戶端錯誤--請求有語法錯誤或請求無法實現(xiàn)
###### 5xx:服務器端錯誤--服務器未能實現(xiàn)合法的請求
常見狀態(tài)碼:
200 OK //客戶端請求成功
400 Bad Request //客戶端請求有語法錯誤,不能被服務器所理解
401 Unauthorized //請求未經(jīng)授權释牺,這個狀態(tài)代碼必須和WWW-Authenticate報頭域一起使用
403 Forbidden //服務器收到請求萝衩,但是拒絕提供服務
404 Not Found //請求資源不存在,eg:輸入了錯誤的URL
500 Internal Server Error //服務器發(fā)生不可預期的錯誤
503 Server Unavailable //服務器當前不能處理客戶端的請求没咙,一段時間后可能恢復正常`</pre>
更多狀態(tài)碼[http://www.runoob.com/http/http-status-codes.html](http://www.runoob.com/http/http-status-codes.html)
HTTP之請求方法
根據(jù)HTTP標準猩谊,HTTP請求可以使用多種請求方法。
HTTP1.0定義了三種請求方法: GET, POST 和 HEAD方法镜撩。
HTTP1.1新增了五種請求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法预柒。
GET 請求指定的頁面信息队塘,并返回實體主體袁梗。
HEAD 類似于get請求,只不過返回的響應中沒有具體的內(nèi)容憔古,用于獲取報頭
POST 向指定資源提交數(shù)據(jù)進行處理請求(例如提交表單或者上傳文件)遮怜。數(shù)據(jù)被包含在請求體中。POST請求可能會導致新的資源的建立和/或已有資源的修改鸿市。
PUT 從客戶端向服務器傳送的數(shù)據(jù)取代指定的文檔的內(nèi)容锯梁。
DELETE 請求服務器刪除指定的頁面即碗。
CONNECT HTTP/1.1協(xié)議中預留給能夠將連接改為管道方式的代理服務器。
OPTIONS 允許客戶端查看服務器的性能陌凳。
TRACE 回顯服務器收到的請求剥懒,主要用于測試或診斷。
HTTP之工作原理
HTTP協(xié)議定義Web客戶端如何從Web服務器請求Web頁面合敦,以及服務器如何把Web頁面?zhèn)魉徒o客戶端初橘。HTTP協(xié)議采用了請求/響應模型〕涞海客戶端向服務器發(fā)送一個請求報文保檐,請求報文包含請求的方法、URL崔梗、協(xié)議版本夜只、請求頭部和請求數(shù)據(jù)。服務器以一個狀態(tài)行作為響應蒜魄,響應的內(nèi)容包括協(xié)議的版本扔亥、成功或者錯誤代碼、服務器信息谈为、響應頭部和響應數(shù)據(jù)砸王。
以下是 HTTP 請求/響應的步驟:
1、客戶端連接到Web服務器
一個HTTP客戶端峦阁,通常是瀏覽器谦铃,與Web服務器的HTTP端口(默認為80)建立一個TCP套接字連接。例如榔昔,http://www.oakcms.cn驹闰。
2、發(fā)送HTTP請求
通過TCP套接字撒会,客戶端向Web服務器發(fā)送一個文本的請求報文嘹朗,一個請求報文由請求行、請求頭部诵肛、空行和請求數(shù)據(jù)4部分組成屹培。
3、服務器接受請求并返回HTTP響應
Web服務器解析請求怔檩,定位請求資源拿愧。服務器將資源復本寫到TCP套接字,由客戶端讀取筑舅。一個響應由狀態(tài)行辈毯、響應頭部、空行和響應數(shù)據(jù)4部分組成乙埃。
4闸英、釋放連接TCP連接
若connection 模式為close锯岖,則服務器主動關閉TCP連接,客戶端被動關閉連接甫何,釋放TCP連接;若connection 模式為keepalive出吹,則該連接會保持一段時間,在該時間內(nèi)可以繼續(xù)接收請求;
5辙喂、客戶端瀏覽器解析HTML內(nèi)容
客戶端瀏覽器首先解析狀態(tài)行趋箩,查看表明請求是否成功的狀態(tài)代碼。然后解析每一個響應頭加派,響應頭告知以下為若干字節(jié)的HTML文檔和文檔的字符集叫确。客戶端瀏覽器讀取響應數(shù)據(jù)HTML芍锦,根據(jù)HTML的語法對其進行格式化竹勉,并在瀏覽器窗口中顯示。
例如:在瀏覽器地址欄鍵入URL娄琉,按下回車之后會經(jīng)歷以下流程:
1次乓、瀏覽器向 DNS 服務器請求解析該 URL 中的域名所對應的 IP 地址;
2、解析出 IP 地址后孽水,根據(jù)該 IP 地址和默認端口 80票腰,和服務器建立TCP連接;
3、瀏覽器發(fā)出讀取文件(URL 中域名后面部分對應的文件)的HTTP 請求女气,該請求報文作為 TCP 三次握手的第三個報文的數(shù)據(jù)發(fā)送給服務器;
4杏慰、服務器對瀏覽器請求作出響應,并把對應的 html 文本發(fā)送給瀏覽器;
5炼鞠、釋放 TCP連接;
6缘滥、瀏覽器將該 html 文本并顯示內(nèi)容;
GET和POST請求的區(qū)別:
GET請求
GET /books/?sex=man&name=Professional HTTP/1.1
Host: www.wrox.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
Gecko/20050225 Firefox/1.0.1
Connection: Keep-Alive
注意最后一行是空行
POST請求
POST / HTTP/1.1
Host: www.wrox.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
Gecko/20050225 Firefox/1.0.1
Content-Type: application/x-www-form-urlencoded
Content-Length: 40
Connection: Keep-Alive
name=Professional%20Ajax&publisher=Wiley
1、GET提交谒主,請求的數(shù)據(jù)會附在URL之后(就是把數(shù)據(jù)放置在HTTP協(xié)議頭中)朝扼,以?分割URL和傳輸數(shù)據(jù),多個參數(shù)用&連接霎肯;例 如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD擎颖。如果數(shù)據(jù)是英文字母/數(shù)字,原樣發(fā)送观游,如果是空格搂捧,轉換為+,如果是中文/其他字符备典,則直接把字符串用BASE64加密异旧,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX為該符號以16進制表示的ASCII提佣。
POST提交:把提交的數(shù)據(jù)放置在是HTTP包的包體中吮蛹。上文示例中紅色字體標明的就是實際的傳輸數(shù)據(jù)
因此,GET提交的數(shù)據(jù)會在地址欄中顯示出來拌屏,而POST提交潮针,地址欄不會改變
2、傳輸數(shù)據(jù)的大幸形埂:首先聲明:HTTP協(xié)議沒有對傳輸?shù)臄?shù)據(jù)大小進行限制每篷,HTTP協(xié)議規(guī)范也沒有對URL長度進行限制。
而在實際開發(fā)中存在的限制主要有:
GET:特定瀏覽器和服務器對URL長度有限制端圈,例如 IE對URL長度的限制是2083字節(jié)(2K+35)焦读。對于其他瀏覽器,如Netscape舱权、FireFox等矗晃,理論上沒有長度限制,其限制取決于操作系 統(tǒng)的支持宴倍。
因此對于GET提交時张症,傳輸數(shù)據(jù)就會受到URL長度的 限制。
POST:由于不是通過URL傳值鸵贬,理論上數(shù)據(jù)不受 限俗他。但實際各個WEB服務器會規(guī)定對post提交數(shù)據(jù)大小進行限制,Apache阔逼、IIS6都有各自的配置兆衅。
3、安全性
POST的安全性要比GET的安全性高嗜浮。比如:通過GET提交數(shù)據(jù)涯保,用戶名和密碼將明文出現(xiàn)在URL上,因為(1)登錄頁面有可能被瀏覽器緩存周伦;(2)其他人查看瀏覽器的歷史紀錄夕春,那么別人就可以拿到你的賬號和密碼了,除此之外专挪,使用GET提交數(shù)據(jù)還可能會造成Cross-site request forgery攻擊
4及志、Http get,post,soap協(xié)議都是在http上運行的
(1)get:請求參數(shù)是作為一個key/value對的序列(查詢字符串)附加到URL上的
查詢字符串的長度受到web瀏覽器和web服務器的限制(如IE最多支持2048個字符),不適合傳輸大型數(shù)據(jù)集同時寨腔,它很不安全
(2)post:請求參數(shù)是在http標題的一個不同部分(名為entity body)傳輸?shù)乃俪蓿@一部分用來傳輸表單信息,因此必須將Content-type設置為:application/x-www-form- urlencoded迫卢。post設計用來支持web窗體上的用戶字段倚搬,其參數(shù)也是作為key/value對傳輸。
但是:它不支持復雜數(shù)據(jù)類型乾蛤,因為post沒有定義傳輸數(shù)據(jù)結構的語義和規(guī)則每界。
(3)soap:是http post的一個專用版本捅僵,遵循一種特殊的xml消息格式
Content-type設置為: text/xml 任何數(shù)據(jù)都可以xml化。
Http協(xié)議定義了很多與服務器交互的方法眨层,最基本的有4種庙楚,分別是:GET,POST,PUT,DELETE。 一個URL地址用于描述一個網(wǎng)絡上的資源趴樱,而HTTP中的GET, POST, PUT, DELETE就對應著對這個資源的查馒闷,改,增叁征,刪4個操作纳账。 我們最常見的就是GET和POST了。GET一般用于獲取/查詢資源信息捺疼,而POST一般用于更新資源信息疏虫。
我們看看GET和POST的區(qū)別:
1、GET提交的數(shù)據(jù)會放在URL之后帅涂,以?分割URL和傳輸數(shù)據(jù)议薪,參數(shù)之間以&相連,如EditPosts.aspx?name=test1&id=123456
POST方法是把提交的數(shù)據(jù)放在HTTP包的Body中媳友。
2斯议、GET提交的數(shù)據(jù)大小有限制(因為瀏覽器對URL的長度有限制),而POST方法提交的數(shù)據(jù)沒有限制醇锚。
3哼御、GET方式需要使用Request.QueryString來取得變量的值,而POST方式通過Request.Form來獲取變量的值焊唬。
4恋昼、GET方式提交數(shù)據(jù),會帶來安全問題赶促,比如一個登錄頁面液肌,通過GET方式提交數(shù)據(jù)時,用戶名和密碼將出現(xiàn)在URL上鸥滨,如果頁面可以被緩存或者其他人可以訪問這臺機器嗦哆,就可以從歷史記錄獲得該用戶的賬號和密碼。
鄙人最近在搞微信小程序開發(fā)婿滓,由于大部分專注于頁面的搭建老速,才發(fā)現(xiàn)自身的前端基礎知識真的菜得不行不行,然深知亡羊補牢為時不晚凸主,晚上抽時間來惡補橘券,在學習之余,看到一篇不錯的文章,介紹HTTP協(xié)議的旁舰,故轉摘過來锋华,以防日后有所需。如有侵權鬓梅,請聯(lián)系鄙人刪之供置。