HTTP簡介
HTTP協(xié)議是Hyper Text Transfer Protocol(超文本傳輸協(xié)議)的縮寫,是用于從萬維網(wǎng)(WWW:World Wide Web )服務(wù)器傳輸超文本到本地瀏覽器的傳送協(xié)議喇潘。
HTTP是一個基于TCP/IP通信協(xié)議來傳遞數(shù)據(jù)(HTML 文件, 圖片文件, 查詢結(jié)果等)。
HTTP是一個屬于應(yīng)用層的面向?qū)ο蟮膮f(xié)議譬猫,由于其簡捷拾弃、快速的方式值桩,適用于分布式超媒體信息系統(tǒng)。它于1990年提出豪椿,經(jīng)過幾年的使用與發(fā)展奔坟,得到不斷地完善和擴(kuò)展携栋。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的規(guī)范化工作正在進(jìn)行之中咳秉,而且HTTP-NG(Next Generation of HTTP)的建議已經(jīng)提出婉支。
HTTP協(xié)議工作于客戶端-服務(wù)端架構(gòu)為上。瀏覽器作為HTTP客戶端通過URL向HTTP服務(wù)端即WEB服務(wù)器發(fā)送所有請求滴某。Web服務(wù)器根據(jù)接收到的請求后磅摹,向客戶端發(fā)送響應(yīng)信息。
主要特點(diǎn)
1霎奢、簡單快速:客戶向服務(wù)器請求服務(wù)時,只需傳送請求方法和路徑饼灿。請求方法常用的有GET幕侠、HEAD、POST碍彭。每種方法規(guī)定了客戶與服務(wù)器聯(lián)系的類型不同晤硕。由于HTTP協(xié)議簡單,使得HTTP服務(wù)器的程序規(guī)模小庇忌,因而通信速度很快舞箍。
2、靈活:HTTP允許傳輸任意類型的數(shù)據(jù)對象皆疹。正在傳輸?shù)念愋陀蒀ontent-Type加以標(biāo)記疏橄。
3.無連接:無連接的含義是限制每次連接只處理一個請求。服務(wù)器處理完客戶的請求略就,并收到客戶的應(yīng)答后捎迫,即斷開連接。采用這種方式可以節(jié)省傳輸時間表牢。
4.無狀態(tài):HTTP協(xié)議是無狀態(tài)協(xié)議窄绒。無狀態(tài)是指協(xié)議對于事務(wù)處理沒有記憶能力。缺少狀態(tài)意味著如果后續(xù)處理需要前面的信息崔兴,則它必須重傳彰导,這樣可能導(dǎo)致每次連接傳送的數(shù)據(jù)量增大。另一方面敲茄,在服務(wù)器不需要先前信息時它的應(yīng)答就較快位谋。5、支持B/S及C/S模式折汞。
HTTP之URL
HTTP使用統(tǒng)一資源標(biāo)識符(Uniform Resource Identifiers, URI)來傳輸數(shù)據(jù)和建立連接倔幼。URL是一種特殊類型的URI,包含了用于查找某個資源的足夠的信息
URL,全稱是UniformResourceLocator, 中文叫統(tǒng)一資源定位符,是互聯(lián)網(wǎng)上用來標(biāo)識某一處資源的地址爽待。以下面這個URL為例损同,介紹下普通URL的各部分組成:
http://www.aspxfans.com:8080/news/index.asp?boardID=5&ID=24618&page=1#name
從上面的URL可以看出翩腐,一個完整的URL包括以下幾部分:
1.協(xié)議部分:該URL的協(xié)議部分為“http:”,這代表網(wǎng)頁使用的是HTTP協(xié)議膏燃。在Internet中可以使用多種協(xié)議茂卦,如HTTP,F(xiàn)TP等等本例中使用的是HTTP協(xié)議组哩。在"HTTP"后面的“//”為分隔符
2.域名部分:該URL的域名部分為“www.aspxfans.com”等龙。一個URL中,也可以使用IP地址作為域名使用
3.端口部分:跟在域名后面的是端口伶贰,域名和端口之間使用“:”作為分隔符蛛砰。端口不是一個URL必須的部分,如果省略端口部分黍衙,將采用默認(rèn)端口
4.虛擬目錄部分:從域名后的第一個“/”開始到最后一個“/”為止泥畅,是虛擬目錄部分。虛擬目錄也不是一個URL必須的部分琅翻。本例中的虛擬目錄是“/news/”
5.文件名部分:從域名后的最后一個“/”開始到“位仁?”為止,是文件名部分方椎,如果沒有“?”,則是從域名后的最后一個“/”開始到“#”為止聂抢,是文件部分,如果沒有“棠众?”和“#”琳疏,那么從域名后的最后一個“/”開始到結(jié)束,都是文件名部分摄欲。本例中的文件名是“index.asp”轿亮。文件名部分也不是一個URL必須的部分,如果省略該部分胸墙,則使用默認(rèn)的文件名
6.錨部分:從“#”開始到最后我注,都是錨部分。本例中的錨部分是“name”迟隅。錨部分也不是一個URL必須的部分
7.參數(shù)部分:從“但骨?”開始到“#”為止之間的部分為參數(shù)部分,又稱搜索部分智袭、查詢部分奔缠。本例中的參數(shù)部分為“boardID=5&ID=24618&page=1”。參數(shù)可以允許有多個參數(shù)吼野,參數(shù)與參數(shù)之間用“&”作為分隔符校哎。
URI和URL的區(qū)別
- URI,是uniform resource identifier,統(tǒng)一資源標(biāo)識符闷哆,用來唯一的標(biāo)識一個資源腰奋。
Web上可用的每種資源如HTML文檔、圖像抱怔、視頻片段劣坊、程序等都是一個來URI來定位的
URI一般由三部組成:
①訪問資源的命名機(jī)制
②存放資源的主機(jī)名
③資源自身的名稱,由路徑表示屈留,著重強(qiáng)調(diào)于資源局冰。
- URL是uniform resource locator,統(tǒng)一資源定位器灌危,它是一種具體的URI康二,即URL可以用來標(biāo)識一個資源,而且還指明了如何locate這個資源乍狐。
URL是Internet上用來描述信息資源的字符串赠摇,主要用在各種WWW客戶程序和服務(wù)器程序上,特別是著名的Mosaic浅蚪。
采用URL可以用一種統(tǒng)一的格式來描述各種信息資源,包括文件烫罩、服務(wù)器的地址和目錄等惜傲。URL一般由三部組成:
①協(xié)議(或稱為服務(wù)方式)
②存有該資源的主機(jī)IP地址(有時也包括端口號)
③主機(jī)資源的具體地址。如目錄和文件名等
- URN贝攒,uniform resource name盗誊,統(tǒng)一資源命名,是通過名字來標(biāo)識資源隘弊,比如mailto:java-net@java.sun.com哈踱。
URI是以一種抽象的,高層次概念定義統(tǒng)一資源標(biāo)識梨熙,而URL和URN則是具體的資源標(biāo)識的方式开镣。URL和URN都是一種URI⊙噬龋籠統(tǒng)地說邪财,每個 URL 都是 URI,但不一定每個 URI 都是 URL质欲。這是因?yàn)?URI 還包括一個子類树埠,即統(tǒng)一資源名稱 (URN),它命名資源但不指定如何定位資源嘶伟。上面的 mailto怎憋、news 和 isbn URI 都是 URN 的示例。
在Java的URI中,一個URI實(shí)例可以代表絕對的绊袋,也可以是相對的毕匀,只要它符合URI的語法規(guī)則。而URL類則不僅符合語義愤炸,還包含了定位該資源的信息期揪,因此它不能是相對的。
在Java類庫中规个,URI類不包含任何訪問資源的方法凤薛,它唯一的作用就是解析。
相反的是诞仓,URL類可以打開一個到達(dá)資源的流缤苫。
HTTP之請求消息Request
客戶端發(fā)送一個HTTP請求到服務(wù)器的請求消息包括以下格式:
請求行(request line)、請求頭部(header)墅拭、空行和請求數(shù)據(jù)四個部分組成活玲。
請求行以一個方法符號開頭,以空格分開谍婉,后面跟著請求的URI和協(xié)議的版本舒憾。
Get請求例子,使用Charles抓取的request:
GET /562f25980001b1b106000338.jpg HTTP/1.1
Host img.mukewang.com
User-Agent Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
Accept image/webp,image/*,*/*;q=0.8
Referer http://www.imooc.com/
Accept-Encoding gzip, deflate, sdch
Accept-Language zh-CN,zh;q=0.8
第一部分:請求行穗熬,用來說明請求類型,要訪問的資源以及所使用的HTTP版本.
GET說明請求類型為GET,[/562f25980001b1b106000338.jpg]為要訪問的資源镀迂,該行的最后一部分說明使用的是HTTP1.1版本。
第二部分:請求頭部唤蔗,緊接著請求行(即第一行)之后的部分探遵,用來說明服務(wù)器要使用的附加信息
從第二行起為請求頭部,HOST將指出請求的目的地.User-Agent,服務(wù)器端和客戶端腳本都能訪問它,它是瀏覽器類型檢測邏輯的重要基礎(chǔ).該信息由你的瀏覽器來定義,并且在每個請求中自動發(fā)送等等
第三部分:空行妓柜,請求頭部后面的空行是必須的
即使第四部分的請求數(shù)據(jù)為空箱季,也必須有空行。
第四部分:請求數(shù)據(jù)也叫主體棍掐,可以添加任意的其他數(shù)據(jù)藏雏。
這個例子的請求數(shù)據(jù)為空。
POST請求例子塌衰,使用Charles抓取的request:
POST / HTTP1.1Host:www.wrox.com
User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)
Content-Type:application/x-www-form-urlencoded
Content-Length:40
Connection: Keep-Alive
name=Professional%20Ajax&publisher=Wiley
第一部分:請求行诉稍,第一行明了是post請求,以及http1.1版本最疆。
第二部分:請求頭部杯巨,第二行至第六行。
第三部分:空行努酸,第七行的空行服爷。
第四部分:請求數(shù)據(jù),第八行。
HTTP之響應(yīng)消息Response
一般情況下仍源,服務(wù)器接收并處理客戶端發(fā)過來的請求后會返回一個HTTP的響應(yīng)消息心褐。
HTTP響應(yīng)也由四個部分組成,分別是:狀態(tài)行笼踩、消息報頭逗爹、空行和響應(yīng)正文。
例子
HTTP/1.1 200 OK
Date: Fri, 22 May 2009 06:07:21 GMT
Content-Type: text/html; charset=UTF-8
<html>
<head>
</head>
<body>
<!--body goes here-->
</body>
</html>
第一部分:狀態(tài)行嚎于,由HTTP協(xié)議版本號掘而, 狀態(tài)碼, 狀態(tài)消息 三部分組成于购。
第一行為狀態(tài)行袍睡,(HTTP/1.1)表明HTTP版本為1.1版本,狀態(tài)碼為200肋僧,狀態(tài)消息為(ok)
第二部分:消息報頭斑胜,用來說明客戶端要使用的一些附加信息
第二行和第三行為消息報頭,Date:生成響應(yīng)的日期和時間嫌吠;Content-Type:指定了MIME類型的HTML(text/html),編碼類型是UTF-8
第三部分:空行止潘,消息報頭后面的空行是必須的
第四部分:響應(yīng)正文,服務(wù)器返回給客戶端的文本信息辫诅。
空行后面的html部分為響應(yīng)正文覆山。
HTTP之狀態(tài)碼
狀態(tài)代碼有三位數(shù)字組成,第一個數(shù)字定義了響應(yīng)的類別泥栖,共分五種類別:
1xx:指示信息--表示請求已接收,繼續(xù)處理
2xx:成功--表示請求已被成功接收勋篓、理解吧享、接受
3xx:重定向--要完成請求必須進(jìn)行更進(jìn)一步的操作
4xx:客戶端錯誤--請求有語法錯誤或請求無法實(shí)現(xiàn)
5xx:服務(wù)器端錯誤--服務(wù)器未能實(shí)現(xiàn)合法的請求
常見狀態(tài)碼:
200 OK //客戶端請求成功
400 Bad Request //客戶端請求有語法錯誤,不能被服務(wù)器所理解
401 Unauthorized //請求未經(jīng)授權(quán)譬嚣,這個狀態(tài)代碼必須和WWW-Authenticate報頭域一起使用
403 Forbidden //服務(wù)器收到請求钢颂,但是拒絕提供服務(wù)
404 Not Found //請求資源不存在,eg:輸入了錯誤的URL
500 Internal Server Error //服務(wù)器發(fā)生不可預(yù)期的錯誤
503 Server Unavailable //服務(wù)器當(dāng)前不能處理客戶端的請求拜银,一段時間后可能恢復(fù)正常
HTTP請求方法
根據(jù)HTTP標(biāo)準(zhǔn)殊鞭,HTTP請求可以使用多種請求方法。
HTTP1.0定義了三種請求方法: GET, POST 和 HEAD方法尼桶。
HTTP1.1新增了五種請求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法操灿。
GET 請求指定的頁面信息,并返回實(shí)體主體泵督。
HEAD 類似于get請求趾盐,只不過返回的響應(yīng)中沒有具體的內(nèi)容,用于獲取報頭
POST 向指定資源提交數(shù)據(jù)進(jìn)行處理請求(例如提交表單或者上傳文件)。數(shù)據(jù)被包含在請求體中救鲤。POST請求可能會導(dǎo)致新的資源的建立和/或已有資源的修改久窟。
PUT 從客戶端向服務(wù)器傳送的數(shù)據(jù)取代指定的文檔的內(nèi)容。
DELETE 請求服務(wù)器刪除指定的頁面本缠。
CONNECT HTTP/1.1協(xié)議中預(yù)留給能夠?qū)⑦B接改為管道方式的代理服務(wù)器斥扛。
OPTIONS 允許客戶端查看服務(wù)器的性能。
TRACE 回顯服務(wù)器收到的請求丹锹,主要用于測試或診斷稀颁。
HTTP工作原理
HTTP協(xié)議定義Web客戶端如何從Web服務(wù)器請求Web頁面,以及服務(wù)器如何把Web頁面?zhèn)魉徒o客戶端卷仑。HTTP協(xié)議采用了請求/響應(yīng)模型峻村。客戶端向服務(wù)器發(fā)送一個請求報文锡凝,請求報文包含請求的方法粘昨、URL、協(xié)議版本窜锯、請求頭部和請求數(shù)據(jù)张肾。服務(wù)器以一個狀態(tài)行作為響應(yīng),響應(yīng)的內(nèi)容包括協(xié)議的版本锚扎、成功或者錯誤代碼吞瞪、服務(wù)器信息、響應(yīng)頭部和響應(yīng)數(shù)據(jù)驾孔。
以下是 HTTP 請求/響應(yīng)的步驟:
1芍秆、客戶端連接到Web服務(wù)器
一個HTTP客戶端,通常是瀏覽器翠勉,與Web服務(wù)器的HTTP端口(默認(rèn)為80)建立一個TCP套接字連接妖啥。例如,http://www.oakcms.cn对碌。
2荆虱、發(fā)送HTTP請求
通過TCP套接字,客戶端向Web服務(wù)器發(fā)送一個文本的請求報文朽们,一個請求報文由請求行怀读、請求頭部、空行和請求數(shù)據(jù)4部分組成骑脱。
3菜枷、服務(wù)器接受請求并返回HTTP響應(yīng)
Web服務(wù)器解析請求,定位請求資源惜姐。服務(wù)器將資源復(fù)本寫到TCP套接字犁跪,由客戶端讀取椿息。一個響應(yīng)由狀態(tài)行、響應(yīng)頭部坷衍、空行和響應(yīng)數(shù)據(jù)4部分組成寝优。
4、釋放連接TCP連接
若connection 模式為close枫耳,則服務(wù)器主動關(guān)閉TCP連接乏矾,客戶端被動關(guān)閉連接,釋放TCP連接;若connection 模式為keepalive迁杨,則該連接會保持一段時間钻心,在該時間內(nèi)可以繼續(xù)接收請求;
5、客戶端瀏覽器解析HTML內(nèi)容
客戶端瀏覽器首先解析狀態(tài)行铅协,查看表明請求是否成功的狀態(tài)代碼捷沸。然后解析每一個響應(yīng)頭,響應(yīng)頭告知以下為若干字節(jié)的HTML文檔和文檔的字符集狐史⊙鞲客戶端瀏覽器讀取響應(yīng)數(shù)據(jù)HTML,根據(jù)HTML的語法對其進(jìn)行格式化骏全,并在瀏覽器窗口中顯示苍柏。
例如:在瀏覽器地址欄鍵入URL,按下回車之后會經(jīng)歷以下流程:
1、瀏覽器向 DNS 服務(wù)器請求解析該 URL 中的域名所對應(yīng)的 IP 地址;
2、解析出 IP 地址后邦鲫,根據(jù)該 IP 地址和默認(rèn)端口 80,和服務(wù)器建立TCP連接;
3硫朦、瀏覽器發(fā)出讀取文件(URL 中域名后面部分對應(yīng)的文件)的HTTP 請求,該請求報文作為 TCP 三次握手的第三個報文的數(shù)據(jù)發(fā)送給服務(wù)器;
4、服務(wù)器對瀏覽器請求作出響應(yīng),并把對應(yīng)的 html 文本發(fā)送給瀏覽器;
5治唤、釋放 TCP連接;
6、瀏覽器將該 html 文本并顯示內(nèi)容;
GET和POST請求的區(qū)別
- GET請求
GET /books/?sex=man&name=Professional HTTP/1.1
Host: www.wrox.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
Gecko/20050225 Firefox/1.0.1
Connection: Keep-Alive
注意最后一行是空行
- POST請求
POST / HTTP/1.1
Host: www.wrox.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
Gecko/20050225 Firefox/1.0.1
Content-Type: application/x-www-form-urlencoded
Content-Length: 40
Connection: Keep-Alive
name=Professional%20Ajax&publisher=Wiley
1糙申、GET提交,請求的數(shù)據(jù)會附在URL之后(就是把數(shù)據(jù)放置在HTTP協(xié)議頭中)船惨,以?分割URL和傳輸數(shù)據(jù)柜裸,多個參數(shù)用&連接;例 如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD粱锐。如果數(shù)據(jù)是英文字母/數(shù)字疙挺,原樣發(fā)送,如果是空格怜浅,轉(zhuǎn)換為+铐然,如果是中文/其他字符蔬崩,則直接把字符串用BASE64加密,得出如: %E4%BD%A0%E5%A5%BD搀暑,其中%XX中的XX為該符號以16進(jìn)制表示的ASCII沥阳。
POST提交:把提交的數(shù)據(jù)放置在是HTTP包的包體中。上文示例中紅色字體標(biāo)明的就是實(shí)際的傳輸數(shù)據(jù)
因此自点,GET提交的數(shù)據(jù)會在地址欄中顯示出來桐罕,而POST提交,地址欄不會改變
2桂敛、傳輸數(shù)據(jù)的大泄ε凇:首先聲明:HTTP協(xié)議沒有對傳輸?shù)臄?shù)據(jù)大小進(jìn)行限制,HTTP協(xié)議規(guī)范也沒有對URL長度進(jìn)行限制术唬。
而在實(shí)際開發(fā)中存在的限制主要有:
GET:特定瀏覽器和服務(wù)器對URL長度有限制薪伏,例如 IE對URL長度的限制是2083字節(jié)(2K+35)。對于其他瀏覽器粗仓,如Netscape嫁怀、FireFox等,理論上沒有長度限制潦牛,其限制取決于操作系 統(tǒng)的支持眶掌。
因此對于GET提交時,傳輸數(shù)據(jù)就會受到URL長度的 限制巴碗。
POST:由于不是通過URL傳值朴爬,理論上數(shù)據(jù)不受 限。但實(shí)際各個WEB服務(wù)器會規(guī)定對post提交數(shù)據(jù)大小進(jìn)行限制橡淆,Apache召噩、IIS6都有各自的配置。
3逸爵、安全性
POST的安全性要比GET的安全性高具滴。比如:通過GET提交數(shù)據(jù),用戶名和密碼將明文出現(xiàn)在URL上师倔,因?yàn)?1)登錄頁面有可能被瀏覽器緩存构韵;(2)其他人查看瀏覽器的歷史紀(jì)錄,那么別人就可以拿到你的賬號和密碼了趋艘,除此之外疲恢,使用GET提交數(shù)據(jù)還可能會造成Cross-site request forgery攻擊
4、Http get,post,soap協(xié)議都是在http上運(yùn)行的
(1)get:請求參數(shù)是作為一個key/value對的序列(查詢字符串)附加到URL上的
查詢字符串的長度受到web瀏覽器和web服務(wù)器的限制(如IE最多支持2048個字符)瓷胧,不適合傳輸大型數(shù)據(jù)集同時显拳,它很不安全
(2)post:請求參數(shù)是在http標(biāo)題的一個不同部分(名為entity body)傳輸?shù)模@一部分用來傳輸表單信息搓萧,因此必須將Content-type設(shè)置為:application/x-www-form- urlencoded杂数。post設(shè)計用來支持web窗體上的用戶字段宛畦,其參數(shù)也是作為key/value對傳輸。
但是:它不支持復(fù)雜數(shù)據(jù)類型揍移,因?yàn)閜ost沒有定義傳輸數(shù)據(jù)結(jié)構(gòu)的語義和規(guī)則次和。
(3)soap:是http post的一個專用版本,遵循一種特殊的xml消息格式
Content-type設(shè)置為: text/xml 任何數(shù)據(jù)都可以xml化羊精。
Http協(xié)議定義了很多與服務(wù)器交互的方法斯够,最基本的有4種,分別是GET,POST,PUT,DELETE. 一個URL地址用于描述一個網(wǎng)絡(luò)上的資源喧锦,而HTTP中的GET, POST, PUT, DELETE就對應(yīng)著對這個資源的查读规,改,增燃少,刪4個操作束亏。 我們最常見的就是GET和POST了。GET一般用于獲取/查詢資源信息碍遍,而POST一般用于更新資源信息.
我們看看GET和POST的區(qū)別
GET提交的數(shù)據(jù)會放在URL之后,以?分割URL和傳輸數(shù)據(jù)阳液,參數(shù)之間以&相連,如EditPosts.aspx?name=test1&id=123456. POST方法是把提交的數(shù)據(jù)放在HTTP包的Body中.
GET提交的數(shù)據(jù)大小有限制(因?yàn)闉g覽器對URL的長度有限制)鹰溜,而POST方法提交的數(shù)據(jù)沒有限制.
GET方式需要使用Request.QueryString來取得變量的值虽填,而POST方式通過Request.Form來獲取變量的值。
GET方式提交數(shù)據(jù)曹动,會帶來安全問題斋日,比如一個登錄頁面,通過GET方式提交數(shù)據(jù)時墓陈,用戶名和密碼將出現(xiàn)在URL上恶守,如果頁面可以被緩存或者其他人可以訪問這臺機(jī)器,就可以從歷史記錄獲得該用戶的賬號和密碼.