原文鏈接:http://www.codeceo.com/article/http-long-connect.html
1. HTTP協(xié)議與TCP/IP協(xié)議的關系
HTTP的長連接和短連接本質上是TCP長連接和短連接。HTTP屬于應用層協(xié)議拷淘,在傳輸層使用TCP協(xié)議鲸鹦,在網絡層使用IP協(xié)議。IP協(xié)議主要解決網絡路由和尋址問題漱病,TCP協(xié)議主要解決如何在IP層之上可靠的傳遞數(shù)據(jù)包,使在網絡上的另一端收到發(fā)端發(fā)出的所有包,并且順序與發(fā)出順序一致扁远。TCP有可靠扔枫,面向連接的特點汛聚。
2. 如何理解HTTP協(xié)議是無狀態(tài)的
HTTP協(xié)議是無狀態(tài)的,指的是協(xié)議對于事務處理沒有記憶能力短荐,服務器不知道客戶端是什么狀態(tài)倚舀。也就是說,打開一個服務器上的網頁和你之前打開這個服務器上的網頁之間沒有任何聯(lián)系忍宋。HTTP是一個無狀態(tài)的面向連接的協(xié)議痕貌,無狀態(tài)不代表HTTP不能保持TCP連接,更不能代表HTTP使用的是UDP協(xié)議(無連接)糠排。
3. 什么是長連接舵稠、短連接?
在HTTP/1.0中,默認使用的是短連接哺徊。也就是說室琢,瀏覽器和服務器每進行一次HTTP操作,就建立一次連接落追,但任務結束就中斷連接盈滴。如果客戶端瀏覽器訪問的某個HTML或其他類型的 Web頁中包含有其他的Web資源,如JavaScript文件轿钠、圖像文件巢钓、CSS文件等;當瀏覽器每遇到這樣一個Web資源谣膳,就會建立一個HTTP會話竿报。
但從 HTTP/1.1起,默認使用長連接继谚,用以保持連接特性烈菌。使用長連接的HTTP協(xié)議,會在響應頭有加入這行代碼:
Connection:keep-alive
在使用長連接的情況下花履,當一個網頁打開完成后芽世,客戶端和服務器之間用于傳輸HTTP數(shù)據(jù)的 TCP連接不會關閉,如果客戶端再次訪問這個服務器上的網頁诡壁,會繼續(xù)使用這一條已經建立的連接济瓢。Keep-Alive不會永久保持連接,它有一個保持時間妹卿,可以在不同的服務器軟件(如Apache)中設定這個時間旺矾。實現(xiàn)長連接要客戶端和服務端都支持長連接。
HTTP協(xié)議的長連接和短連接夺克,實質上是TCP協(xié)議的長連接和短連接箕宙。
3.1 TCP連接
當網絡通信時采用TCP協(xié)議時,在真正的讀寫操作之前铺纽,server與client之間必須建立一個連接柬帕,當讀寫操作完成后,雙方不再需要這個連接 時它們可以釋放這個連接狡门,連接的建立是需要三次握手的陷寝,而釋放則需要4次握手,所以說每個連接的建立都是需要資源消耗和時間消耗的其馏。
經典的三次握手示意圖:
經典的四次握手關閉圖:
3.2 TCP短連接
我們模擬一下TCP短連接的情況凤跑,client向server發(fā)起連接請求,server接到請求叛复,然后雙方建立連接饶火。client向server 發(fā)送消息鹏控,server回應client,然后一次讀寫就完成了肤寝,這時候雙方任何一個都可以發(fā)起close操作,不過一般都是client先發(fā)起 close操作抖僵。為什么呢鲤看,一般的server不會回復完client后立即關閉連接的,當然不排除有特殊的情況耍群。從上面的描述看义桂,短連接一般只會在 client/server間傳遞一次讀寫操作。
短連接的優(yōu)點是:管理起來比較簡單蹈垢,存在的連接都是有用的連接慷吊,不需要額外的控制手段。
3.3 TCP長連接
接下來我們再模擬一下長連接的情況曹抬,client向server發(fā)起連接溉瓶,server接受client連接,雙方建立連接谤民。Client與server完成一次讀寫之后堰酿,它們之間的連接并不會主動關閉,后續(xù)的讀寫操作會繼續(xù)使用這個連接张足。
首先說一下TCP/IP詳解上講到的TCP贝ゴ矗活功能,蔽梗活功能主要為服務器應用提供哼绑,服務器應用希望知道客戶主機是否崩潰,從而可以代表客戶使用資源碉咆。如果客戶已經消失抖韩,使得服務器上保留一個半開放的連接,而服務器又在等待來自客戶端的數(shù)據(jù)吟逝,則服務器將應遠等待客戶端的數(shù)據(jù)帽蝶,保活功能就是試圖在服務 器端檢測到這種半開放的連接块攒。
如果一個給定的連接在兩小時內沒有任何的動作励稳,則服務器就向客戶發(fā)一個探測報文段,客戶主機必須處于以下4個狀態(tài)之一:
1.客戶主機依然正常運行囱井,并從服務器可達驹尼。客戶的TCP響應正常庞呕,而服務器也知道對方是正常的新翎,服務器在兩小時后將背膛粒活定時器復位。
2.客戶主機已經崩潰地啰,并且關閉或者正在重新啟動愁拭。在任何一種情況下,客戶的TCP都沒有響應亏吝。服務端將不能收到對探測的響應岭埠,并在75秒后超時。服務器總共發(fā)送10個這樣的探測 蔚鸥,每個間隔75秒惜论。如果服務器沒有收到一個響應,它就認為客戶主機已經關閉并終止連接止喷。
3.客戶主機崩潰并已經重新啟動馆类。服務器將收到一個對其保活探測的響應弹谁,這個響應是一個復位乾巧,使得服務器終止這個連接。
4.客戶機正常運行僵闯,但是服務器不可達卧抗,這種情況與2類似,TCP能發(fā)現(xiàn)的就是沒有收到探查的響應鳖粟。
3.4 長連接短連接操作過程
短連接的操作步驟是:
建立連接——數(shù)據(jù)傳輸——關閉連接...建立連接——數(shù)據(jù)傳輸——關閉連接
長連接的操作步驟是:
建立連接——數(shù)據(jù)傳輸...(保持連接)...數(shù)據(jù)傳輸——關閉連接
4. 長連接和短連接的優(yōu)點和缺點
由上可以看出社裆,長連接可以省去較多的TCP建立和關閉的操作,減少浪費向图,節(jié)約時間泳秀。對于頻繁請求資源的客戶來說,較適用長連接榄攀。不過這里存在一個問題嗜傅,存活功能的探測周期太長,還有就是它只是探測TCP連接的存活檩赢,屬于比較斯文的做法吕嘀,遇到惡意的連接時,闭曷鳎活功能就不夠使了偶房。在長連接的應用場景下,client端一般不會主動關閉它們之間的連接军浆,Client與server之間的連接如果一直不關閉的話棕洋,會存在一個問題,隨著客戶端連接越來越多乒融,server早晚有扛不住的時候掰盘,這時候server端需要采取一些策略摄悯,如關閉一些長時間沒有讀寫事件發(fā)生的連接,這樣可 以避免一些惡意連接導致server端服務受損愧捕;如果條件再允許就可以以客戶端機器為顆粒度奢驯,限制每個客戶端的最大長連接數(shù),這樣可以完全避免某個蛋疼的客戶端連累后端服務晃财。
短連接對于服務器來說管理較為簡單叨橱,存在的連接都是有用的連接,不需要額外的控制手段断盛。但如果客戶請求頻繁,將在TCP的建立和關閉操作上浪費時間和帶寬愉舔。
長連接和短連接的產生在于client和server采取的關閉策略钢猛,具體的應用場景采用具體的策略,沒有十全十美的選擇轩缤,只有合適的選擇命迈。
5. 什么時候用長連接,短連接火的?
長連接多用于操作頻繁壶愤,點對點的通訊,而且連接數(shù)不能太多情況馏鹤,征椒。每個TCP連接都需要三步握手,這需要時間湃累,如果每個操作都是先連接勃救,再操作的話那么處理速度會降低很多,所以每個操作完后都不斷開治力,次處理時直接發(fā)送數(shù)據(jù)包就OK了蒙秒,不用建立TCP連接。例如:數(shù)據(jù)庫的連接用長連接宵统, 如果用短連接頻繁的通信會造成socket錯誤晕讲,而且頻繁的socket 創(chuàng)建也是對資源的浪費。
而像WEB網站的http服務一般都用短鏈接马澈,因為長連接對于服務端來說會耗費一定的資源瓢省,而像WEB網站這么頻繁的成千上萬甚至上億客戶端的連接用短連接會更省一些資源,如果用長連接箭券,而且同時有成千上萬的用戶净捅,如果每個用戶都占用一個連接的話,那可想而知吧辩块。所以并發(fā)量大蛔六,但每個用戶無需頻繁操作情況下需用短連好荆永。