本文主要探究
tcp
連接建立和釋放過程中的狀態(tài)演變
TCP連接的建立
其實這張圖已經(jīng)說得很清楚了,客戶端應(yīng)用程序調(diào)用connect導(dǎo)致TCP
發(fā)送一個SYN
報文段肩刃,服務(wù)器端有一個監(jiān)聽套接字祟霍,該監(jiān)聽套接字收到SYN
后,在待連接套接字隊列中插入一項盈包,然后發(fā)送SYN
和對客戶端確認(rèn)的ACK
(注意到ACK
序列號總是和目前等待接收的序列號相同沸呐,此圖中客戶端發(fā)送的數(shù)據(jù)僅僅只有SYN
1個字節(jié),所以在SYN
的序列號J的基礎(chǔ)上加1得到ACK
的序列號呢燥,如果是其他數(shù)據(jù)報文段崭添,那么報文段實際長度為多少,確認(rèn)序列號就在該報文段的序列號基礎(chǔ)上加多少)叛氨『粼客戶端接收到該SYN
和ACK
以后,connect調(diào)用就成功返回,同時向服務(wù)端發(fā)送ACK
寞埠。服務(wù)端接收到客戶端發(fā)送的ACK
之后屁置,就將該連接從待連接套接字隊列移到已連接套接字隊列,等待accept調(diào)用從已連接套接字隊列中取出仁连。注意到accept總是對已連接套接字隊列執(zhí)行pop操作蓝角,因此accept得到的總是三路握手已完成,連接已建立的套接字饭冬,可以說即使不調(diào)用accept使鹅,這個已連接的套接字也已經(jīng)存在于系統(tǒng)中。那么如果客戶端在三路握手完成之后昌抠,accept調(diào)用之前crash掉怎么辦患朱,有些系統(tǒng)對accept之前crash掉的連接在內(nèi)核層面已經(jīng)解決,所以accept不會看到這種狀態(tài)的出現(xiàn)扰魂,另一些對已經(jīng)crash掉的連接調(diào)用accept則返回ECONNABORT
錯誤麦乞,因此蕴茴,最保險的做法是檢查ECONNABORT
錯誤,如果檢查到該錯誤姐直,直接進(jìn)行下一次accept就行倦淀。
TCP連接的釋放
從這個圖可以看到客戶端調(diào)用close,導(dǎo)致內(nèi)核發(fā)送FIN
主動發(fā)起結(jié)束連接的第一次揮手声畏,同時進(jìn)入FIN_WAIT1
狀態(tài)撞叽,服務(wù)器端接收到這個FIN
之后發(fā)送ACK
同時進(jìn)入到CLOSE_WAIT
狀態(tài),客戶端接收到服務(wù)器對自己發(fā)送的FIN
確認(rèn)之后進(jìn)入FIN_WAIT2
狀態(tài)插龄,直到服務(wù)器程序也調(diào)用close導(dǎo)致TCP
發(fā)送FIN
愿棋,服務(wù)器進(jìn)入LAST_ACK
狀態(tài),客戶端接收到這個FIN
之后均牢,發(fā)送對服務(wù)器端ACK
的確認(rèn)糠雨,同時進(jìn)入TIME_WAIT
狀態(tài)。注意到由于TCP
的延遲確認(rèn)機(jī)制徘跪,如果服務(wù)器接收到客戶端的FIN
后甘邀,及時調(diào)用close,會使得對客戶端的確認(rèn)ACK
和服務(wù)器自己的FIN
同時發(fā)送垮庐,四次揮手變?yōu)槿巍?/p>
首先看這個TIME_WAIT
狀態(tài)的必要性松邪,第一,假定客戶端發(fā)送給服務(wù)器的最后一個ACK
丟包(這是完全有可能的)哨查,此時服務(wù)器會不斷重傳最后一個FIN
逗抑,而客戶端已經(jīng)沒有關(guān)于這個連接的任何信息,因此
會導(dǎo)致服務(wù)器處于錯誤狀態(tài)寒亥。第二邮府,如果客戶端另一個進(jìn)程馬上占用掉剛剛關(guān)閉的套接字端口號,此時服務(wù)器在上一個連接中發(fā)送的數(shù)據(jù)由于網(wǎng)絡(luò)擁塞發(fā)生延時溉奕,剛好到達(dá)該端口挟纱,被新的連接讀取,就會出現(xiàn)串話現(xiàn)象腐宋。因此紊服,這個TIME_WAIT
狀態(tài)一般持續(xù)2MSL
時長,以保證上一個連接的所有報文都已發(fā)送完畢胸竞。和連接
操作永遠(yuǎn)是由客戶端來主動發(fā)起的不同欺嗤,主動關(guān)閉操作也可以由服務(wù)器來進(jìn)行(例如WEB服務(wù)器),因此當(dāng)服務(wù)器應(yīng)當(dāng)避免TIME_WAIT
的出現(xiàn)卫枝,或者縮短TIME_WAIT
的時延煎饼,因為每一個TIME_WAIT
都是沒有釋放資源的連接,此狀態(tài)過多會導(dǎo)致服務(wù)器資源消耗嚴(yán)重校赤,而且由于服務(wù)器必要時需要極短時間內(nèi)重啟吆玖,TIME_WAIT
也會使得服務(wù)器由于端口仍被占用導(dǎo)致短時間內(nèi)重啟失敗筒溃。
TCP連接中的一些臨界情況
(1) A,B兩個主機(jī)上的進(jìn)程a,b已經(jīng)通過TCP
建立連接c,然后主機(jī)A,B之間的網(wǎng)絡(luò)硬件連接出現(xiàn)故障沾乘,此時a進(jìn)程會處于何種狀態(tài)怜奖?
如果網(wǎng)絡(luò)發(fā)生故障期間a進(jìn)程永遠(yuǎn)不通過c連接對b進(jìn)程發(fā)送數(shù)據(jù),那么a進(jìn)程就永遠(yuǎn)不會知道這件事的發(fā)生翅阵,A主機(jī)上為a,b兩個進(jìn)程建立的連接將會永遠(yuǎn)存在歪玲,這就好像a,b兩個人只能通過有線電話聯(lián)系,突然有一天連接到b的電話線斷了掷匠,那么只要a不給b打電話滥崩,他就永遠(yuǎn)不知道b的電話線斷了。這里有一個服務(wù)器編程中需要注意的問題是讹语,如果服務(wù)器程序一直只是監(jiān)聽客戶端的請求并作出回復(fù)钙皮,那么如果客戶端在連接建立之后出現(xiàn)這種網(wǎng)絡(luò)硬件故障導(dǎo)致連接實際不可用的情況,服務(wù)器將永遠(yuǎn)不會覺察到這種狀態(tài)顽决,實際不可用的連接c將會永遠(yuǎn)存在株灸,其所占有的資源也就永遠(yuǎn)不會釋放。那么如果故障期間a進(jìn)程通過c給b進(jìn)程發(fā)送數(shù)據(jù)呢擎值?這時候TCP發(fā)送該數(shù)據(jù),由于收不到b的確認(rèn)逐抑,因此不斷重傳直到超時鸠儿,(或者收到某個中間路由器回復(fù)的目的不可達(dá)),此時TCP就知道b已經(jīng)掛了或者到b之間的網(wǎng)絡(luò)硬件出現(xiàn)故障了厕氨,就可以通知應(yīng)用程序處理這個事件进每。這也是TCP
中KEEPALIVE
存在的意義(如果一個連接上較長時間沒有接受和發(fā)送數(shù)據(jù),設(shè)置了KEEPALIVE
選項的TCP
會發(fā)送泵活報文段田晚,收到確認(rèn)就當(dāng)什么事兒也沒有,如果超時或者收到destination unreachable国葬,就通知應(yīng)用程序處理該事件贤徒。那么如果拔掉網(wǎng)線后馬上連接,而且保證此時a汇四,b兩個進(jìn)程沒有互相發(fā)送數(shù)據(jù)接奈,會發(fā)生什么?答案是一切正常通孽,就好像a,b兩個人在電話線路斷掉的時候互相之間沒有打過電話序宦,等到他們打電話時,電話線路已經(jīng)被電信部門修好了背苦,那么a互捌,b就永遠(yuǎn)不知道電話線斷掉的這個事情潘明。
(2) A,B兩個主機(jī)上的進(jìn)程a,b已經(jīng)通過TCP建立連接c,b進(jìn)程一直在忙別的事情(比如阻塞在別的IO上面)秕噪,在此期間a進(jìn)程調(diào)用了close钳降,會發(fā)生什么?
如果b進(jìn)程在忙完別的事情后馬上讀取c連接上的數(shù)據(jù)巢价,那么讀到FIN并調(diào)用close正常關(guān)閉連接牲阁。如果b進(jìn)程還要往c連接上寫數(shù)據(jù)會發(fā)送什么?第一次寫數(shù)據(jù)是可以正常進(jìn)行的壤躲,因為TCP
是雙向連接城菊,因此b接收到a的FIN
會認(rèn)為a不會再發(fā)送數(shù)據(jù),但并不以為著不能向a寫數(shù)據(jù)碉克,a進(jìn)程接收到b發(fā)送來的(非期望的)數(shù)據(jù)后凌唬,會給b進(jìn)程發(fā)送一個RST
,只要b進(jìn)程的下一次寫操作發(fā)生在接收到a的RST之前漏麦,寫操作一直會正常進(jìn)行客税。直到接收到a的RST
之后,在對a進(jìn)行寫操作撕贞,會返回返回EPIPE
錯誤更耻,同時出發(fā)SIG_PIPE
信號(默認(rèn)終止進(jìn)程),因此服務(wù)器程序一般要忽略SIG_PIPE
信號捏膨,并對EPIPE
錯誤進(jìn)行處理秧均。
(3) A,B兩個主機(jī)上的進(jìn)程a,b已經(jīng)通過TCP建立連接c,此時B主機(jī)突然斷電宕機(jī),然后馬上重啟(假定b程序是開機(jī)自動啟動的服務(wù)器程序)号涯,此時a進(jìn)程往b進(jìn)程寫數(shù)據(jù)會發(fā)生什么目胡?
由于B的宕機(jī),b進(jìn)程不會再crash時給a發(fā)送FIN
链快,所以a進(jìn)程在給b進(jìn)程寫數(shù)據(jù)之前是不會感知到這一現(xiàn)象誉己,等到B主機(jī)接收到a進(jìn)程發(fā)來的數(shù)據(jù)時(這是可以的,因為B主機(jī)已經(jīng)重啟)域蜗,b進(jìn)程由于crash導(dǎo)致關(guān)于a巨双,b之間的連接c的任何信息都已不存在,所以B主機(jī)找不到這樣一個連接霉祸,因此會讓a進(jìn)程重新連接炉峰,a進(jìn)程返回ECONNREST
錯誤。