TCP 報文段結(jié)構(gòu)
一談到 TCP 協(xié)議结闸,大家最先想到的詞就是「面向連接」和「可靠」。沒錯酒朵,TCP 協(xié)議的設(shè)計就是為了能夠在客戶端和服務(wù)器之間建立起一個可靠連接膀估。
在講連接過程之前,我們先來看看 TCP 的報文段結(jié)構(gòu)耻讽,通過這個結(jié)構(gòu),我們可以知道 TCP 能夠提供什么信息:
這里有幾點是需要注意的:
TCP 協(xié)議需要一個四元組(源IP帕棉,源端口针肥,目的IP,目的端口)來確定連接香伴,這要和 UDP 協(xié)議區(qū)分開慰枕。多說一句,IP 地址位于 IP 報文段即纲,TCP 報文段是不含 IP 地址信息的具帮。
基本 TCP 頭部的長度是 20 字節(jié),但是由于「選項」的長度是不確定的,所以需要「首部長度」字段明確給出頭部長度蜂厅。這里要注意的是匪凡,首部長度字段的單位是 32bit,也就是 4 字節(jié)掘猿,所以該字段的最小值是 5病游。
標(biāo)橙色的字段(確認(rèn)序號,接收窗口大小稠通,ECE衬衬,ACK)用于「回復(fù)」對方,舉個例子改橘,服務(wù)器收到對方的數(shù)據(jù)包后滋尉,不單獨發(fā)一個數(shù)據(jù)包來回應(yīng),而是稍微等一下飞主,把確認(rèn)信息附在下一個發(fā)往客戶端的數(shù)據(jù)幀上狮惜,也就是捎帶技術(shù)。
窗口大小是一個 16 位無符號數(shù)既棺,也就是說窗口被限制在了 65535 字節(jié)讽挟,也就限制了 TCP 的吞吐量性能,這對一些高速以及高延遲的網(wǎng)絡(luò)不太友好(可以想想為什么)丸冕。所幸 TCP 額外提供了窗口縮放(Window Scale)選項耽梅,允許對這個值進(jìn)行縮放。
下面是 8 個標(biāo)志位的含義胖烛,有的協(xié)議比較舊眼姐,可能沒有前兩個標(biāo)志位:
標(biāo)志位雖然很多,但是如果放到具體場景里來看的話佩番,就很容易理解他們的作用了众旗。
TCP 三次握手
三次握手就是為了在客戶端和服務(wù)器間建立連接,這個過程并不復(fù)雜贡歧,但里面有很多細(xì)節(jié)需要注意。
這張圖就是握手的過程利朵,可以看到客戶端與服務(wù)器之間一共傳遞了三次消息,這三次握手其實就是兩臺機器之間互相確認(rèn)狀態(tài)绍弟,我們來一點一點看。
第一次握手
首先是客戶端發(fā)起連接樟遣,第一個數(shù)據(jù)包將 SYN 置位(也就是 SYN = 1)而叼,表明這個數(shù)據(jù)包是 SYN 報文段(也被稱為段 1)豹悬。這一次發(fā)送的目的是告訴服務(wù)器,自己的初始序列號是 client_isn
屿衅,還有一個隱含的信息在圖里沒有表現(xiàn)出來,那就是告知服務(wù)端自己想連接的端口號涤久。除了這些涡尘,客戶端還會發(fā)送一些選項,不過這跟三次握手沒多大關(guān)系响迂,暫且按下不表考抄。
段 1 里最需要注意的就是這個client_isn
,也就是初始序列號蔗彤〈罚「RFC0793^1」指出:
When new connections are created, an initial sequence number (ISN) generator is employed which selects a new 32 bit ISN. The generator is bound to a (possibly fictitious) 32 bit clock whose low order bit is incremented roughly every 4 microseconds. Thus, the ISN cycles approximately every 4.55 hours.
翻譯過來就是,初始序列號是一個 32 位的(虛擬)計數(shù)器然遏,而且這個計數(shù)器每 4 微秒加 1贫途,也就是說,ISN 的值每 4.55 小時循環(huán)一次待侵。這個舉措是為了防止序列號重疊丢早。
但即使這樣還是會有安全隱患——因為初始 ISN 仍然是可預(yù)測的,惡意程序可能會分析 ISN 秧倾,然后根據(jù)先前使用的 ISN 預(yù)測后續(xù) TCP 連接的 ISN怨酝,然后進(jìn)行攻擊,一個著名的例子就是「The Mitnick attack^2」 那先。這里摘一段原文:
Mitnick sent SYN request to X-Terminal and received SYN/ACK response. Then he sent RESET response to keep the X-Terminal from being filled up. He repeated this for twenty times. He found there is a pattern between two successive TCP sequence numbers. It turned out that the numbers were not random at all. The latter number was greater than the previous one by 128000.
所以為了讓初始序列號更難預(yù)測农猬,現(xiàn)代系統(tǒng)常常使用半隨機的方法選擇初始序列號,詳細(xì)的方法就不在這里展開了售淡。
第二次握手
當(dāng)服務(wù)器接收到客戶端的連接請求后斤葱,就會向客戶端發(fā)送 ACK 表示自己收到了連接請求,而且揖闸,服務(wù)器還得把自己的初始序列號告訴客戶端苦掘,這其實是兩個步驟,但是發(fā)送一個數(shù)據(jù)包就可以完成楔壤,用的就是前面說的捎帶技術(shù)。圖里的 ACK = client_isn + 1
是指確認(rèn)號字段的值惯驼,要注意和 ACK 標(biāo)志位區(qū)分開蹲嚣。
ACK 字段其實也有不少需要注意的點递瑰,不過這個跟滑動窗口一塊講比較直觀,這里就先不提了隙畜。
這里重點強調(diào)一下抖部,當(dāng)一個 SYN 報文段到達(dá)的時候,服務(wù)器會檢查處于 SYN_RCVD 狀態(tài)的連接數(shù)目是否超過了 tcp_max_syn_backlog
這個參數(shù)议惰,如果超過了慎颗,服務(wù)器就會拒絕連接。當(dāng)然言询,這個也會被黑客所利用俯萎,「SYN Flood」就是個很好的例子运杭。因為服務(wù)器在回復(fù) SYN-ACK 后,會等待客戶端的 ACK 撇眯,如果一定時間內(nèi)沒有收到熊榛,認(rèn)為是丟包了腕巡,就重發(fā) SYN-ACK逸雹,重復(fù)幾次后才會斷開這個連接,linux 可能要一分鐘才會斷開转质,所以攻擊者如果制造一大批 SYN 請求而不回復(fù)休蟹,服務(wù)器的 SYN 隊列很快就被耗盡日矫,這一段時間里哪轿,正常的連接也會得不到響應(yīng)。
服務(wù)器的這種狀態(tài)稱為靜默(muted)杨耙。為了抵御 SYN Flood 攻擊,服務(wù)器可以采用「SYN cookies」容握,這種思想是剔氏,當(dāng) SYN 到達(dá)時竹祷,并不直接為其分配內(nèi)存溶褪,而是把這條連接的信息編碼并保存在 SYN-ACK 報文段的序列號字段,如果客戶端回復(fù)了吹菱,服務(wù)器再從 ACK 字段里解算出 SYN 報文的重要信息(有點黑魔法的感覺了)鳍刷,驗證成功后才為該連接分配內(nèi)存俯抖。這樣芬萍,服務(wù)器不會響應(yīng)攻擊者的請求,正常連接則不會受到影響。
但 SYN cookies 本身有一些限制漫蛔,并不適合作為默認(rèn)選項莽龟,有興趣可以自行 Google。
第三次握手
這是建立 TCP 連接的最后一步剃毒,經(jīng)過前兩次握手迟赃,客戶端(服務(wù)器)已經(jīng)知道對方的滑動窗口大小,初始序列號等信息了纤壁,這不就完了嗎酌媒?為什么還要第三次握手秒咨?
這是因為服務(wù)器雖然把數(shù)據(jù)包發(fā)出去了,但他還不知道客戶端是否收到了這個包雨席,所以服務(wù)器需要等待客戶端返回一個 ACK陡厘,表明客戶端收到了數(shù)據(jù)特占,至此,連接完成谤饭。
連接建立后揉抵,進(jìn)入傳輸數(shù)據(jù)的階段冤今,這里就涉及到很多很多技術(shù),我會另寫文章辟汰。
四次揮手
有了三次握手的基礎(chǔ)帖汞,四次揮手就比較容易理解了:
四次揮手的過程其實很簡單翩蘸,就是服務(wù)器和客戶端互相發(fā)送 FIN 和 ACK 報文段淮逊,告知對方要斷開連接。
四次揮手里值得關(guān)注的一點就是 TIME_WAIT 狀態(tài)郎任,也就是說主動關(guān)閉連接的一方舶治,即使收到了對方的 FIN 報文,也還要等待 2MSL 的時間才會徹底關(guān)閉這條連接尺锚。(這里面的 MSL 指的是最大段生成期瘫辩,指的是報文段在網(wǎng)絡(luò)中被允許存在的最長時間坛悉。)可為什么不直接關(guān)閉連接呢?
一個原因是弧械,第四次揮手的 ACK 報文段不一定到達(dá)了服務(wù)器刃唐,為了不讓服務(wù)器一直處于 LAST_ACK 狀態(tài)(服務(wù)器會重發(fā) FIN画饥,直到收到 ACK)浊猾,客戶端還得等一會兒,看看是否需要重發(fā)衔彻。假如真的丟包了艰额,服務(wù)器發(fā)送 FIN 椒涯,這個 FIN 報文到達(dá)客戶端時不會超過 2MSL(一來一回最多 2MSL),這時候客戶端這邊的 TCP 還沒關(guān)掉狱意,還能重發(fā) ACK拯欧。
另一個原因是,經(jīng)過 2MSL 之后镐作,網(wǎng)絡(luò)中與該連接相關(guān)的包都已經(jīng)消失了滑肉,不會干擾新連接靶庙。我們來看一個例子:假如客戶端向服務(wù)器建立了新的連接六荒,舊連接中某些延遲的數(shù)據(jù)堅持到了新連接建立完畢掏击,而且序列號剛好還在滑動窗口內(nèi),服務(wù)器就誤把它當(dāng)成新連接的數(shù)據(jù)包接收砚亭,如下圖所示:
2MSL 機制就避免了這種情況捅膘。
關(guān)于 TIME_WAIT 還有很多有意思的地方寻仗,我覺得可以單獨再寫一篇文章了署尤,這里就不再多說亚侠。
感覺寫的有點亂了,因為 TCP 的知識確實是有點多混坞,希望各位讀者不要介意啥酱。