TCP TIME_WAIT解決辦法

參考

TCP_TW_RECYCLE
It enables fast recycling of TIME_WAIT sockets. ... Known to cause some issues with hoststated (load balancing and fail over) if enabled, should be used with caution.
TCP_TW_REUSE
This allows reusing sockets in TIME_WAIT state for new connections when it is safe from protocol viewpoint. Default value is 0 (disabled). It is generally a safer alternative to tcp_tw_recycle
Note: The tcp_tw_reuse setting is particularly useful in environments where numerous short connections are open and left in TIME_WAIT state, such as web servers. Reusing the sockets can be very effective in reducing server load.

NOTE: net.ipv4.tcp_tw_recycle has been removed from Linux?4.12.
SOURCE: https://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux
我看到ubuntu18.04版本是linux 4.15

使用TIME_WAIT導致的錯誤后果

**
若TIME_WAIT事件設置過短, 會導致錯誤后果
TIME_WAIT結束過早, 導致之前迷失的第三次握手突然到達, 新連接突然成功



TIME_WAIT結束過早, 若最后的ACK丟失, 卻過早結束TIME_WAIT, 導致新連接發(fā)起連接請求時, 舊連接還未關閉狀態(tài), 拒絕連接

小總結

  • 最合適的解決方案是增加更多的四元組數(shù)目, 比如, 服務器可用端口, 或服務器IP, 讓服務器能容納足夠多的TIME-WAIT狀態(tài)連接旅敷。
  • 在我們常見的互聯(lián)網(wǎng)架構中(NGINX反代跟NGINX,NGINX跟FPM,F(xiàn)PM跟redis、mysql、memcache等), 減少TIME-WAIT狀態(tài)的TCP連接涕蚤,最有效的是使用長連接宪卿,不要用短連接, 尤其是負載均衡跟web服務器之間. 尤其是鏈家事件中的PHP連不上redis

TCP_TW_RECYCLE分析1

在4.12之后的內(nèi)核已移除tcp_tw_recycle內(nèi)核參數(shù):
https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=4396e46187ca5070219b81773c4e65088dac50cc

TCP_TW_RECYCLE分析2

會快速回收socket

相較于tcp_tw_reuse只在需要時重用TIME_WAIT狀態(tài)socket, tcp_tw_recycle處理更激進万栅,它會快速回收TIME_WAIT狀態(tài)的socket佑钾。
內(nèi)核代碼中有定時器來調(diào)用tcp_time_wait函數(shù)來處理TIME_WAIT狀態(tài)的socket,函數(shù)源碼如下:
(省略源碼)
從代碼上可以看到只有當tcp_timestamps和tcp_tw_recycle都開啟時烦粒,才會快速回收休溶。

回收時間

而根據(jù)代碼:

const int rto = (icsk->icsk_rto << 2) - (icsk->icsk_rto >> 1);

可以看到回收的超時時間為3.5 * RTO, RTO是由TCP分段中timestamp選項計算得到的,一般場景下這個時間在幾百毫秒左右扰她。

可主動跳過TIME_WAIT

從上面的tcp_time_wait源碼也可以看出, 當TIME_WAIT狀態(tài)的socket數(shù)量超過tcp_max_tw_buckets選項指定的數(shù)量值時兽掰,會直接關閉socket,進入CLOSED狀態(tài)徒役,內(nèi)核日志中會報錯:

TCP: time wait bucket table overflow

的錯誤孽尽。若把tcp_max_tw_buckets選項設置為0,則可以直接跳過TIME_WAIT狀態(tài)忧勿。

NAT下服務端引發(fā)的問題

然而杉女,tcp_tw_recycle選項在NAT環(huán)境使用有一些隱患,下面來分析一下鸳吸。
協(xié)議棧收到syn包時會調(diào)用到函數(shù)tcp_v4_conn_request, 該函數(shù)部分源碼如下:
(省略linux內(nèi)核TCP源碼)
從代碼上我們可以看到熏挎,當開啟tcp_timestampstcp_tw_recycle選項時,60秒內(nèi)來自同一源IP主機的TCP分段的時間戳必須遞增晌砾,否則該分段會被直接丟棄坎拐。
假如多個客戶端從NAT環(huán)境訪問服務器,服務器端看到的對端IP是一樣的养匈,但是TCP分段的時間戳會不一樣哼勇。當時間戳較大的客戶端連接成功后的60秒內(nèi),時間戳較小的客戶端再次連接服務器乖寒,syn包會被服務器直接丟棄猴蹂,導致連接失敗。

tcp_tw_reuse

參考

  • tcp_tw_reuse只在連接時起作用
  • 被拋棄的tcp_recycle
    tcp_tw_reuse設置的是內(nèi)核變量sysctl_tcp_tw_reuse楣嘁,而這個變量僅在tcp_twsk_unique函數(shù)中使用磅轻。而這個函數(shù)的調(diào)用路徑有且僅有一個:tcp_v4_connect->inet_hash_connect->__inet_check_established->twsk_unique->twsk_unique
// net/ipv4/tcp_ipv4.c
int tcp_twsk_unique(struct sock *sk, struct sock *sktw, void *twp)
{
    /* ……省略…… */    
    if (tcptw->tw_ts_recent_stamp &&
        (!twp || (sock_net(sk)->ipv4.sysctl_tcp_tw_reuse &&  
        get_seconds() - tcptw->tw_ts_recent_stamp > 1))) {
         /* ……省略…… */          
        return 1;
    }
    return 0; }
  1. 也就是說tcp_tw_reuse僅在TCP套接字作為客戶端逐虚,調(diào)用connect時起作用聋溜。絕大部分的TCP服務器,應該不會有大量主動連接的動作(或許會連接DB等叭爱,但一般也是長連接)撮躁。因此這個選項對于TCP服務來說,基本上是無用的买雾,完全是沒必要打開把曼,甚至可能還會給一些初級的運維工程師帶來迷惑和干擾杨帽。
  2. 如果新的時間戳比之前存儲的時間戳更大,那么Linux將會從TIME-WAIT狀態(tài)的存活連接中選取一個嗤军,重新分配給新的連接出去的的TCP連接注盈,這種情況下,TIME-WAIT的連接相當于只需要1秒就可以被復用了叙赚。

SO_LINGER和SO_REUSEADDR

這兩個應該都是setsockopt的參數(shù)

總結

tcp_tw_reuse和tcp_tw_recycle都需要通信雙方開啟net.ipv4.tcp_timestamps(默認開啟的)

net.ipv4.tcp_fin_timeout = 30 表示如果套接字由本端要求關閉老客,這個參數(shù)決定了它保持在FIN-WAIT-2狀態(tài)的時間。
net.ipv4.tcp_keepalive_time = 1200 表示當keepalive起用的時候震叮,TCP發(fā)送keepalive消息的頻度胧砰。缺省是2小時,改為20分鐘

假如是客戶端-負載均衡nginx-服務端架構

  • 對于服務端:
    • tcp_tw_reuse沒啥用, 因為是用于發(fā)起連接的
    • tcp_tw_recycle不要用, 因為在NAT下會有問題
  • 對于nginx:
    • 以客戶端身份連接服務端時, tcp_tw_reuse能回收端口, 可以考慮用, 但最好還是改成長連接.
    • tcp_tw_recycle
常用的參數(shù)
net.ipv4.ip_local_port_range = 9000 6553 # 默認值范圍較小
net.ipv4.tcp_max_tw_buckets = 10000 # 默認值較小苇瓣,還可適當調(diào)小
net.ipv4.tcp_tw_reuse = 1 #
net.ipv4.tcp_fin_timeout = 10 #`
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末尉间,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子击罪,更是在濱河造成了極大的恐慌乌妒,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件外邓,死亡現(xiàn)場離奇詭異,居然都是意外死亡古掏,警方通過查閱死者的電腦和手機损话,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來槽唾,“玉大人丧枪,你說我怎么就攤上這事∨悠迹” “怎么了拧烦?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長钝计。 經(jīng)常有香客問我恋博,道長,這世上最難降的妖魔是什么私恬? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任债沮,我火速辦了婚禮,結果婚禮上本鸣,老公的妹妹穿的比我還像新娘疫衩。我一直安慰自己,他們只是感情好荣德,可當我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布闷煤。 她就那樣靜靜地躺著童芹,像睡著了一般。 火紅的嫁衣襯著肌膚如雪鲤拿。 梳的紋絲不亂的頭發(fā)上假褪,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天,我揣著相機與錄音皆愉,去河邊找鬼嗜价。 笑死,一個胖子當著我的面吹牛幕庐,可吹牛的內(nèi)容都是我干的久锥。 我是一名探鬼主播,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼异剥,長吁一口氣:“原來是場噩夢啊……” “哼瑟由!你這毒婦竟也來了?” 一聲冷哼從身側響起冤寿,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤歹苦,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后督怜,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體殴瘦,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年号杠,在試婚紗的時候發(fā)現(xiàn)自己被綠了蚪腋。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡姨蟋,死狀恐怖屉凯,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情眼溶,我是刑警寧澤悠砚,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站堂飞,受9級特大地震影響灌旧,放射性物質發(fā)生泄漏。R本人自食惡果不足惜酝静,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一节榜、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧别智,春花似錦宗苍、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽让歼。三九已至,卻和暖如春丽啡,著一層夾襖步出監(jiān)牢的瞬間谋右,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工补箍, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留改执,地道東北人。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓坑雅,卻偏偏與公主長得像辈挂,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子裹粤,可洞房花燭夜當晚...
    茶點故事閱讀 44,927評論 2 355