k8s集群整個down淹接,主機反復重啟---承接上一篇文章(k8s一節(jié)點ip無故反復斷連接)

現(xiàn)象:

測試環(huán)境十性,某 運維人員在做例行變更(增加zabbix監(jiān)控主機資源),并增加根目錄空間蹈集,重啟某一臺node節(jié)點后烁试,所有node節(jié)點出現(xiàn)重啟,并且一直重啟拢肆,無法正常服務

環(huán)境:

k8s集群運行于vSphere 虛擬化平臺上,版本centos7.4

結論:

在部署的k8s集群的時候减响,之前由于根目錄空間不足,將docker默認使用的/var/lib/docker 目錄link到/app/docker-data/docker目錄下面郭怪,不知道是否是bug支示,已經(jīng)運行一年多的集群,居然突然出現(xiàn)node節(jié)點重啟鄙才。后面重裝所有master颂鸿,node節(jié)點的docker,并且沿用/var/lib/docker(目錄非link)攒庵,問題解決

定位過程:

1.前期基本定位

  • 該問題很難定位嘴纺,因為虛擬機一直在重啟,開始主要在定位操作系統(tǒng)的重啟原因浓冒,但是根本沒有定位出問題栽渴,只能看到:
    `
    ausearch -i -m system_boot,system_shutdown | tail -4

type=SYSTEM_BOOT msg=audit(06/29/2020 19:10:02.821:7) : pid=832 uid=root auid=unset ses=unset msg=' comm=systemd-update-utmp exe=/usr/lib/systemd/systemd-update-utmp hostname=? addr=? terminal=? res=success'

type=SYSTEM_BOOT msg=audit(06/29/2020 20:14:27.786:7) : pid=830 uid=root auid=unset ses=unset msg=' comm=systemd-update-utmp exe=/usr/lib/systemd/systemd-update-utmp hostname=? addr=? terminal=? res=success'
`
沒有任何價值。

  • 聯(lián)想到由于做了zabbix的監(jiān)控稳懒,故停止監(jiān)控闲擦,停止后,node節(jié)點依然重啟
  • 通過vSphere斷掉虛擬機網(wǎng)卡,發(fā)現(xiàn)節(jié)點不在重啟墅冷,懷疑是網(wǎng)絡問題
  • 停止caclio插件纯路,node節(jié)點依然重啟,并停止node節(jié)點上的caclio容器寞忿,停止后驰唬,node節(jié)點依然重啟;再次啟動caclio插件后罐脊,我艸定嗓,問題出來了,master節(jié)點也掛了萍桌,整個k8s測試集群全部在重啟,暈死凌简。上炎。。

2.第二個階段

  • 整個集群全部掛了雏搂,那只能找其中一臺來定位藕施,首要任務是恢復master,node節(jié)點先等等凸郑。
  • 虛擬機啟動后裳食,先停止兩個服務:
    systemctl stop docker
    systemctl stop kubelet
    停止以后,虛擬機沒有再次出現(xiàn)重啟的問題
  • 啟動docker芙沥,并停止docker里面的所有容器诲祸,虛擬機沒有繼續(xù)重啟
  • 啟動master節(jié)點上的keepalived,發(fā)現(xiàn)keepalived一旦啟動而昨,虛擬機立刻重啟救氯,難道和keepalived有關系
  • 在node節(jié)點啟動下keepalived ,同樣會重啟歌憨,在其他裝有容器的虛擬機上着憨,啟動keepalived ,并沒法發(fā)生重啟务嫡,相同鏡像版本的keepalived甲抖,什么鬼?心铃?
  • 難道不是keepalived的問題准谚,而是docker的問題;重復上面的步驟:即停止容器和kubelet于个。并停止docker里面的所有容器氛魁,啟動其他容器服務,本次在master節(jié)點操作,運行的服務是haproxy,結果虛擬機秀存。難道是docker問題捶码,docker用的版本是:Docker version 18.06.1-ce, build e68fc7a,也是一個成熟的版本或链,不該有問題才是惫恼;
  • 看了好久的docker日志,也沒有看出什么問題來澳盐,啟動docker都正常祈纯,就是不能啟用服務
  • 偶然想到,之前docker的文件放在/var/lib/docker ,且是link到叼耙,改回源目錄/var/lib/docker腕窥,重啟docker以后,再次嘗試筛婉,依然不行簇爆;重裝docker,并使用默認的目錄/var/lib/docker,然后再次驗證發(fā)現(xiàn)問題不在出現(xiàn)
  • 恢復集群爽撒,重裝下docker入蛆,并且擴下根目錄,問題搞定硕勿,但是為何導致主機重啟哨毁,還未發(fā)現(xiàn)原因。新裝虛擬機源武,并重裝docker扼褪,也做成link,無法重現(xiàn)软能。迎捺。。查排。
  • 且運行了一年有余都沒問題凳枝,再次先做記錄,后面先規(guī)避此類問題先跋核,有空的時候去dockerhub上看看是否有類似bug岖瑰。
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市砂代,隨后出現(xiàn)的幾起案子蹋订,更是在濱河造成了極大的恐慌,老刑警劉巖刻伊,帶你破解...
    沈念sama閱讀 212,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件露戒,死亡現(xiàn)場離奇詭異椒功,居然都是意外死亡,警方通過查閱死者的電腦和手機智什,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,755評論 3 385
  • 文/潘曉璐 我一進店門动漾,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人荠锭,你說我怎么就攤上這事旱眯。” “怎么了证九?”我有些...
    開封第一講書人閱讀 158,369評論 0 348
  • 文/不壞的土叔 我叫張陵删豺,是天一觀的道長。 經(jīng)常有香客問我愧怜,道長呀页,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,799評論 1 285
  • 正文 為了忘掉前任拥坛,我火速辦了婚禮赔桌,結果婚禮上,老公的妹妹穿的比我還像新娘渴逻。我一直安慰自己,他們只是感情好音诫,可當我...
    茶點故事閱讀 65,910評論 6 386
  • 文/花漫 我一把揭開白布惨奕。 她就那樣靜靜地躺著,像睡著了一般竭钝。 火紅的嫁衣襯著肌膚如雪梨撞。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 50,096評論 1 291
  • 那天香罐,我揣著相機與錄音卧波,去河邊找鬼。 笑死庇茫,一個胖子當著我的面吹牛港粱,可吹牛的內容都是我干的。 我是一名探鬼主播旦签,決...
    沈念sama閱讀 39,159評論 3 411
  • 文/蒼蘭香墨 我猛地睜開眼查坪,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了宁炫?” 一聲冷哼從身側響起偿曙,我...
    開封第一講書人閱讀 37,917評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎羔巢,沒想到半個月后望忆,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體罩阵,經(jīng)...
    沈念sama閱讀 44,360評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,673評論 2 327
  • 正文 我和宋清朗相戀三年启摄,在試婚紗的時候發(fā)現(xiàn)自己被綠了稿壁。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,814評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡鞋仍,死狀恐怖常摧,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情威创,我是刑警寧澤落午,帶...
    沈念sama閱讀 34,509評論 4 334
  • 正文 年R本政府宣布,位于F島的核電站肚豺,受9級特大地震影響溃斋,放射性物質發(fā)生泄漏。R本人自食惡果不足惜吸申,卻給世界環(huán)境...
    茶點故事閱讀 40,156評論 3 317
  • 文/蒙蒙 一梗劫、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧截碴,春花似錦梳侨、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至哲虾,卻和暖如春丙躏,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背束凑。 一陣腳步聲響...
    開封第一講書人閱讀 32,123評論 1 267
  • 我被黑心中介騙來泰國打工晒旅, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人汪诉。 一個月前我還...
    沈念sama閱讀 46,641評論 2 362
  • 正文 我出身青樓废恋,卻偏偏與公主長得像,于是被迫代替她去往敵國和親摩瞎。 傳聞我的和親對象是個殘疾皇子拴签,可洞房花燭夜當晚...
    茶點故事閱讀 43,728評論 2 351