一文學(xué)好容器云平臺(tái)穩(wěn)定性預(yù)案建設(shè)

一、背景

容器云平臺(tái)本身比較穩(wěn)定雷酪,但是外界有很多不可控因素,我們?nèi)绾卧谕话l(fā)情況發(fā)生時(shí)涝婉,采取最有效的行動(dòng)哥力,將影響控制在合理區(qū)間內(nèi),這就是我們“緊急預(yù)案”需要做的事情墩弯,也是穩(wěn)定性建設(shè)工作中必不可少的一環(huán)吩跋,如果我們認(rèn)為穩(wěn)定性工作中排第一的是“預(yù)防處理”,那么排第二的肯定是故障發(fā)生后“及時(shí)止損”渔工,預(yù)案建設(shè)和實(shí)施比較依賴工具锌钮,而且還需要不斷有計(jì)劃的“操練”,如果能將預(yù)案建設(shè)前置到產(chǎn)品需求設(shè)計(jì)中涨缚,就會(huì)有事半功倍的效果轧粟。

二、容器云平臺(tái)異常問(wèn)題排查之現(xiàn)狀

容器云平臺(tái)本身比較穩(wěn)定脓魏,但是受到影響之后會(huì)發(fā)生各種異常:

  • 數(shù)據(jù)中臺(tái)占用帶寬導(dǎo)致大面積延時(shí)
  • 資源大戶占用過(guò)多cpu和io導(dǎo)致其他服務(wù)卡頓
  • 磁盤問(wèn)題導(dǎo)致服務(wù)延時(shí)或者不可用

三兰吟、預(yù)案構(gòu)成

一般情況下,一個(gè)完整的緊急預(yù)案茂翔,至少需要包含如下幾個(gè)部分:
1.觸發(fā)條件
執(zhí)行預(yù)案的時(shí)機(jī)混蔼,一般從監(jiān)控大盤、告警或者用戶反饋告知感知故障后珊燎,通過(guò)預(yù)案設(shè)定的觸發(fā)標(biāo)準(zhǔn)來(lái)決定我們是否需要執(zhí)行預(yù)案惭嚣、執(zhí)行哪些預(yù)案。
2.執(zhí)行步驟
預(yù)案執(zhí)行過(guò)程悔政,這里需要注意一點(diǎn)晚吞,預(yù)案的執(zhí)行步驟是需要分角色的,不同角色分工不同:
(1)系統(tǒng)Owner負(fù)責(zé)操作回滾命令或者腳本來(lái)止損
(2)其他同學(xué)負(fù)責(zé)問(wèn)題定位和查看監(jiān)控大盤
(3)Team Leader需要組織團(tuán)隊(duì)內(nèi)同學(xué)協(xié)作并且將故障處理進(jìn)展同步給業(yè)務(wù)方和客服
具體的預(yù)案操作一定要“傻瓜化”谋国,即任何同學(xué)只要有權(quán)限就都能輕易操作槽地,當(dāng)然得提前給一些同學(xué)配置好權(quán)限。
還有一點(diǎn)也需要注意芦瘾,在整個(gè)預(yù)案執(zhí)行過(guò)程中捌蚊,如何觀察執(zhí)行的效果也很重要,可以提前配置好對(duì)應(yīng)的觀察大盤近弟,并記錄在預(yù)案中缅糟。
3.恢復(fù)步驟
等故障恢復(fù)后終止預(yù)案,是“執(zhí)行步驟”的逆操作祷愉。
4.善后方案
為了保證故障對(duì)業(yè)務(wù)影響最低窗宦,維護(hù)云平臺(tái)形象赦颇,一般故障修復(fù)后,我們需要對(duì)故障進(jìn)行復(fù)盤赴涵,確保下次不再犯此類錯(cuò)誤沐扳。
因此,在制定預(yù)案的時(shí)候能將常規(guī)善后方案和工具準(zhǔn)備好也是很有必要的句占。


預(yù)案組成

四、預(yù)案的產(chǎn)品化

為了更有效的管理預(yù)案平臺(tái)躯嫉,云平臺(tái)開始規(guī)劃911預(yù)案平臺(tái)纱烘,預(yù)案平臺(tái)需要和運(yùn)維體系全面打通,真正做到預(yù)案操作的可管控祈餐、可觀察擂啥、可細(xì)分。

1.打通OAP觀測(cè)平臺(tái)

接到告警或者用戶反饋的第一時(shí)間帆阳,借助于一鍵巡檢機(jī)制快速的排查故障范圍內(nèi)的各個(gè)可疑點(diǎn):
云網(wǎng)關(guān)是否正常
網(wǎng)絡(luò)插件是否正常
pod是否正常
磁盤是否正常
etcd是否正常
......

2.拉齊自動(dòng)化運(yùn)維平臺(tái)

借助于chatops能力和一鍵巡檢機(jī)制定位的故障范圍哺壶,通過(guò)自動(dòng)化運(yùn)維機(jī)制快速處理故障。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末蜒谤,一起剝皮案震驚了整個(gè)濱河市山宾,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌鳍徽,老刑警劉巖资锰,帶你破解...
    沈念sama閱讀 211,817評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異阶祭,居然都是意外死亡绷杜,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,329評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門濒募,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)鞭盟,“玉大人,你說(shuō)我怎么就攤上這事瑰剃〕菟撸” “怎么了?”我有些...
    開封第一講書人閱讀 157,354評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵培他,是天一觀的道長(zhǎng)鹃两。 經(jīng)常有香客問(wèn)我,道長(zhǎng)舀凛,這世上最難降的妖魔是什么俊扳? 我笑而不...
    開封第一講書人閱讀 56,498評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮猛遍,結(jié)果婚禮上馋记,老公的妹妹穿的比我還像新娘号坡。我一直安慰自己,他們只是感情好梯醒,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,600評(píng)論 6 386
  • 文/花漫 我一把揭開白布宽堆。 她就那樣靜靜地躺著,像睡著了一般茸习。 火紅的嫁衣襯著肌膚如雪畜隶。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,829評(píng)論 1 290
  • 那天号胚,我揣著相機(jī)與錄音籽慢,去河邊找鬼。 笑死猫胁,一個(gè)胖子當(dāng)著我的面吹牛箱亿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播弃秆,決...
    沈念sama閱讀 38,979評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼届惋,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了菠赚?” 一聲冷哼從身側(cè)響起脑豹,我...
    開封第一講書人閱讀 37,722評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎衡查,沒(méi)想到半個(gè)月后晨缴,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,189評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡峡捡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,519評(píng)論 2 327
  • 正文 我和宋清朗相戀三年击碗,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片们拙。...
    茶點(diǎn)故事閱讀 38,654評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡稍途,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出砚婆,到底是詐尸還是另有隱情械拍,我是刑警寧澤,帶...
    沈念sama閱讀 34,329評(píng)論 4 330
  • 正文 年R本政府宣布装盯,位于F島的核電站坷虑,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏埂奈。R本人自食惡果不足惜迄损,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,940評(píng)論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望账磺。 院中可真熱鬧芹敌,春花似錦痊远、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,762評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至液茎,卻和暖如春逞姿,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背捆等。 一陣腳步聲響...
    開封第一講書人閱讀 31,993評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工哼凯, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人楚里。 一個(gè)月前我還...
    沈念sama閱讀 46,382評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像猎贴,于是被迫代替她去往敵國(guó)和親班缎。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,543評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容