保證系統(tǒng)運行質(zhì)量:三要素

system stability

從前l(fā)eader那邊學(xué)得瓷患,分享給更多的小伙伴

一、異乘懿可預(yù)警:

一個基本要求是竹祷,SDE應(yīng)該在業(yè)務(wù)方感知到問題之前發(fā)現(xiàn)系統(tǒng)異常,而不是被動等待用戶的投訴再層層傳導(dǎo)到SDE羊苟。
基于此要求塑陵,我們目前的有了各種層次維度的預(yù)警機制和系統(tǒng)、
如監(jiān)控CPU蜡励、Memory令花、IO、Network的zabbix凉倚,falcon系統(tǒng)彭则;業(yè)務(wù)指標監(jiān)控;監(jiān)控異常的ELK占遥。
業(yè)務(wù)異常比較容易忽略俯抖,這類異常一定是業(yè)務(wù)強相關(guān)的,頂多有系統(tǒng)工具幫助發(fā)出報警瓦胎,但是邏輯卻需要自己來寫芬萍。一般導(dǎo)致大面積問題的原因是我們認為不合理的情況尤揣,是小概率事件。類似的這類監(jiān)控非常重要柬祠,需要業(yè)務(wù)積累的人的意識北戏。

二、快速可恢復(fù):

假設(shè)第一點我們做到了漫蛔,系統(tǒng)遇到了問題嗜愈,SDE在業(yè)務(wù)方之前就得到了預(yù)警,系統(tǒng)有故障但是由于發(fā)現(xiàn)及時從時間上看還未對大面積用戶造成很壞的影響莽龟;就需要我們具備系統(tǒng)快速可恢復(fù)的能力蠕嫁,當前階段最重要的服務(wù)快速恢復(fù)可用狀態(tài),而不是找到具體原因或者追究責任毯盈。

對應(yīng)的預(yù)警分類我們有如擴容剃毒,回滾,降級等等方式搂赋,按照級別類型分而治之赘阀。

前期系統(tǒng)建設(shè)以及壓力情況還不涉及到擴容和降級的問題,但是回滾卻是常見的脑奠,不要認為回滾很容易基公,一團隊要有這個意識,一定需要培養(yǎng)宋欺;二技術(shù)層面依然有坑酌媒。如何做到系統(tǒng)的可回滾是我們進行大規(guī)模重構(gòu)升級時必須考慮的。當然回滾可退出的意識一定要貫徹整個研發(fā)過程中迄靠。

三、事后可分析:

假設(shè)問題發(fā)現(xiàn)了喇辽,服務(wù)馬上恢復(fù)了掌挚,接下了就是找到具體的原因,并且FIX掉菩咨;
這就要求系統(tǒng)層面要能夠盡可能的保留當時發(fā)生問題的環(huán)境吠式,要有歷史記錄,如CPU抽米、Memory特占、IO、Network等各種技術(shù)LOG數(shù)據(jù)云茸,業(yè)務(wù)LOG數(shù)據(jù)等是目;常見的問題如忘記Dump出來當時的Java內(nèi)存快照,導(dǎo)致很難查找原因标捺;最好開發(fā)出可以一鍵snapshot的腳本幫助解決重復(fù)勞動的事情懊纳。

參考:系統(tǒng)一鍵備份腳本

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末揉抵,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子嗤疯,更是在濱河造成了極大的恐慌冤今,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件茂缚,死亡現(xiàn)場離奇詭異戏罢,居然都是意外死亡,警方通過查閱死者的電腦和手機脚囊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進店門龟糕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人凑术,你說我怎么就攤上這事翩蘸。” “怎么了淮逊?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵催首,是天一觀的道長。 經(jīng)常有香客問我泄鹏,道長郎任,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任备籽,我火速辦了婚禮舶治,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘车猬。我一直安慰自己霉猛,他們只是感情好,可當我...
    茶點故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布珠闰。 她就那樣靜靜地躺著惜浅,像睡著了一般。 火紅的嫁衣襯著肌膚如雪伏嗜。 梳的紋絲不亂的頭發(fā)上坛悉,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天,我揣著相機與錄音承绸,去河邊找鬼裸影。 笑死,一個胖子當著我的面吹牛军熏,可吹牛的內(nèi)容都是我干的轩猩。 我是一名探鬼主播,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼界轩!你這毒婦竟也來了画饥?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤浊猾,失蹤者是張志新(化名)和其女友劉穎抖甘,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體葫慎,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡衔彻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了偷办。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片艰额。...
    茶點故事閱讀 39,711評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖椒涯,靈堂內(nèi)的尸體忽然破棺而出柄沮,到底是詐尸還是另有隱情,我是刑警寧澤废岂,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布祖搓,位于F島的核電站,受9級特大地震影響湖苞,放射性物質(zhì)發(fā)生泄漏拯欧。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一财骨、第九天 我趴在偏房一處隱蔽的房頂上張望镐作。 院中可真熱鬧,春花似錦隆箩、人聲如沸该贾。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽杨蛋。三九已至,卻和暖如春娃属,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背护姆。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工矾端, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人卵皂。 一個月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓秩铆,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子殴玛,可洞房花燭夜當晚...
    茶點故事閱讀 44,611評論 2 353

推薦閱讀更多精彩內(nèi)容