線上服務(wù)故障處理原則之如何快速的定位和處理系統(tǒng)問題線上故障問題

轉(zhuǎn)自:http://www.cnblogs.com/tylercao/p/7788893.html

墨菲定律

任何事情都沒有表面看起來那么簡單

所有事情的發(fā)展都會比你預(yù)計的時間長

會出錯的事情總會出錯

如果擔(dān)心某個事情發(fā)生昵观,那么它更有可能發(fā)生

墨菲定律暗示我們厚宰,如果擔(dān)心某種情況會發(fā)生,那么它更有可能發(fā)生,久而久之就一定會發(fā)生峻贮。這警示我們逃沿,在互聯(lián)網(wǎng)公司鸵钝,對生成環(huán)境發(fā)生的任何怪異現(xiàn)象和問題都不要輕視吹由,對其背后的原因一定要調(diào)查清楚。同樣才顿,海恩法則也強調(diào)任何嚴(yán)重的事故背后都是很多次小問題的積累莫湘,當(dāng)?shù)揭欢考壓髸?dǎo)致質(zhì)變,嚴(yán)重的問題就會浮出水面郑气。

那么幅垮,我們需要對線上服務(wù)產(chǎn)生任何現(xiàn)象,哪怕是小問題尾组,都要刨根問底忙芒,對任何現(xiàn)象都要遵循下面問題

為什么會發(fā)生 ?

發(fā)生了該怎么應(yīng)對 演怎?

怎么恢復(fù) 匕争?

怎么避免 ?

應(yīng)急目標(biāo)

在生成環(huán)境發(fā)生故障時快速恢復(fù)服務(wù)爷耀,避免或減少故障帶來的損失,避免或減少故障對客戶的影響

應(yīng)急原則

應(yīng)第一時間恢復(fù)系統(tǒng)拍皮,而不是徹底解決呢問題歹叮,快速止損

明顯資金損失時,要第時間升級铆帽,快速止損

指標(biāo)要圍繞目標(biāo)咆耿,快速啟動應(yīng)急過程與止損方案

當(dāng)前負責(zé)人不能短時間內(nèi)解決問題,則必須進行升級處理

處理過程在不影響用戶體驗的前提下爹橱,保留現(xiàn)場

應(yīng)急方法與流程

線上應(yīng)急一般分為 6 個階段

發(fā)現(xiàn)問題

定位問題

解決問題

回顧問題

改進措施

過程中要記住萨螺,應(yīng)急只有一個總體目標(biāo):盡快恢復(fù),消除影響。不管處于哪個階段慰技,首先想到的必須是恢復(fù)問題椭盏,恢復(fù)問題不一定能定位問題,也不一定有完美的解決方案吻商,可能通過經(jīng)驗或者開關(guān)等掏颊。但這可以達到快速恢復(fù)的目的,然后保留現(xiàn)場艾帐,以及定位問題乌叶,解決問題和復(fù)盤

發(fā)現(xiàn)問題

通常我們通過系統(tǒng)層面、應(yīng)用層面和中間件層面監(jiān)控來發(fā)現(xiàn)問題

系統(tǒng)層面監(jiān)控包括

系統(tǒng)的 CPU 使用率

Load average

Memory

I/O (網(wǎng)絡(luò)與磁盤)

SWAP 使用情況

線程數(shù)

File Description 文件描述符等

應(yīng)用層面監(jiān)控包括

接口的響應(yīng)時間

QPS

調(diào)用頻次

接口成功率

接口波動率等

中間件層面監(jiān)控包括數(shù)據(jù)庫柒爸、緩存慢洋、消息隊列。

對數(shù)據(jù)庫的負載啤斗、慢查詢池凄、連接數(shù)等監(jiān)控

對緩存的連接數(shù)、占用內(nèi)存阳藻、吞吐量晰奖、響應(yīng)時間等監(jiān)控

消息隊列的響應(yīng)時間、吞吐量腥泥、負載匾南、堆積情況等監(jiān)控

定位問題

分析定位過程中先考慮系統(tǒng)最近發(fā)生的變化,需要考慮如下幾方面

故障系統(tǒng)最近是否上過線蛔外?

依賴的基礎(chǔ)平臺與資源是否升級過蛆楞?

依賴的系統(tǒng)是否上過線?

運營是否在系統(tǒng)內(nèi)做過運營變更夹厌?

網(wǎng)絡(luò)是否有波動豹爹?

最近的業(yè)務(wù)量是否漲了?

運營方是否有促銷活動矛纹?

解決問題

解決問題要以定位問題為基礎(chǔ)臂聋,必須清晰定位問題產(chǎn)生的根本原因,在提出解決問題的有效方案或南,沒有明確原因之前孩等,不用使用各種方法來嘗試修復(fù)問題,可能還沒有解決這個問題又引入了下個問題采够,想想剛剛提到的墨菲定律

回顧問題

解決問題后肄方,需應(yīng)急團隊與相關(guān)方回顧事故產(chǎn)生的原因、應(yīng)急過程的合理性蹬癌、提出整改措施权她,主要聚焦在以下幾個問題:

類似的問題還有哪些沒有發(fā)生虹茶?

做了哪些事情,事故就不會再發(fā)生隅要?

做了哪些事情蝴罪,及時發(fā)生故障,也不會產(chǎn)生影響拾徙?

改進措施

根據(jù)回顧問題提出的改進措施洲炊,以正式的項目管理方式進行統(tǒng)一管理,采用 SMART 原則來跟進

參考

分布式服務(wù)架構(gòu)原理尼啡、設(shè)計與實戰(zhàn)

相關(guān)學(xué)習(xí)資料移步:


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末暂衡,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子崖瞭,更是在濱河造成了極大的恐慌狂巢,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件书聚,死亡現(xiàn)場離奇詭異唧领,居然都是意外死亡,警方通過查閱死者的電腦和手機雌续,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進店門斩个,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人驯杜,你說我怎么就攤上這事受啥。” “怎么了鸽心?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵滚局,是天一觀的道長。 經(jīng)常有香客問我顽频,道長藤肢,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任糯景,我火速辦了婚禮嘁圈,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘莺奸。我一直安慰自己丑孩,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布灭贷。 她就那樣靜靜地躺著,像睡著了一般略贮。 火紅的嫁衣襯著肌膚如雪甚疟。 梳的紋絲不亂的頭發(fā)上仗岖,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天,我揣著相機與錄音览妖,去河邊找鬼轧拄。 笑死,一個胖子當(dāng)著我的面吹牛讽膏,可吹牛的內(nèi)容都是我干的檩电。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼府树,長吁一口氣:“原來是場噩夢啊……” “哼俐末!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起奄侠,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤卓箫,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后垄潮,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體烹卒,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年弯洗,在試婚紗的時候發(fā)現(xiàn)自己被綠了旅急。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡牡整,死狀恐怖藐吮,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情果正,我是刑警寧澤炎码,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站秋泳,受9級特大地震影響潦闲,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜迫皱,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一歉闰、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧卓起,春花似錦和敬、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至奕筐,卻和暖如春舱痘,著一層夾襖步出監(jiān)牢的瞬間变骡,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工芭逝, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留塌碌,地道東北人。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓旬盯,卻偏偏與公主長得像台妆,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子胖翰,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容