線上問題系統(tǒng)性定位處理方法論

線上問題處理步驟:發(fā)現(xiàn)問題->快速恢復->定位與修復->方法論-為故障和失敗做設計

需關(guān)注的系統(tǒng)參數(shù):

應用層:接口響應時間地啰,qps,并發(fā)數(shù)

軟件層:jvm,DB策彤,緩存

系統(tǒng)層:CPU栓袖,內(nèi)存,IO

1.發(fā)現(xiàn)問題:人肉主動發(fā)現(xiàn)->生產(chǎn)事件上報->關(guān)聯(lián)系統(tǒng)故障追溯->業(yè)務監(jiān)控報警->系統(tǒng)監(jiān)控報警

2.快速恢復:驗證->排查解決->恢復服務->保留現(xiàn)場

3.定位與修復:

常規(guī)操作:重啟店诗,回滾裹刮,降級,摘機


圖1:現(xiàn)象收集&故障定位


圖2:故障排除&服務恢復

特殊場景:無法定位故障

原則:確保線上服務快速恢復庞瘸,不能完全恢復的情況下捧弃,確保線上服務盡可能少的受到影響

手段:

1)服務降級:定位到服務異常,但不清楚異常原因擦囊,直接降級該服務违霞,確保其他服務不受影響

2)服務緊急擴容:服務器資源飆升但無法定位到問題時,緊急擴容服務器(可能為惡意攻擊瞬场,促銷活動买鸽,秒殺等情況)

3)回退版本:有新版本發(fā)布,但是不能確定故障是否和新版本有關(guān)系贯被,先回退到上一個穩(wěn)定版本

保留現(xiàn)場

1)執(zhí)行top命令眼五,觀察Cpus-ids(CPU的空閑程度),值過低時,shift+P按使用率倒排彤灶,記錄最耗資源的進程信息

2)執(zhí)行free -m命令看幼,觀察cache行free列的值,值過低是枢希,執(zhí)行top命令桌吃,shift+m按內(nèi)存使用量倒排,記錄最耗資源的進程信息

3)對耗資源進程執(zhí)行ps xuf| grep pid命令,打印進程具體信息并記錄

4)執(zhí)行jstack pid打印日志苞轿,取多組方便比較

5)執(zhí)行jstat -gcutil查看Old區(qū)占用率茅诱,若達到或接近100%,則執(zhí)行jmap -histo pid

常見故障原因


圖3-常見故障原因


圖4-故障畫像

問題排查常用命令:

CPU:top -Hp

內(nèi)存:free -m

IO: iostat

磁盤:df -h

網(wǎng)絡連接:netstat

GC:jstat -gcutil(建議重點了解)

線程:jstack

內(nèi)存:jmap

輔助工具:MAT搬卒,btrace瑟俭,jprofile

4.方法論

系統(tǒng)資源的異常現(xiàn)象:cpu飆高&內(nèi)存不足&磁盤IO高&網(wǎng)絡連接高

服務內(nèi)部的異称跹現(xiàn)象:OOM&異常日志&疑難雜癥(死鎖摆寄、死循環(huán)、等待外部響應)


圖5:逐步排查

5.為故障和失敗做設計

1)故障發(fā)生時盡可能維持系統(tǒng)核心功能的可用性

2)依賴模型&依賴治理

3)超時機制(系統(tǒng)超時、網(wǎng)絡超時微饥、Fail fast)

4) 回退機制

5)熔斷器

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末逗扒,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子欠橘,更是在濱河造成了極大的恐慌矩肩,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件肃续,死亡現(xiàn)場離奇詭異黍檩,居然都是意外死亡,警方通過查閱死者的電腦和手機始锚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進店門刽酱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人瞧捌,你說我怎么就攤上這事棵里。” “怎么了姐呐?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵衍慎,是天一觀的道長。 經(jīng)常有香客問我皮钠,道長稳捆,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任麦轰,我火速辦了婚禮乔夯,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘款侵。我一直安慰自己末荐,他們只是感情好,可當我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布新锈。 她就那樣靜靜地躺著甲脏,像睡著了一般。 火紅的嫁衣襯著肌膚如雪妹笆。 梳的紋絲不亂的頭發(fā)上块请,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天,我揣著相機與錄音拳缠,去河邊找鬼墩新。 笑死,一個胖子當著我的面吹牛窟坐,可吹牛的內(nèi)容都是我干的海渊。 我是一名探鬼主播绵疲,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼臣疑!你這毒婦竟也來了盔憨?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤讯沈,失蹤者是張志新(化名)和其女友劉穎般渡,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體芙盘,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年脸秽,在試婚紗的時候發(fā)現(xiàn)自己被綠了儒老。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡记餐,死狀恐怖驮樊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情片酝,我是刑警寧澤囚衔,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站雕沿,受9級特大地震影響练湿,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜审轮,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一肥哎、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧疾渣,春花似錦篡诽、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至吊圾,卻和暖如春达椰,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背项乒。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工砰碴, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人板丽。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓呈枉,卻偏偏與公主長得像趁尼,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子猖辫,可洞房花燭夜當晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容