線上問題系統(tǒng)性定位處理方法論

線上問題處理步驟：發(fā)現(xiàn)問題->快速恢復->定位與修復->方法論-為故障和失敗做設計

需關(guān)注的系統(tǒng)參數(shù)：

應用層：接口響應時間地啰，qps,并發(fā)數(shù)

軟件層：jvm,DB策彤，緩存

系統(tǒng)層：CPU栓袖，內(nèi)存，IO

1.發(fā)現(xiàn)問題：人肉主動發(fā)現(xiàn)->生產(chǎn)事件上報->關(guān)聯(lián)系統(tǒng)故障追溯->業(yè)務監(jiān)控報警->系統(tǒng)監(jiān)控報警

2.快速恢復：驗證->排查解決->恢復服務->保留現(xiàn)場

3.定位與修復:

常規(guī)操作：重啟店诗，回滾裹刮，降級，摘機

圖1：現(xiàn)象收集&故障定位

圖2:故障排除&服務恢復

特殊場景：無法定位故障

原則：確保線上服務快速恢復庞瘸，不能完全恢復的情況下捧弃，確保線上服務盡可能少的受到影響

手段：

1）服務降級：定位到服務異常，但不清楚異常原因擦囊，直接降級該服務违霞，確保其他服務不受影響

2）服務緊急擴容：服務器資源飆升但無法定位到問題時，緊急擴容服務器（可能為惡意攻擊瞬场，促銷活動买鸽，秒殺等情況）

3）回退版本：有新版本發(fā)布，但是不能確定故障是否和新版本有關(guān)系贯被，先回退到上一個穩(wěn)定版本

保留現(xiàn)場

1）執(zhí)行top命令眼五，觀察Cpus-ids（CPU的空閑程度）,值過低時，shift+P按使用率倒排彤灶，記錄最耗資源的進程信息

2）執(zhí)行free -m命令看幼，觀察cache行free列的值，值過低是枢希，執(zhí)行top命令桌吃，shift+m按內(nèi)存使用量倒排，記錄最耗資源的進程信息

3）對耗資源進程執(zhí)行ps xuf| grep pid命令,打印進程具體信息并記錄

4）執(zhí)行jstack pid打印日志苞轿，取多組方便比較

5）執(zhí)行jstat -gcutil查看Old區(qū)占用率茅诱，若達到或接近100%，則執(zhí)行jmap -histo pid

常見故障原因

圖3-常見故障原因

圖4-故障畫像

問題排查常用命令：

CPU：top -Hp

內(nèi)存：free -m

IO： iostat

磁盤：df -h

網(wǎng)絡連接：netstat

GC:jstat -gcutil(建議重點了解)

線程：jstack

內(nèi)存：jmap

輔助工具：MAT搬卒，btrace瑟俭，jprofile

4.方法論

系統(tǒng)資源的異常現(xiàn)象：cpu飆高&內(nèi)存不足&磁盤IO高&網(wǎng)絡連接高

服務內(nèi)部的異称跹現(xiàn)象：OOM&異常日志&疑難雜癥(死鎖摆寄、死循環(huán)、等待外部響應)

圖5：逐步排查

5.為故障和失敗做設計

1）故障發(fā)生時盡可能維持系統(tǒng)核心功能的可用性

2）依賴模型&依賴治理

3）超時機制（系統(tǒng)超時、網(wǎng)絡超時微饥、Fail fast）

4) 回退機制

5）熔斷器

最后編輯于：2017.12.10 05:01:26

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末逗扒，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子欠橘，更是在濱河造成了極大的恐慌矩肩，老刑警劉巖，帶你破解...
沈念sama閱讀 219,039評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件肃续，死亡現(xiàn)場離奇詭異黍檩，居然都是意外死亡，警方通過查閱死者的電腦和手機始锚，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,426評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門刽酱，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人瞧捌，你說我怎么就攤上這事棵里。” “怎么了姐呐？”我有些...
開封第一講書人閱讀 165,417評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵衍慎，是天一觀的道長。經(jīng)常有香客問我皮钠，道長稳捆，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,868評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任麦轰，我火速辦了婚禮乔夯，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘款侵。我一直安慰自己末荐，他們只是感情好，可當我...
茶點故事閱讀 67,892評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布新锈。她就那樣靜靜地躺著甲脏，像睡著了一般。火紅的嫁衣襯著肌膚如雪妹笆。梳的紋絲不亂的頭發(fā)上块请，一...
開封第一講書人閱讀 51,692評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音拳缠，去河邊找鬼墩新。笑死，一個胖子當著我的面吹牛窟坐，可吹牛的內(nèi)容都是我干的海渊。我是一名探鬼主播绵疲，決...
沈念sama閱讀 40,416評論 3贊 419
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼臣疑！你這毒婦竟也來了盔憨？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,326評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤讯沈，失蹤者是張志新（化名）和其女友劉穎般渡，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體芙盘，經(jīng)...
沈念sama閱讀 45,782評論 1贊 316
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,957評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年脸秽，在試婚紗的時候發(fā)現(xiàn)自己被綠了儒老。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,102評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡记餐，死狀恐怖驮樊，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情片酝，我是刑警寧澤囚衔，帶...
沈念sama閱讀 35,790評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站雕沿，受9級特大地震影響练湿，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜审轮，卻給世界環(huán)境...
茶點故事閱讀 41,442評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一肥哎、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧疾渣，春花似錦篡诽、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,996評論 0贊 22
一樁弒父案杈女，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至吊圾，卻和暖如春达椰，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背项乒。一陣腳步聲響...
開封第一講書人閱讀 33,113評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工砰碴，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人板丽。一個月前我還...
沈念sama閱讀 48,332評論 3贊 373
代替公主和親
正文我出身青樓呈枉，卻偏偏與公主長得像趁尼，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子猖辫，可洞房花燭夜當晚...
茶點故事閱讀 45,044評論 2贊 355

線上問題系統(tǒng)性定位處理方法論

推薦閱讀更多精彩內(nèi)容