五種令人沮喪的告警垃圾及處理辦法拇砰!

OneAlert梅忌,我們經常與運維團隊聊天。因為產品開發(fā)過程中除破,這樣的對話有助于了解客戶的真正痛點牧氮。「告警垃圾」——監(jiān)控系統(tǒng)中時常涌現的告警洪流瑰枫,是運維團隊經常提到的一大痛處踱葛。

至于其原因,雖然多種多樣光坝,但造成的后果都是一樣的:信息超載尸诽。如果每天收到幾十條甚至上百條告警提醒,你很難從中找出急需采取行動的緊迫告警盯另。在那些緊迫的告警中逊谋,找出需要立即處理的告警更則難上加難。這種現象有個恰如其分的名字:告警疲勞

五種令人沮喪的告警垃圾及處理辦法
1.每臺主機的告警

你看到的情況:服務器監(jiān)控系統(tǒng)在同一時間發(fā)出5條緊急告警土铺。

實際情況:你的緩存層由20臺服務器組成。其中一臺出現了新的配置錯誤板鬓,導致一系列的內存不足告警悲敷,每臺主機都出現一條告警。

在理想世界中:你只會收到一條告警俭令,告訴你25%的主機集群出現問題后德。而且,如果你當下正忙得不可開交抄腔,可以延后該告警的處理瓢湃。理想情況下理张,告警閥值只在集群層或角色層設置。

2.重要绵患!=緊急

你看到的情況:主機 X雾叭、Y、Z 出現磁盤空間不足警告落蝙。

實際情況:一切盡在意料之中织狐。在正常運轉了三個月之后,主機 X筏勒、Y移迫、Z 存儲的數據逐漸增多」苄校或許你應該升級磁盤厨埋,或許你應該清理一些舊數據,但是捐顷,必須現在就處理么荡陷?在這夜闌人靜的時候?

在理想世界中:除非磁盤使用量突然增多套菜,否則就不是緊急事件亲善。無需觸發(fā)實時告警,只要每周一發(fā)送磁盤使用量報告逗柴,在其中列出磁盤空間不足的主機即可蛹头。如果能依照當前的使用速度,預測剩余的磁盤空間將在何時耗盡戏溺,就更好了渣蜗。

3.非自適應性的閥值

你看到的情況:每個周一,午餐過后旷祸,都會出現大量的告警耕拷。

實際情況:你已經努力工作以優(yōu)化配置 Nagios 監(jiān)控的告警閥值。現在托享,它們不會每天無謂地發(fā)送告警骚烧。但是,一到流量特別大的某個工作日闰围,還是會觸發(fā)意料之中的告警赃绊。你怎么辦?確認該告警羡榴,然后無視它碧查。

在理想世界中:你的流量是有起伏規(guī)律的,監(jiān)控系統(tǒng)能夠掌握這種規(guī)律。如果每到下午1點負載就會增加忠售,告警閥值也應該相應上升传惠。告警只應在出現異常負載時觸發(fā),否則就是沒有意義的告警稻扬。

4.同樣的問題卦方,不同的系統(tǒng)

你看到的情況:Nagios、Pingdom腐螟、NewRelic愿汰、KeyNote 還有 Splunk 在同一時間發(fā)出重要告警,與此同時乐纸,ZenDesk 上的客戶投訴也不斷增加衬廷。

實際情況:兩個 Mongo 節(jié)點出現數據損壞,導致大量的磁盤 IO 以及事務錯誤汽绢。這類問題會波及服務器層吗跋,應用層以及用戶層。因此宁昭,所有監(jiān)控工具都會發(fā)出告警跌宛。

在理想世界中:你只會從最先捕獲該問題的系統(tǒng)處收到一次告警店溢,此后蜻韭,任何因此而達到告警閥值的監(jiān)控系統(tǒng)都會將其告警信息傳給同一個「事件線程」咳胃。

5.瞬態(tài)告警

你看到的情況:每個人都會遇到這樣的情況峡扩。同樣的問題每隔幾天就出現一次,持續(xù)時間不過幾分鐘鹉戚,來得快去得也快谭贪。說實話斤蔓,你已經忙得不可開交了隆圆,近期內也不大會去排除這種問題漱挚。

實際情況:可能是某個 cron 作業(yè)占用了過量的網絡資源,又或是應用中某個 race-condition 導致了數據庫死鎖渺氧,也可能是某個不常用的功能導致了后端進程崩潰旨涝。

在理想世界中:你可以標記該問題,之后再去解決侣背。這樣白华,你只會在下個月再遇到該問題,并得到一份報告贩耐,顯示了該問題通常的發(fā)生時間(當然還有相鄰時間內容易發(fā)生的問題和與之相關的問題)衬鱼。

你遇到了哪些告警垃圾?想不想與我們分享憔杨?請在文章下面的評論區(qū)留下你的反饋。

OneAlert 是應用性能管理領軍企業(yè) OneAPM 公司旗下產品蒜胖,也是國內首個 SaaS 模式的云告警平臺消别,集成國內外主流監(jiān)控/支撐系統(tǒng)抛蚤,實現一個平臺上集中處理所有 IT 事件,提升 IT 可靠性寻狂。想了解更多信息岁经,請訪問 OneAlert 官網 。
本文轉自 OneAPM 官方博客

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末蛇券,一起剝皮案震驚了整個濱河市缀壤,隨后出現的幾起案子,更是在濱河造成了極大的恐慌纠亚,老刑警劉巖塘慕,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異蒂胞,居然都是意外死亡图呢,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進店門骗随,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蛤织,“玉大人,你說我怎么就攤上這事鸿染≈秆粒” “怎么了?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵涨椒,是天一觀的道長摊鸡。 經常有香客問我,道長丢烘,這世上最難降的妖魔是什么柱宦? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮播瞳,結果婚禮上掸刊,老公的妹妹穿的比我還像新娘。我一直安慰自己赢乓,他們只是感情好忧侧,可當我...
    茶點故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著牌芋,像睡著了一般蚓炬。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上躺屁,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天肯夏,我揣著相機與錄音,去河邊找鬼。 笑死驯击,一個胖子當著我的面吹牛烁兰,可吹牛的內容都是我干的。 我是一名探鬼主播徊都,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼沪斟,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了暇矫?” 一聲冷哼從身側響起主之,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎李根,沒想到半個月后槽奕,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡朱巨,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年史翘,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片冀续。...
    茶點故事閱讀 38,724評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡琼讽,死狀恐怖,靈堂內的尸體忽然破棺而出洪唐,到底是詐尸還是另有隱情钻蹬,我是刑警寧澤,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布凭需,位于F島的核電站问欠,受9級特大地震影響,放射性物質發(fā)生泄漏粒蜈。R本人自食惡果不足惜顺献,卻給世界環(huán)境...
    茶點故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望枯怖。 院中可真熱鬧注整,春花似錦、人聲如沸度硝。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蕊程。三九已至椒袍,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間藻茂,已是汗流浹背驹暑。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工玫恳, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人优俘。 一個月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓纽窟,卻偏偏與公主長得像,于是被迫代替她去往敵國和親兼吓。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,627評論 2 350

推薦閱讀更多精彩內容