五種令人沮喪的告警垃圾及處理辦法拇砰！

在 OneAlert梅忌，我們經常與運維團隊聊天。因為產品開發(fā)過程中除破，這樣的對話有助于了解客戶的真正痛點牧氮。「告警垃圾」——監(jiān)控系統(tǒng)中時常涌現的告警洪流瑰枫，是運維團隊經常提到的一大痛處踱葛。

至于其原因，雖然多種多樣光坝，但造成的后果都是一樣的：信息超載尸诽。如果每天收到幾十條甚至上百條告警提醒，你很難從中找出急需采取行動的緊迫告警盯另。在那些緊迫的告警中逊谋，找出需要立即處理的告警更則難上加難。這種現象有個恰如其分的名字：告警疲勞

五種令人沮喪的告警垃圾及處理辦法

1.每臺主機的告警

你看到的情況：服務器監(jiān)控系統(tǒng)在同一時間發(fā)出5條緊急告警土铺。

實際情況：你的緩存層由20臺服務器組成。其中一臺出現了新的配置錯誤板鬓，導致一系列的內存不足告警悲敷，每臺主機都出現一條告警。

在理想世界中：你只會收到一條告警俭令，告訴你25%的主機集群出現問題后德。而且，如果你當下正忙得不可開交抄腔，可以延后該告警的處理瓢湃。理想情況下理张，告警閥值只在集群層或角色層設置。

2.重要绵患！=緊急

你看到的情況：主機 X雾叭、Y、Z 出現磁盤空間不足警告落蝙。

實際情況：一切盡在意料之中织狐。在正常運轉了三個月之后，主機 X筏勒、Y移迫、Z 存儲的數據逐漸增多」苄校或許你應該升級磁盤厨埋，或許你應該清理一些舊數據，但是捐顷，必須現在就處理么荡陷？在這夜闌人靜的時候？

在理想世界中：除非磁盤使用量突然增多套菜，否則就不是緊急事件亲善。無需觸發(fā)實時告警，只要每周一發(fā)送磁盤使用量報告逗柴，在其中列出磁盤空間不足的主機即可蛹头。如果能依照當前的使用速度，預測剩余的磁盤空間將在何時耗盡戏溺，就更好了渣蜗。

3.非自適應性的閥值

你看到的情況：每個周一，午餐過后旷祸，都會出現大量的告警耕拷。

實際情況：你已經努力工作以優(yōu)化配置 Nagios 監(jiān)控的告警閥值。現在托享，它們不會每天無謂地發(fā)送告警骚烧。但是，一到流量特別大的某個工作日闰围，還是會觸發(fā)意料之中的告警赃绊。你怎么辦？確認該告警羡榴，然后無視它碧查。

在理想世界中：你的流量是有起伏規(guī)律的，監(jiān)控系統(tǒng)能夠掌握這種規(guī)律。如果每到下午1點負載就會增加忠售，告警閥值也應該相應上升传惠。告警只應在出現異常負載時觸發(fā)，否則就是沒有意義的告警稻扬。

4.同樣的問題卦方，不同的系統(tǒng)

你看到的情況：Nagios、Pingdom腐螟、NewRelic愿汰、KeyNote 還有 Splunk 在同一時間發(fā)出重要告警，與此同時乐纸，ZenDesk 上的客戶投訴也不斷增加衬廷。

實際情況：兩個 Mongo 節(jié)點出現數據損壞，導致大量的磁盤 IO 以及事務錯誤汽绢。這類問題會波及服務器層吗跋，應用層以及用戶層。因此宁昭，所有監(jiān)控工具都會發(fā)出告警跌宛。

在理想世界中：你只會從最先捕獲該問題的系統(tǒng)處收到一次告警店溢，此后蜻韭，任何因此而達到告警閥值的監(jiān)控系統(tǒng)都會將其告警信息傳給同一個「事件線程」咳胃。

5.瞬態(tài)告警

你看到的情況：每個人都會遇到這樣的情況峡扩。同樣的問題每隔幾天就出現一次，持續(xù)時間不過幾分鐘鹉戚，來得快去得也快谭贪。說實話斤蔓，你已經忙得不可開交了隆圆，近期內也不大會去排除這種問題漱挚。

實際情況：可能是某個 cron 作業(yè)占用了過量的網絡資源，又或是應用中某個 race-condition 導致了數據庫死鎖渺氧，也可能是某個不常用的功能導致了后端進程崩潰旨涝。

在理想世界中：你可以標記該問題，之后再去解決侣背。這樣白华，你只會在下個月再遇到該問題，并得到一份報告贩耐，顯示了該問題通常的發(fā)生時間（當然還有相鄰時間內容易發(fā)生的問題和與之相關的問題）衬鱼。

你遇到了哪些告警垃圾？想不想與我們分享憔杨？請在文章下面的評論區(qū)留下你的反饋。

OneAlert 是應用性能管理領軍企業(yè) OneAPM 公司旗下產品蒜胖，也是國內首個 SaaS 模式的云告警平臺消别，集成國內外主流監(jiān)控/支撐系統(tǒng)抛蚤，實現一個平臺上集中處理所有 IT 事件，提升 IT 可靠性寻狂。想了解更多信息岁经，請訪問 OneAlert 官網。
本文轉自 OneAPM 官方博客

最后編輯于：2017.11.27 05:23:04

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末蛇券，一起剝皮案震驚了整個濱河市缀壤，隨后出現的幾起案子，更是在濱河造成了極大的恐慌纠亚，老刑警劉巖塘慕，帶你破解...
沈念sama閱讀 212,454評論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現場離奇詭異蒂胞，居然都是意外死亡图呢，警方通過查閱死者的電腦和手機，發(fā)現死者居然都...
沈念sama閱讀 90,553評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門骗随，熙熙樓的掌柜王于貴愁眉苦臉地迎上來蛤织，“玉大人，你說我怎么就攤上這事鸿染≈秆粒” “怎么了？”我有些...
開封第一講書人閱讀 157,921評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵涨椒，是天一觀的道長摊鸡。經常有香客問我，道長丢烘，這世上最難降的妖魔是什么柱宦？我笑而不...
開封第一講書人閱讀 56,648評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮播瞳，結果婚禮上掸刊，老公的妹妹穿的比我還像新娘。我一直安慰自己赢乓，他們只是感情好忧侧，可當我...
茶點故事閱讀 65,770評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著牌芋，像睡著了一般蚓炬。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上躺屁，一...
開封第一講書人閱讀 49,950評論 1贊 291
城市分裂傳說
那天肯夏，我揣著相機與錄音，去河邊找鬼。笑死驯击，一個胖子當著我的面吹牛烁兰，可吹牛的內容都是我干的。我是一名探鬼主播徊都，決...
沈念sama閱讀 39,090評論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼沪斟，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了暇矫？” 一聲冷哼從身側響起主之，我...
開封第一講書人閱讀 37,817評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎李根，沒想到半個月后槽奕，有當地人在樹林里發(fā)現了一具尸體，經...
沈念sama閱讀 44,275評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡朱巨，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 36,592評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年史翘，在試婚紗的時候發(fā)現自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片冀续。...
茶點故事閱讀 38,724評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡琼讽，死狀恐怖，靈堂內的尸體忽然破棺而出洪唐，到底是詐尸還是另有隱情钻蹬，我是刑警寧澤，帶...
沈念sama閱讀 34,409評論 4贊 333
?日本核電站爆炸內幕
正文年R本政府宣布凭需，位于F島的核電站问欠，受9級特大地震影響，放射性物質發(fā)生泄漏粒蜈。R本人自食惡果不足惜顺献，卻給世界環(huán)境...
茶點故事閱讀 40,052評論 3贊 316
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望枯怖。院中可真熱鬧注整，春花似錦、人聲如沸度硝。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,815評論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽蕊程。三九已至椒袍，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間藻茂，已是汗流浹背驹暑。一陣腳步聲響...
開封第一講書人閱讀 32,043評論 1贊 266
情欲美人皮
我被黑心中介騙來泰國打工玫恳，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人优俘。一個月前我還...
沈念sama閱讀 46,503評論 2贊 361
代替公主和親
正文我出身青樓纽窟，卻偏偏與公主長得像，于是被迫代替她去往敵國和親兼吓。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 43,627評論 2贊 350

五種令人沮喪的告警垃圾及處理辦法！