信息大爆炸的時(shí)代窑邦,互聯(lián)網(wǎng)企業(yè)的運(yùn)維人員每天都要處理成千上萬(wàn)的信息。如何處理這種紛繁復(fù)雜的情況壕探?面對(duì)各種運(yùn)維事件冈钦,想獲得足夠的告警信息,單一的監(jiān)控系統(tǒng)往往是不夠的李请。而告警的問(wèn)題若得不到及時(shí)的發(fā)現(xiàn)與處理瞧筛,就很容易受到用戶投訴厉熟。
告警風(fēng)暴來(lái)臨,信息無(wú)法聚合
日新月異的專業(yè)監(jiān)控軟件陸續(xù)問(wèn)世较幌,越來(lái)越多的工具在監(jiān)測(cè)告警方面變得越發(fā)的專注揍瑟、極致。91%的運(yùn)維團(tuán)隊(duì)同時(shí)用著多種監(jiān)控工具乍炉,這些工具每天都會(huì)發(fā)出成百上千個(gè)告警绢片。不幸的是,在這些告警觸發(fā)之前岛琼,只有27%的團(tuán)隊(duì)會(huì)做一些有關(guān)聚合與過(guò)濾的事情底循。那么由此會(huì)產(chǎn)生什么后果呢?運(yùn)維團(tuán)隊(duì)面對(duì)冗雜且繁復(fù)的告警信息槐瑞,會(huì)加重每位成員的負(fù)擔(dān)此叠,經(jīng)常處于精疲力盡的狀態(tài)中。
這樣下去随珠,團(tuán)隊(duì)會(huì)被大量無(wú)休止的告警所湮沒(méi)灭袁。運(yùn)維工程師們很難了解,哪些告警信息才是最關(guān)鍵的窗看?哪些告警信息是重復(fù)可替代的茸歧?哪些告警信息又是可以忽略且清除掉的?于是處理告警就成了最頭疼的事情显沈,而且把時(shí)間都耽誤在了處理錯(cuò)綜復(fù)雜的無(wú)效告警上软瞎,錯(cuò)失掉真正需要關(guān)注的信息。后果就是拉讯,把用戶的怒火點(diǎn)燃了涤浇,難以被補(bǔ)救。
如上所述魔慷,大部分的運(yùn)維團(tuán)隊(duì)購(gòu)買(mǎi)了若干個(gè)監(jiān)控系統(tǒng)用以監(jiān)測(cè)應(yīng)用性能只锭,然而卻會(huì)導(dǎo)致網(wǎng)絡(luò)故障,服務(wù)器不堪重負(fù)院尔,人員配置跟不上等蜻展。除了監(jiān)控系統(tǒng)的安裝數(shù)量過(guò)多,傳統(tǒng)的監(jiān)控方式也是一直以來(lái)很大的問(wèn)題邀摆。由于手動(dòng)效率過(guò)于低下纵顾,盡管 Email 在高風(fēng)險(xiǎn)的事件報(bào)警傳達(dá)中傳播的速度很慢,但在團(tuán)隊(duì)的溝通中也經(jīng)常迫于無(wú)奈被廣泛的使用栋盹。電子郵件的方式不僅沒(méi)有一個(gè)清晰的告警提醒概念施逾,也無(wú)法讓用戶有效的去追蹤報(bào)警侵襲的源頭。
而且從電子郵件中,往往得不到太多有用的價(jià)值去分析汉额,也就無(wú)法真正意義上去衡量系統(tǒng)的健康狀況沪饺。有很多 IT 團(tuán)隊(duì)還經(jīng)常依靠 Excel 表格做記錄、管理監(jiān)控告警事件闷愤。這樣做勢(shì)必會(huì)在監(jiān)管體系里整葡,浪費(fèi)掉大量而又寶貴的時(shí)間。據(jù)不完全統(tǒng)計(jì)讥脐,有一半以上的運(yùn)維團(tuán)隊(duì)對(duì)他們的告警監(jiān)控系統(tǒng)苦不堪言遭居。
無(wú)法篩選重要的告警事件,對(duì)業(yè)務(wù)帶來(lái)巨大挑戰(zhàn)
研究調(diào)查表明旬渠,85%的運(yùn)維團(tuán)隊(duì)都曾錯(cuò)失過(guò)極為嚴(yán)重的告警事件俱萍,并且99%的人都承認(rèn)遺漏掉的告警,對(duì)他們的業(yè)務(wù)發(fā)展有著潛在且巨大的風(fēng)險(xiǎn)告丢。丟失掉的報(bào)警往往會(huì)引發(fā)一系列的問(wèn)題枪蘑,處理不掉就會(huì)很容易造成停工懈怠,而此類問(wèn)題會(huì)急速地降低用戶體驗(yàn)岖免,大幅度縮減企業(yè)收益岳颇,甚至導(dǎo)致企業(yè)面對(duì)更大的商業(yè)威脅。
可見(jiàn)颅湘,強(qiáng)大的告警監(jiān)控武器话侧,在商業(yè)化數(shù)據(jù)化的今天,起著關(guān)鍵性的作用闯参。那么面對(duì)這樣的問(wèn)題瞻鹏,運(yùn)維人員能做些什么呢?是不是所有的監(jiān)控系統(tǒng)除了性能單一鹿寨,就是復(fù)雜難懂新博?有沒(méi)有一種簡(jiǎn)單的告警,集百家之長(zhǎng)脚草,排萬(wàn)家之短赫悄,對(duì)告警信息做些分類和分工,并且能夠自動(dòng)化的升級(jí)呢玩讳?
告警壓縮工具呼之欲出涩蜘,運(yùn)維人員或可嘗試 OneAlert
以下兩個(gè)特性尤為關(guān)鍵:一是需要一棧式地為告警事件的響應(yīng)做出統(tǒng)一且合理的安排和規(guī)劃,最大限度的將告警壓縮粤策,合并信息的根源樟澜,避免低端無(wú)效的告警信息。二是具備自動(dòng)化的升級(jí)功能,能夠把最佳的方案放到最合適的環(huán)境中去運(yùn)用秩贰,并逐層分級(jí)指派給特定的人選霹俺。不斷的調(diào)整優(yōu)化時(shí)間管理流程,以確保能夠?yàn)檫\(yùn)維團(tuán)隊(duì)發(fā)揮最大的益處毒费。國(guó)內(nèi)有一款叫 OneAlert 的工具丙唧,就具備了這樣的功能,運(yùn)維人員可以一試觅玻。
告警監(jiān)控的重要性是不言而喻的想际,找到痛點(diǎn)并有序的進(jìn)行下一步工作,才能夠更好的改善告警響應(yīng)機(jī)制溪厘。
OneAlert 是應(yīng)用性能管理領(lǐng)軍企業(yè) OneAPM 公司旗下產(chǎn)品胡本,也是國(guó)內(nèi)首個(gè) SaaS 模式的云告警平臺(tái),集成國(guó)內(nèi)外主流監(jiān)控/支撐系統(tǒng)畸悬,實(shí)現(xiàn)一個(gè)平臺(tái)上集中處理所有IT事件侧甫,提升IT可靠性。想了解更多信息蹋宦,請(qǐng)?jiān)L問(wèn) OneAlert 官網(wǎng) 披粟。