《狼來了》的故事家喻戶曉,頻繁發(fā)送錯(cuò)誤信息就會失去人們的信任惋嚎,“重點(diǎn)論”也曾提到:重點(diǎn)太多杠氢,就無所謂重點(diǎn)。
基于某種特征值設(shè)置告警條件另伍,我們已經(jīng)司空見慣鼻百。例如:關(guān)注某App的成功率,就設(shè)置“成功率低于98%即發(fā)出告警”摆尝,每分鐘5000筆的業(yè)務(wù)高峰期失敗10筆都不會觸發(fā)告警温艇。但在業(yè)務(wù)低峰期,在總共5筆的交易中失敗1筆堕汞,即可讓“成功率低于90%發(fā)出告警”勺爱。
在類似情況下,單一條件的告警會讓運(yùn)維人員盲顧不暇讯检,甚至無法抉擇琐鲁,日積月累就像“狼來了”一樣,讓真正的問題告警埋沒其中人灼。
作為IT運(yùn)維中不可或缺的一環(huán)围段,告警的準(zhǔn)確性直接決定其他功能是否能夠及時(shí)生效,起到畫龍點(diǎn)睛的作用投放。如何幫助運(yùn)維人員更加精準(zhǔn)的發(fā)現(xiàn)問題奈泪,做到正確和高效,不僅僅是一門科學(xué)跪呈,更是一門藝術(shù)段磨。
新運(yùn)維環(huán)境的需求
現(xiàn)有的運(yùn)維環(huán)境對告警規(guī)則的制定、配置工作的流程都提出了更高的需求:
能盡可能貼近真實(shí)情況
能適應(yīng)各種場景
能簡單配置耗绿,自適應(yīng)性強(qiáng)
EZSonar 復(fù)合告警快速發(fā)現(xiàn)故障
適應(yīng)復(fù)雜的運(yùn)維場景
華青融天的AIOps產(chǎn)品EZSonar是新一代業(yè)務(wù)動態(tài)可視化運(yùn)維產(chǎn)品苹支,具備主動性、靈活性误阻、智能性的能力债蜜,通過機(jī)器學(xué)習(xí)的方式實(shí)現(xiàn)異常檢測晴埂、故障分析、故障關(guān)聯(lián)和精準(zhǔn)告警寻定。
01
復(fù)合告警
運(yùn)維人員可以同時(shí)設(shè)置在每分鐘交易量大于1000筆/s儒洛、響應(yīng)時(shí)間大于100ms、成功率小于95%時(shí)產(chǎn)生告警狼速,這樣告警設(shè)置更加靈活琅锻,符合實(shí)際需求,避免誤報(bào)向胡,同時(shí)可以讓其在工作時(shí)間段內(nèi)生效恼蓬。
02
動態(tài)基線
EZSonar的復(fù)合告警就是為應(yīng)對實(shí)際業(yè)務(wù)中復(fù)雜多變的環(huán)境而生的,它為業(yè)務(wù)設(shè)置動態(tài)基線僵芹,允許把多種告警和指標(biāo)進(jìn)行復(fù)合处硬,同時(shí)滿足多條規(guī)則時(shí)才會觸發(fā)告警,擺脫無法設(shè)置靜態(tài)告警的困境拇派。
03
復(fù)合關(guān)聯(lián)告警
高可用水平擴(kuò)展架構(gòu)已成為業(yè)界標(biāo)配荷辕,一個(gè)App由3臺服務(wù)器集群組成,前端用基于連接或應(yīng)用層信息的數(shù)據(jù)包做負(fù)載均衡分發(fā)件豌。
那么疮方,拿單一或多個(gè)不關(guān)聯(lián)的指標(biāo)該如何衡量數(shù)據(jù)進(jìn)出負(fù)載均衡指標(biāo)的變化?負(fù)載均衡造成的交易丟失或延遲又該如何告警苟径?
華青融天憑借豐富的客戶經(jīng)驗(yàn)案站,為使用者提供檢測進(jìn)出設(shè)備指標(biāo)變化的方式躬审,同時(shí)EZSonar可以:
關(guān)聯(lián)節(jié)點(diǎn)前后兩組會話棘街,定義進(jìn)出負(fù)載均衡的響應(yīng)時(shí)間差
允許設(shè)置多條線路會話,按比例分配或匯總計(jì)算的方式進(jìn)行精準(zhǔn)告警承边,以此評估負(fù)載均衡設(shè)備是否產(chǎn)生偏差
EZSonar 簡單的配置方法
給精準(zhǔn)告警帶來可行性
根據(jù)業(yè)務(wù)的特點(diǎn)遭殉,總有一部分系統(tǒng)運(yùn)行無法準(zhǔn)確找到其規(guī)律或特征。EZSonar通過機(jī)器學(xué)習(xí)發(fā)現(xiàn)業(yè)務(wù)的規(guī)律進(jìn)而自動生成告警規(guī)則博助,有效的幫助運(yùn)維人員從運(yùn)維數(shù)據(jù)中了解系統(tǒng)的運(yùn)行狀態(tài)险污,分析定位故障,實(shí)時(shí)獲取統(tǒng)計(jì)數(shù)據(jù)富岳。
告警規(guī)則越細(xì)蛔糯,其反映業(yè)務(wù)真實(shí)問題的準(zhǔn)確度就越高,同時(shí)顆粒度越細(xì)意味著工作量越大窖式。
例如對于一款擁有1000種交易參數(shù)的App蚁飒,傳統(tǒng)規(guī)則只能挑少數(shù)的幾種到幾十種情況進(jìn)行告警。如果該App有上千個(gè)業(yè)務(wù)節(jié)點(diǎn)該怎么辦萝喘?如果它的參數(shù)數(shù)量實(shí)時(shí)變化又該如何淮逻??
對此琼懊,EZSonar告警設(shè)置只需制定一條規(guī)則,便可自動適應(yīng)參數(shù)的無窮變化爬早,無需任何人工干預(yù)哼丈。通過簡化的配置方法給精準(zhǔn)告警帶來了可行性,更重要的是筛严,它的全覆蓋告警可以發(fā)現(xiàn)出現(xiàn)概率小但重要性很高的事件醉旦。
在IT系統(tǒng)和信息架構(gòu)規(guī)模不斷擴(kuò)大的今天,人工分析定位的運(yùn)維方式已很難適應(yīng)快速增長的業(yè)務(wù)需求桨啃。而通過采集當(dāng)前環(huán)境中的運(yùn)維數(shù)據(jù)髓抑,EZSonar利用復(fù)合告警分析,對IT系統(tǒng)中各個(gè)環(huán)節(jié)的問題進(jìn)行快速定位优幸、故障排除和預(yù)測吨拍,為業(yè)務(wù)穩(wěn)定、高效運(yùn)行保駕護(hù)航网杆。
華青融天EZSonar為精細(xì)化告警賦予了全新定義羹饰,高效捕捉“那匹真正的狼”。