簡介:隨著機(jī)器學(xué)習(xí)捉邢、深度學(xué)習(xí)等人工智能技術(shù)在IT領(lǐng)域的廣泛應(yīng)用盖桥,AIOps智能運(yùn)維將為數(shù)字化企業(yè)提供更高的管理效率和更低的運(yùn)營成本勃痴。
在互聯(lián)網(wǎng)和數(shù)字化成為全球經(jīng)濟(jì)增長新引擎的今天恬惯,企業(yè)管理和業(yè)務(wù)運(yùn)行與IT系統(tǒng)健康息息相關(guān)誉尖,高效的IT管理能幫助企業(yè)在瞬息萬變的市場競爭中獲得快人一步的競爭優(yōu)勢。然而云計(jì)算腹暖、虛擬化和微服務(wù)技術(shù)的應(yīng)用使得企業(yè)IT系統(tǒng)越來越龐大而復(fù)雜汇在,要滿足高性能的業(yè)務(wù)運(yùn)行需求絕非易事。
特別是為了提升用戶訪問體驗(yàn)而廣泛采用的分布式應(yīng)用系統(tǒng)和CDN資源脏答,以及越來越復(fù)雜的網(wǎng)絡(luò)接入環(huán)境糕殉,使得IT部門很難第一時(shí)間發(fā)現(xiàn)IT故障的發(fā)生亩鬼。企業(yè)為了保障系統(tǒng)的高可用,降低故障率阿蝶,往往會進(jìn)一步擴(kuò)大IT系統(tǒng)規(guī)模雳锋,于是業(yè)務(wù)增長越快、IT規(guī)模越大羡洁,IT管理的負(fù)擔(dān)越重玷过。
在2016年,Gartner針對IT發(fā)展和運(yùn)維管理的困境筑煮,提出了一種全新的運(yùn)維管理方法辛蚊,以減輕企業(yè)IT的負(fù)擔(dān),提升管理效率真仲,這就是AIOps智能運(yùn)維袋马。AIOps是Algorithmic IT Operations的縮寫,從字面上看是一種基于算法的運(yùn)維方式袒餐,區(qū)別于傳統(tǒng)的人工運(yùn)維和自動化運(yùn)維,通過基于運(yùn)維大數(shù)據(jù)的機(jī)器學(xué)習(xí)谤狡,用智能決策逐步取代人工決策灸眼,提升IT管理效率,因此國內(nèi)業(yè)務(wù)運(yùn)維企業(yè)云智慧把AIOps稱為智能運(yùn)維墓懂。
AIOps的落地焰宣,將把日常的IT管理工作移交給擁有機(jī)器學(xué)習(xí)和自動化運(yùn)維的智能運(yùn)維平臺,大大降低企業(yè)管理的時(shí)間成本和資金投入捕仔。而運(yùn)維管理人員也可以從篩查海量告警信息匕积、執(zhí)行重復(fù)性巡檢任務(wù)、人工判斷故障榜跌、手動解決問題的低效工作中釋放出來闪唆,專注于構(gòu)建更加高效、高擴(kuò)展的IT系統(tǒng)钓葫,支持企業(yè)的數(shù)字化業(yè)務(wù)發(fā)展悄蕾,這也就是業(yè)界所倡導(dǎo)的“IT從運(yùn)維到運(yùn)營”之路。
AIOps智能運(yùn)維平臺還能有效預(yù)測潛在的IT故障础浮,并在無需人為干預(yù)的情況下提前解決掉這些問題帆调,而應(yīng)用系統(tǒng)故障率的降低,將有效提高云計(jì)算資源的使用效率豆同。這得益于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法在IT監(jiān)控和應(yīng)用性能管理系統(tǒng)中的持續(xù)積累番刊,不斷記錄IT運(yùn)維人員在不同場景下使用故障排除或修復(fù)基本問題的自動化工具的操作。當(dāng)針對不同型號設(shè)備影锈、不同應(yīng)用系統(tǒng)芹务、不同的云平臺的學(xué)習(xí)樣本數(shù)據(jù)足夠豐富時(shí)蝉绷,AIOps智能運(yùn)維平臺就可以自動評估系統(tǒng)的健康狀態(tài),如CPU使用率锄禽、磁盤吞吐率潜必、設(shè)備故障率等,如果發(fā)現(xiàn)了系統(tǒng)的異澄值活動磁滚,就能提前自動觸發(fā)相關(guān)運(yùn)維操作。
企業(yè)采用AIOps的能力不僅取決于IT監(jiān)控系統(tǒng)的數(shù)據(jù)規(guī)模和自動化系統(tǒng)的可用性宵晚,還取決于人員和流程的一致性垂攘。服務(wù)商可以在很短時(shí)間內(nèi)把AIOps智能運(yùn)維平臺部署到企業(yè),但任何管理轉(zhuǎn)型都不是安裝一套系統(tǒng)那么簡單淤刃,需要根據(jù)業(yè)務(wù)特點(diǎn)對人員和流程進(jìn)行調(diào)整晒他,而這往往需要更多的時(shí)間。
要衡量AIOps智能運(yùn)維平臺在企業(yè)中的實(shí)施效果逸贾,可以重點(diǎn)關(guān)注兩項(xiàng)關(guān)鍵指標(biāo)陨仅,平均故障恢復(fù)時(shí)間(MTTR)和事務(wù)(故障)處理數(shù)量,這兩項(xiàng)指標(biāo)反映到客戶滿意度上铝侵,就是AIOps的價(jià)值灼伤。
以機(jī)器學(xué)習(xí)、深度學(xué)習(xí)為代表的人工智能技術(shù)的成熟咪鲜,為利用IT手段持續(xù)改善企業(yè)經(jīng)營水平和服務(wù)質(zhì)量鋪平了道路狐赡。而AIOps以IT大數(shù)據(jù)為切入點(diǎn),率先解決了所有數(shù)字化和互聯(lián)網(wǎng)+轉(zhuǎn)型企業(yè)所面臨的業(yè)務(wù)與IT系統(tǒng)斷層的問題疟丙。雖然大多數(shù)機(jī)器學(xué)習(xí)項(xiàng)目可能需要多年才能看到價(jià)值颖侄,但AIOps平臺可以用最小的代價(jià)為企業(yè)運(yùn)營帶來卓越的投資回報(bào)。同時(shí)享郊,這筆投資可以長期持續(xù)的提供業(yè)務(wù)價(jià)值和提升用戶口碑览祖。