人工智能和機器學習技術(shù)的發(fā)展夭问,推動大量依賴人腦決策和手工操作的IT 運維向著AIOps智能運維的方向快速前進泽西。特別是當機器學習算法與基于大數(shù)據(jù)的業(yè)務運維管理平臺整合曹铃,在告警過濾、異常監(jiān)測捧杉、自動修復等環(huán)節(jié)發(fā)揮效用陕见,就能把CIO和IT部門從繁復耗時、容易出錯的基礎運維工作中徹底解放出來味抖,專注于更有價值的業(yè)務運維评甜。
過去需要花費數(shù)個小時、數(shù)天甚至數(shù)周才能完成的故障診斷和修復工作仔涩,AIOps智能運維平臺可能只需要幾秒鐘就能搞定忍坷,而且更加精準、更少誤判熔脂。AIOps的問世不僅得益于人工智能技術(shù)的發(fā)展佩研,同時也是企業(yè)數(shù)字化轉(zhuǎn)型的必然結(jié)果,企業(yè)的數(shù)字化程度越高霞揉,IT規(guī)模越大也越復雜旬薯,就越需要快捷、高效适秩、精準的運維管理平臺作為業(yè)務的有效支撐绊序。
AIOps的來歷
對于傳統(tǒng)企業(yè)來說硕舆,AIOps并不是一個全新的理念,而是IT運營分析和管理(ITOA/ITOM)體系與大數(shù)據(jù)和人工智能技術(shù)結(jié)合的產(chǎn)物骤公。AIOps智能運維以ITOA/ITOM系統(tǒng)所采集的運維大數(shù)據(jù)為基礎抚官,利用人工智能和機器學習算法對運維數(shù)據(jù)進行深入分析,涵蓋IT監(jiān)控淋样,應用性能管理耗式、外網(wǎng)監(jiān)控、日志分析趁猴,系統(tǒng)安全等方面刊咳。
市面上流行的傳統(tǒng)運維管理平臺,其核心組件缺少大數(shù)據(jù)采集儡司、分析和本地機器學習的能力娱挨,需要業(yè)務運維和AIOps平臺予以完善。AIOps智能運維平臺能夠接入不同業(yè)務系統(tǒng)捕犬、監(jiān)控系統(tǒng)跷坝、管理系統(tǒng)的海量IT數(shù)據(jù),并運用各種算法進行高速分析碉碉、學習甚至預測柴钻。立足于AIOps,IT部門可以獲得強大的自動化IT決策和運營管理能力垢粮,并能對業(yè)務質(zhì)量和用戶體驗進行準確檢測和持續(xù)優(yōu)化贴届。
AIOps的價值
“AIOps正在廣泛應用于IT大數(shù)據(jù)和業(yè)務大數(shù)據(jù)分析領(lǐng)域,為企業(yè)提供極具價值的業(yè)務洞察能力”蜡吧。據(jù)Gartner分析師最新預測毫蚓,到了2022年,部署AIOps平臺的大型企業(yè)數(shù)量將從如今的不足5%昔善,迅速提升到40%左右元潘,而這些企業(yè)會把AIOps用于業(yè)務運營和IT運維,以取代如今的運維監(jiān)控君仆、管理工具和自動化運維產(chǎn)品翩概。
當企業(yè)的數(shù)字化程度越來越高, IT系統(tǒng)的復雜度和規(guī)模越來越大返咱,擺在CIO面前的這道雙選題:是不斷增加業(yè)務流程钥庇?還是采用AIO平臺?似乎不難抉擇洛姑!
AIOps的組成結(jié)構(gòu)
Gartner定義的AIOps平臺擁有11項能力上沐,包括歷史數(shù)據(jù)管理(Historical data management)、流數(shù)據(jù)管理(Streaming data management)楞艾、日志數(shù)據(jù)提炔瘟(Log data ingestion)龄广、網(wǎng)絡數(shù)據(jù)提取(Wire data ingestion)蕴侧、算法數(shù)據(jù)提仍裢(Metric data ingestion)、文本和NLP文檔提染幌(Document text ingestion)敲才、自動化模型的發(fā)現(xiàn)和預測(Automated pattern discovery and prediction)、異常檢測(Anomaly detection)择葡、根因分析(Root cause determination)紧武、按需交付(On-premises delivery)和軟件服務交付(Software as a service)等。
云智慧智能業(yè)務運維大數(shù)據(jù)平臺敏储,將前9項能力分別納入數(shù)據(jù)接入層阻星、大數(shù)據(jù)管理層、大數(shù)據(jù)分析層已添、應用模塊層和可視化展現(xiàn)層這五層邏輯架構(gòu)中妥箕,便于企業(yè)和CIO們更好的理解和落地AIOps理念和相關(guān)解決方案。
數(shù)據(jù)接入層:通過開放的API接口更舞,廣泛接入企業(yè)IT系統(tǒng)的歷史數(shù)據(jù)畦幢、流數(shù)據(jù)、日志數(shù)據(jù)缆蝉、網(wǎng)絡數(shù)據(jù)宇葱、算法數(shù)據(jù)、文本和NLP文檔數(shù)據(jù)返奉,以及APP數(shù)據(jù)贝搁、瀏覽器數(shù)據(jù)吗氏、業(yè)務系統(tǒng)運營指標數(shù)據(jù)等不同數(shù)據(jù)源的數(shù)據(jù)芽偏。
大數(shù)據(jù)管理層:對業(yè)務系統(tǒng)和IT支撐系統(tǒng)產(chǎn)生的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進行統(tǒng)一、高效的存儲弦讽、管理和調(diào)度污尉。
大數(shù)據(jù)分析層:聚合數(shù)據(jù)建模、大數(shù)據(jù)分析能力往产,實現(xiàn)業(yè)務和IT數(shù)據(jù)的關(guān)聯(lián)分析被碗,通過人工智能對業(yè)務波動、故障判斷仿村、修復操作等依靠人力決策的環(huán)節(jié)進行持續(xù)學習和自動化響應锐朴。
應用模塊層:針對基礎設施、應用和業(yè)務系統(tǒng)之間的邏輯拓撲蔼囊,提供覆蓋全部技術(shù)棧的基礎設施監(jiān)控焚志、應用性能管理衣迷、業(yè)務決策分析以及異常檢測、根因分析和統(tǒng)一告警服務酱酬。
可視化展現(xiàn)層:以可視化大屏或頁面的形式實時展現(xiàn)業(yè)務系統(tǒng)運行狀態(tài)壶谒、IT資源利用率等智能運維的關(guān)鍵指標,第一時間發(fā)現(xiàn)IT對業(yè)務的影響膳沽,輔助商業(yè)決策汗菜。
AIOps是IT走向運營的點金手
未來幾年,數(shù)字化系統(tǒng)的運行效能對企業(yè)核心競爭力的影響越來越大挑社,CIO所領(lǐng)導的IT部門在運營中所扮演的角色也越來越重要陨界。然而,隨著系統(tǒng)規(guī)模和復雜度呈指數(shù)級增長痛阻, IT人員解決問題的能力不會有太大的變化普碎。要讓IT擺脫傳統(tǒng)運維工作的束縛,就需要運用AIOps智能運維平臺來有效承擔基礎運維的種種責任录平。
在AIOps的幫助之下麻车,IT人員可以從繁瑣的常規(guī)工作中得到徹底的釋放,專注于對企業(yè)發(fā)展更有價值的工作 – 業(yè)務和用戶體驗斗这,讓IT真正走向運營动猬。