下面內容來自通信人工智能賦能自智網絡白皮書。
隨著移動通信網絡發(fā)展搅轿,2/3/4/5G 無線網、傳輸網與核心網等網絡設備現(xiàn)網運行中產生大量告警信息大猛,需要投入大量人力進行處理务蝠。AI 技術可以通過對大量歷史數(shù)據(jù)進行挖掘、分析和學習渔呵,并結合虛擬網元間的網絡拓撲及虛擬化層間的拓撲情況,訓練得出 RCA 規(guī)則砍鸠。系統(tǒng)根據(jù) RCA 規(guī)則對實時告警分析即可獲取根因告警扩氢。
為了解決上述問題,按照工作流五步法將高等級自智網絡告警監(jiān)控工作任務
分解如下:
故障管理系統(tǒng)應支持多維規(guī)則的可視化管理和應用
? 支持標準化規(guī)則:根據(jù)各個廠家的各個專業(yè)的告警梳理表為基礎數(shù)據(jù)爷辱,應用規(guī)則把原始告警標準化后入庫录豺,以便統(tǒng)一管理和監(jiān)控。
? 支持關聯(lián)規(guī)則:AI 技術挖掘的告警主次關聯(lián)規(guī)則為主饭弓,人工設置的關聯(lián)規(guī)則為補充双饥,形成關聯(lián)規(guī)則庫,采集到的告警實時匹配規(guī)則弟断,實時關聯(lián)壓縮告警咏花,輸出根因主告警,節(jié)省運維成本夫嗓。
? 支持衍生規(guī)則:根據(jù)運維經驗設置一個可以由一個工單處理的告警集群特征描述迟螺,比如高頻告警冲秽,在一段時間內只需要派發(fā)一個工單處理即可舍咖。
? 支持預處理規(guī)則:根據(jù)運維經驗設置故障預處理規(guī)則矩父,嘗試在人工處理故障前,以維護指令集為動作主體解決故障排霉。
? 支持派單規(guī)則:根據(jù)運維經驗設置以主告警為主體的工單派發(fā)規(guī)則窍株,以便及時解決故障。
? 支持工程屏蔽規(guī)則:比如設備升級造成的告警不做處理攻柠。
涉及到的核心 AI 技術和算法
在告警監(jiān)控場景中球订,面對海量告警數(shù)據(jù)挖掘告警相關性的技術稱為告警根因 分析(RCA)。根據(jù)應用場景的不同瑰钮,告警根因分析算法可分為有網絡拓撲的告警根因分析算法和無網絡拓撲的告警根因分析算法兩種冒滩。人工智能關聯(lián)挖掘算法通常用來解決告警根因分析問題,經典算法包括:Apriori 算法浪谴、Eclat 算法开睡、FP算法等。告警根因分析的基本處理流程可分為四個主要步驟:
1) 針對歷史告警數(shù)據(jù)進行特征工程苟耻,獲取算法所需的告警關鍵特征和網元 間拓撲關系(可選)篇恒。
2) 根據(jù)不同告警間的時間相關性和空間相關性(可選)分析,挖掘告警二元 相關項凶杖,告警間主次規(guī)則胁艰。
3) 對于全部告警主次規(guī)則的支持度、置信度智蝠、提升度進行統(tǒng)計分析腾么,生成主 從告警關聯(lián)規(guī)則庫。
4) 結合告警關聯(lián)規(guī)則庫和網絡拓撲關系(可選)構建故障傳播圖杈湾,并通過計 算最大樹形圖進而定位故障的根因哮翘。
告警根因分析技術能夠實現(xiàn)自動發(fā)現(xiàn)潛在的告警主從關系,生成告警關系規(guī)則庫毛秘,快速定位根因告警并支撐告警收斂和壓縮饭寺,緩解告警風暴,提高派單準確率叫挟。