源自《服務(wù)化架構(gòu)系統(tǒng)監(jiān)控難題解決方案》竣稽,文章偏技術(shù)一些长踊,InfoQ出品文章都比較耐看功舀,有興趣可以詳讀。
OPPO后端系統(tǒng)規(guī)模近幾年快速發(fā)展身弊,系統(tǒng)重構(gòu)以后采用了服務(wù)化的架構(gòu)辟汰,各系統(tǒng)之間耦合降低,開發(fā)效率得到了很大的提升阱佛。然而在服務(wù)化帶來了好處的同時帖汞,難于監(jiān)控的問題也一并出現(xiàn)。由于服務(wù)之間調(diào)用關(guān)系錯綜復(fù)雜凑术,接口出現(xiàn)問題翩蘸,多個系統(tǒng)報錯,因此很難定位真正的故障源頭淮逊。整個請求調(diào)用鏈就像一個黑盒子催首,無法跟蹤請求的整個調(diào)用路徑,發(fā)現(xiàn)性能瓶頸點壮莹。
從OPPO的自主研發(fā)監(jiān)控系統(tǒng)的實踐案例來看翅帜,一切應(yīng)當(dāng)從業(yè)務(wù)需求出發(fā)姻檀,目的是解決業(yè)務(wù)遇到的問題命满。面對開源軟件的選擇,要有所“為”绣版,有所“不為”胶台。業(yè)界有很多成熟的開源軟件歼疮,也有一些比較大膽的設(shè)計思想可供借鑒,但開源軟件并不是拿過來就能用好這么簡單的诈唬,選擇的原則可“管”可“控”韩脏。一個開源軟件,如果不能“掌控”铸磅,不夠簡單赡矢,那就不如不用,自己用土辦法也許反而會更好阅仔。