目前項(xiàng)目在從單體進(jìn)化到了分布式架構(gòu)以后风瘦,一個服務(wù)就會以多個副本的形式運(yùn)行在不同的主機(jī)上队魏,這樣帶來了性能和體驗(yàn)提升的同時,也為我們的開發(fā)運(yùn)維同學(xué)帶了一些痛點(diǎn):
- 故障或者業(yè)務(wù)層面的異常出現(xiàn)万搔,如何快速發(fā)現(xiàn)和定位問題胡桨?
- 服務(wù)之間相互依賴太多,如何判斷一個點(diǎn)的問題對其他依賴服務(wù)的影響范圍瞬雹?
- 如何在宏觀角度上梳理各個服務(wù)之間的依賴及合理性昧谊?同時對拓?fù)滏溌沸阅艿膯栴}進(jìn)行分析和解決?
面對這一系列的難題酗捌,學(xué)術(shù)界是給出了一個 OpenTracing 規(guī)范呢诬,它是一個輕量級的標(biāo)準(zhǔn)化層,它位于應(yīng)用程序/類庫和追蹤或日志分析程序之間胖缤,詳細(xì)介紹見 opentracing文檔中文版尚镰。隨著并發(fā)和異步成為現(xiàn)代軟件應(yīng)用的必然特性,分布式追蹤系統(tǒng)成為有效監(jiān)控的一個必須的組成部分哪廓。當(dāng)然在落地的工業(yè)界內(nèi)對此項(xiàng)技術(shù)還有一個別稱:APM(Application Performance Management-應(yīng)用性有管理)狗唉,APM致力于監(jiān)控和管理應(yīng)用軟件性能和可用性。通過監(jiān)測和診斷復(fù)雜應(yīng)用程序的性能問題撩独,來保證軟件應(yīng)用程序的良好運(yùn)行
對此敞曹,目前真正去落到實(shí)踐應(yīng)用账月,主要有主流的4種開源解決方案:
一、CAT
github地址:https://github.com/dianping/cat
大眾點(diǎn)評開源貢獻(xiàn)澳迫,基于Java開發(fā)的實(shí)時應(yīng)用監(jiān)控平臺局齿,包括實(shí)時應(yīng)用監(jiān)控,業(yè)務(wù)監(jiān)控 橄登。 集成方案是通過代碼埋點(diǎn)的方式來實(shí)現(xiàn)監(jiān)控抓歼,比如: 攔截器,注解拢锹,過濾器等谣妻。這樣做有利有弊,好處是可以在自己需要的地方加埋點(diǎn)卒稳,比較有針對性蹋半;壞處是必須改動現(xiàn)有系統(tǒng),很多開發(fā)團(tuán)隊(duì)不愿意充坑,侵入性較強(qiáng)减江,集成成本較高,風(fēng)險較大捻爷。
二辈灼、ZipKin
官網(wǎng):http://zipkin.io/
github地址:https://github.com/openzipkin/zipkin
由Twitter團(tuán)隊(duì)開源, Zipkin是一個分布式的跟蹤系統(tǒng)也榄。Zipkin的java應(yīng)用端是通過一個叫Brave的組件來實(shí)現(xiàn)對應(yīng)用內(nèi)部的性能分析數(shù)據(jù)采集巡莹。這個組件通過實(shí)現(xiàn)一系列的java攔截器,來做到對http/servlet請求甜紫、數(shù)據(jù)庫訪問的調(diào)用過程跟蹤,然后通過在spring之類的配置文件里加入這些攔截器降宅,完成對java應(yīng)用的性能數(shù)據(jù)采集。
三棵介、PinPoint
github地址:https://github.com/naver/pinpoint
由韓國團(tuán)隊(duì)naver團(tuán)隊(duì)開源钉鸯,針對大規(guī)模分布式系統(tǒng)用鏈路監(jiān)控,使用java寫的工具邮辽。靈感來自短小精悍,幫助分析系統(tǒng)的總體結(jié)構(gòu)和內(nèi)部組件如何被調(diào)用在分布式應(yīng)用提供了一個很好的解決方案贸营。使用java探針字節(jié)碼增加技術(shù)吨述,實(shí)現(xiàn)對整個應(yīng)用的監(jiān)控 ,對應(yīng)用零侵入钞脂。
四揣云、SkyWalking
github地址:https://github.com/apache/skywalking
2015年由個人吳晟(華為開發(fā)者)開源 , 2017年加入Apache孵化器冰啃。針對分布式系統(tǒng)的應(yīng)用性能監(jiān)控系統(tǒng)邓夕,特別針對微服務(wù)刘莹、cloud native和容器化(Docker, Kubernetes, Mesos)架構(gòu), 其核心是個分布式追蹤系統(tǒng)焚刚。使用java探針字節(jié)碼增加技術(shù)点弯,實(shí)現(xiàn)對整個應(yīng)用的監(jiān)控 。 對應(yīng)用零侵入矿咕!
五抢肛、Open-Falcon
github地址:https://github.com/open-falcon/falcon-plus
小米開源的監(jiān)控系統(tǒng),文檔資料齊全碳柱,針對性監(jiān)控Mysql捡絮、Redis、MQ莲镣、Solr福稳、及硬件監(jiān)控,功能局限性較大瑞侮,監(jiān)控應(yīng)用內(nèi)部性能比較麻煩灵寺,無法查詢異常日志,不支持搜索
參考引用:
1区岗、分布式鏈路追蹤系統(tǒng)深入理解
2略板、分布式鏈路追蹤技術(shù)對比
3、分布式鏈路追蹤技術(shù)對比
猿碼道的專欄文章:
4慈缔、全鏈路監(jiān)控(一):方案概述與比較
5叮称、基于Java Instrument的Agent實(shí)現(xiàn)
6、JVMTI Agent 工作原理及核心源碼分析
7藐鹤、JVMTI Attach機(jī)制與核心源碼分析
8瓤檐、墨竹博主的專欄對Zipkin以及Brave有許多的講述。
Java分布式跟蹤系統(tǒng)Zipkin:初識Zipkin