Skywalking是由國(guó)內(nèi)開(kāi)源愛(ài)好者吳晟(原OneAPM工程師,目前在華為)開(kāi)源并提交到Apache孵化器的產(chǎn)品仿村,它同時(shí)吸收了Zipkin/Pinpoint/CAT的設(shè)計(jì)思路冻辩,支持非侵入式埋點(diǎn)舀锨。是一款基于分布式跟蹤的應(yīng)用程序性能監(jiān)控系統(tǒng)。另外社區(qū)還發(fā)展出了一個(gè)叫OpenTracing的組織更哄,旨在推進(jìn)調(diào)用鏈監(jiān)控的一些規(guī)范和標(biāo)準(zhǔn)工作。
OpenTracing
近年各種調(diào)用鏈監(jiān)控產(chǎn)品層出不窮,呈現(xiàn)百花齊放的態(tài)勢(shì)洪鸭,為了避免碎片化,促進(jìn)互操作性仑扑,社區(qū)誕生了一個(gè)叫做OpenTracing的標(biāo)準(zhǔn)化組織览爵。
如上圖所示:OpenTracing旨在標(biāo)準(zhǔn)化Trace數(shù)據(jù)結(jié)構(gòu)和格式,其目的是:
不同語(yǔ)言開(kāi)發(fā)的Trace客戶端的互操作性镇饮,Java/.Net/PHP/Python/NodeJs等語(yǔ)言開(kāi)發(fā)的客戶端蜓竹,只要遵循OpenTracing標(biāo)準(zhǔn),就都可以對(duì)接OpenTracing兼容的監(jiān)控后端储藐。
Tracing監(jiān)控后端的互操作性俱济,只要遵循OpenTracing標(biāo)準(zhǔn),企業(yè)可以根據(jù)需要替換具體的Tracing監(jiān)控后端產(chǎn)品钙勃,比如從Zipkin替換成Jaeger/CAT/Skywalking等后端蛛碌。
OpenTracing初衷和方向是好的,但是目前還不明朗辖源,不少調(diào)用鏈監(jiān)控產(chǎn)品并未明確支持OpenTracning標(biāo)準(zhǔn)蔚携。對(duì)其后續(xù)走勢(shì)我們可以持續(xù)關(guān)注希太。
在構(gòu)建監(jiān)控系統(tǒng)時(shí),大家往往在Metrics,Tracing和Logging幾個(gè)名詞和方式之間糾結(jié)浮梢。 總體說(shuō)來(lái)跛十,我們是在一些通用的名詞間糾結(jié)★跸酰可以通過(guò)圖表來(lái)定義監(jiān)控的作用域芥映,使各名詞的作用范圍更明確。比如通過(guò)維恩圖(Venn diagram)來(lái)描述Metrics, tracing, logging三個(gè)概念的定義:
Metric的特點(diǎn)是远豺,它是可累加的:他們具有原子性奈偏,每個(gè)都是一個(gè)邏輯計(jì)量單元,或者一個(gè)時(shí)間段內(nèi)的柱狀圖躯护。 例如:隊(duì)列的當(dāng)前深度可以被定義為一個(gè)計(jì)量單元惊来,在寫(xiě)入或讀取時(shí)被更新統(tǒng)計(jì); 輸入HTTP請(qǐng)求的數(shù)量可以被定義為一個(gè)計(jì)數(shù)器棺滞,用于簡(jiǎn)單累加裁蚁; 請(qǐng)求的執(zhí)行時(shí)間可以被定義為一個(gè)柱狀圖,在指定時(shí)間片上更新和統(tǒng)計(jì)匯總继准。
Logging的特點(diǎn)是枉证,它描述一些離散的(不連續(xù)的)事件。 例如:應(yīng)用通過(guò)一個(gè)滾動(dòng)的文件輸出debug或error信息移必,并通過(guò)日志收集系統(tǒng)室谚,存儲(chǔ)到Elasticsearch中; 審批明細(xì)信息通過(guò)Kafka崔泵,存儲(chǔ)到數(shù)據(jù)庫(kù)(BigTable)中秒赤; 又或者,特定請(qǐng)求的元數(shù)據(jù)信息憎瘸,從服務(wù)請(qǐng)求中剝離出來(lái)入篮,發(fā)送給一個(gè)異常收集服務(wù),如NewRelic幌甘。
Tracing的最大特點(diǎn)就是潮售,它在單次請(qǐng)求的范圍內(nèi),處理信息含潘。 任何的數(shù)據(jù)饲做、元數(shù)據(jù)信息都被綁定到系統(tǒng)中的單個(gè)事務(wù)上线婚。 例如:一次調(diào)用遠(yuǎn)程服務(wù)的RPC執(zhí)行過(guò)程遏弱;一次實(shí)際的SQL查詢語(yǔ)句;一次HTTP請(qǐng)求的業(yè)務(wù)性ID塞弊。
在OpenTracing中漱逸,有幾個(gè)基本概念我們需要提前了解清楚:
1泪姨、Trace(追蹤):
在廣義上,一個(gè)trace代表了一個(gè)事務(wù)或者流程在(分布式)系統(tǒng)中的執(zhí)行過(guò)程饰抒。在OpenTracing標(biāo)準(zhǔn)中肮砾,trace是多個(gè)span組成的一個(gè)有向無(wú)環(huán)圖(DAG),每一個(gè)span代表trace中被命名并計(jì)時(shí)的連續(xù)性的執(zhí)行片段袋坑。
2仗处、Span(跨度):一個(gè)span代表系統(tǒng)中具有開(kāi)始時(shí)間和執(zhí)行時(shí)長(zhǎng)的邏輯運(yùn)行單元。span之間通過(guò)嵌套或者順序排列建立邏輯因果關(guān)系枣宫。
3婆誓、Logs:每個(gè)span可以進(jìn)行多次Logs操作,每一次Logs操作也颤,都需要一個(gè)帶時(shí)間戳的時(shí)間名稱洋幻,以及可選的任意大小的存儲(chǔ)結(jié)構(gòu)。
4翅娶、Tags:每個(gè)span可以有多個(gè)鍵值對(duì)(key:value)形式的Tags文留,Tags是沒(méi)有時(shí)間戳的,支持簡(jiǎn)單的對(duì)span進(jìn)行注解和補(bǔ)充竭沫。
其中單個(gè)Trace和各個(gè)Span之間的關(guān)系:
一個(gè)span可以和一個(gè)或者多個(gè)span間存在因果關(guān)系燥翅。OpenTracing定義了兩種關(guān)系:ChildOf 和 FollowsFrom。這兩種引用類(lèi)型代表了子節(jié)點(diǎn)和父節(jié)點(diǎn)間的直接因果關(guān)系输吏。
Skywalking可以理解為實(shí)現(xiàn)了OpenTracing規(guī)范权旷,同時(shí)提供了更加現(xiàn)代化、酷炫的UI贯溅,供人們可以對(duì)應(yīng)用更加的直觀的監(jiān)控拄氯。
接下來(lái),我們將結(jié)合Skywalking的界面來(lái)了解如何查看單個(gè)Trace:
首先它浅,在Skywalking中译柏,官方針對(duì)Java應(yīng)用封裝了一個(gè)Segment概念,實(shí)質(zhì)上就是Span數(shù)組的封裝姐霍,為的是更好的表示Java中跨線程間的調(diào)用(后續(xù)文章將會(huì)詳細(xì)講到)鄙麦,因此,在Skywalking里面镊折,一次完整的追蹤所包含的數(shù)據(jù)結(jié)構(gòu)應(yīng)該是:
- Trace = Segment1 + Segment2 + ...... + SegmentN
- 其中每個(gè)Segment所包含的數(shù)據(jù):Segment = Span1 + Span2 + ...... + SpanN
通過(guò)一張官方的截圖來(lái)講解:
圖中藍(lán)色部分是一個(gè)進(jìn)程調(diào)用胯府,代表的是Kafka/test-trace-topic/Consumer這個(gè)服務(wù)為調(diào)用入口,緊隨著下面的白色長(zhǎng)塊則代表跨進(jìn)程或跨線程的調(diào)用塊恨胚,點(diǎn)擊進(jìn)去并通過(guò)瀏覽器查看返回的數(shù)據(jù):
我們可以看到右側(cè)有一組spans數(shù)組骂因,數(shù)組中每一組數(shù)據(jù)中都帶有traceId,segmentId,parentSegmentId,refs數(shù)組,spanId,parentSpanId,type等數(shù)據(jù)。Skywalking界面上那些層級(jí)關(guān)聯(lián)關(guān)系就是根據(jù)這些數(shù)據(jù)來(lái)進(jìn)行展示的赃泡,比如:
在同一個(gè)Segment中寒波,spanId最頂層數(shù)值為-1乘盼,默認(rèn)從0開(kāi)始自增,依次代表層級(jí)俄烁。即Span與Span時(shí)間通過(guò)parentSpanId表示關(guān)系绸栅。Segment與Segment之間通過(guò)refs數(shù)組中的parentSegmentId表示關(guān)系
好了,其實(shí)最后一段才是我想表達(dá)的東西页屠,順帶將整個(gè)東西理清楚記錄一下粹胯,使用過(guò)程中碰到的問(wèn)題會(huì)陸續(xù)記錄到這里。
文章轉(zhuǎn)自:https://zhuanlan.zhihu.com/p/41252484
如有侵權(quán)辰企,將第一時(shí)間刪除文章內(nèi)容矛双。
關(guān)注公眾號(hào)【OSC DevOps】閱讀更多精彩文章。