三分鐘帶你搞懂分布式鏈路追蹤系統原理

分布式系統為什么需要鏈路追蹤颊艳?

隨著互聯網業(yè)務快速擴展茅特,軟件架構也日益變得復雜,為了適應海量用戶高并發(fā)請求棋枕,系統中越來越多的組件開始走向分布式化白修,如單體架構拆分為微服務、服務內緩存變?yōu)榉植际骄彺娼溆啤⒎战M件通信變?yōu)榉植际较揪#@些組件共同構成了繁雜的分布式網絡。

假如現在有一個系統部署了成千上萬個服務,用戶通過瀏覽器在主界面上下單一箱茅臺酒卤恳,結果系統給用戶提示:系統內部錯誤累盗,相信用戶是很崩潰的。

運營人員將問題拋給開發(fā)人員定位突琳,開發(fā)人員只知道有異常若债,但是這個異常具體是由哪個微服務引起的就需要逐個服務排查了。

開發(fā)人員借助日志逐個排查的效率是非常低的拆融,那有沒有更好的解決方案了蠢琳?

答案是引入鏈路追蹤系統

什么是鏈路追蹤镜豹?

分布式鏈路追蹤就是將一次分布式請求還原成調用鏈路傲须,將一次分布式請求的調用情況集中展示,比如各個服務節(jié)點上的耗時趟脂、請求具體到達哪臺機器上泰讽、每個服務節(jié)點的請求狀態(tài)等等。

鏈路跟蹤主要功能:

  • 故障快速定位:可以通過調用鏈結合業(yè)務日志快速定位錯誤信息昔期。
  • 鏈路性能可視化:各個階段鏈路耗時已卸、服務依賴關系可以通過可視化界面展現出來。
  • 鏈路分析:通過分析鏈路耗時硼一、服務依賴關系可以得到用戶的行為路徑累澡,匯總分析應用在很多業(yè)務場景。

鏈路追蹤基本原理

鏈路追蹤系統(可能)最早是由Goggle公開發(fā)布的一篇論文

《Dapper, a Large-Scale Distributed Systems Tracing Infrastructure》

被大家廣泛熟悉般贼,所以各位技術大牛們如果有黑武器不要藏起來趕緊去發(fā)表論文吧愧哟。

在這篇著名的論文中主要講述了Dapper鏈路追蹤系統的基本原理和關鍵技術點。接下來挑幾個重點的技術點詳細給大家介紹一下哼蛆。

Trace

Trace的含義比較直觀翅雏,就是鏈路,指一個請求經過所有服務的路徑人芽,可以用下面樹狀的圖形表示。

圖中一條完整的鏈路是:chrome -> 服務A -> 服務B -> 服務C -> 服務D -> 服務E -> 服務C -> 服務A -> chrome绩脆。服務間經過的局部鏈路構成了一條完整的鏈路萤厅,其中每一條局部鏈路都用一個全局唯一的traceid來標識。

Span

在上圖中可以看出來請求經過了服務A靴迫,同時服務A又調用了服務B和服務C惕味,但是先調的服務B還是服務C呢?從圖中很難看出來玉锌,只有通過查看源碼才知道順序名挥。

為了表達這種父子關系引入了Span的概念。

同一層級parent id相同主守,span id不同禀倔,span id從小到大表示請求的順序榄融,從下圖中可以很明顯看出服務A是先調了服務B然后再調用了C。

上下層級代表調用關系救湖,如下圖服務C的span id為2愧杯,服務D的parent id為2,這就表示服務C和服務D形成了父子關系鞋既,很明顯是服務C調用了服務D力九。

總結:通過事先在日志中埋點,找出相同traceId的日志邑闺,再加上parent id和span id就可以將一條完整的請求調用鏈串聯起來跌前。

Annotations

Dapper中還定義了annotation的概念,用于用戶自定義事件陡舅,用來輔助定位問題抵乓。

通****常****包含四個注解信息

cs:Client Start,表示客戶端發(fā)起請求蹭沛;

sr:ServerReceived臂寝,表示服務端收到請求;

ss:Server Send摊灭,表示服務端完成處理咆贬,并將結果發(fā)送給客戶端;

cr:ClientReceived帚呼,表示客戶端獲取到服務端返回信息掏缎;

上圖中描述了一次請求和響應的過程,四個點也就是對應四個Annotation事件煤杀。

如下面的圖表示從客戶端調用服務端的一次完整過程眷蜈。如果要計算一次調用的耗時,只需要將客戶端接收的時間點減去客戶端開始的時間點沈自,也就是圖中時間線上的T4 - T1酌儒。如果要計算客戶端發(fā)送網絡耗時,也就是圖中時間線上的T2 - T1枯途,其他類似可計算忌怎。

帶內數據與帶外數據

鏈路信息的還原依賴于帶內帶外兩種數據。

帶外數據是各個節(jié)點產生的事件酪夷,如cs榴啸,ss,這些數據可以由節(jié)點獨立生成晚岭,并且需要集中上報到存儲端鸥印。通過帶外數據,可以在存儲端分析更多鏈路的細節(jié)。

帶內數據如traceid,spanid,parentid库说,用來標識trace狂鞋,span,以及span在一個trace中的位置璃弄,這些數據需要從鏈路的起點一直傳遞到終點要销。通過帶內數據的傳遞,可以將一個鏈路的所有過程串起來夏块。

采樣

由于每一個請求都會生成一個鏈路疏咐,為了減少性能消耗,避免存儲資源的浪費脐供,dapper并不會上報所有的span數據浑塞,而是使用采樣的方式。舉個例子政己,每秒有1000個請求訪問系統酌壕,如果設置采樣率為1/1000,那么只會上報一個請求到存儲端歇由。

通過采集端自適應地調整采樣率卵牍,控制span上報的數量,可以在發(fā)現性能瓶頸的同時沦泌,有效減少性能損耗糊昙。

存儲

鏈路中的span數據經過收集和上報后會集中存儲在一個地方,Dapper使用了BigTable數據倉庫谢谦,常用的存儲還有ElasticSearch, HBase, In-memory DB等释牺。

業(yè)界常用鏈路追蹤系統

Google Dapper論文發(fā)出來之后,很多公司基于鏈路追蹤的基本原理給出了各自的解決方案回挽,如Twitter的Zipkin没咙,Uber的Jaeger,pinpoint千劈,Apache開源的skywalking祭刚,還有國產如阿里的鷹眼,美團的Mtrace墙牌,滴滴Trace袁梗,新浪的Watchman,京東的Hydra憔古,不過國內的這些基本都沒有開源。

為了便于各系統間能彼此兼容互通淋袖,OpenTracing組織制定了一系列標準鸿市,旨在讓各系統提供統一的接口。

下面對比一下幾個開源組件,方便日后大家做技術選型焰情。

附各大開源組件的地址:

接下來介紹一下Zipkin基本實現陌凳。

分布式鏈路追蹤系統Zipkin實現

Zipkin 是 Twitter 的一個開源項目,它基于 Google Dapper 實現内舟,它致力于收集服務的定時數據合敦,以解決微服務架構中的延遲問題,包括數據的收集验游、存儲充岛、查找和展現。

Zipkin基本架構

在服務運行的過程中會產生很多鏈路信息耕蝉,產生數據的地方可以稱之為Reporter崔梗。將鏈路信息通過多種傳輸方式如HTTP,RPC垒在,kafka消息隊列等發(fā)送到Zipkin的采集器蒜魄,Zipkin處理后最終將鏈路信息保存到存儲器中。運維人員通過UI界面調用接口即可查詢調用鏈信息场躯。

Zipkin核心組件

Zipkin有四大核心組件

(1)Collector

一旦Collector采集線程獲取到鏈路追蹤數據谈为,Zipkin就會對其進行驗證、存儲和索引踢关,并調用存儲接口保存數據伞鲫,以便進行查找。

(2)Storage

Zipkin Storage最初是為了在Cassandra上存儲數據而構建的耘成,因為Cassandra是可伸縮的榔昔,具有靈活的模式,并且在Twitter中大量使用瘪菌。除了Cassandra撒会,還支持支持ElasticSearch和MySQL存儲,后續(xù)可能會提供第三方擴展师妙。

(3)Query Service

鏈路追蹤數據被存儲和索引之后诵肛,webui 可以調用query service查詢任意數據幫助運維人員快速定位線上問題。query service提供了簡單的json api來查找和檢索數據默穴。

(4)Web UI

Zipkin 提供了基本查詢怔檩、搜索的web界面,運維人員可以根據具體的調用鏈信息快速識別線上問題蓄诽。

總結

  1. 分布式鏈路追蹤就是將每一次分布式請求還原成調用鏈路薛训。
  2. 鏈路追蹤的核心概念:Trace、Span仑氛、Annotation乙埃、帶內和帶外數據闸英、采樣、存儲介袜。
  3. 業(yè)界常用的開源組件都是基于谷歌Dapper論文演變而來甫何;
  4. Zipkin核心組件有:Collector太抓、Storage奏夫、Query Service髓需、Web UI朴沿。

為什么阿里巴巴的程序員成長速度這么快僧须?

霸榜GitHub的Offer來了原理篇+框架篇杯矩,開放分享拍柒;

50W年薪程序員需要的技術棧分析

看完三件事??

如果你覺得這篇內容對你還蠻有幫助南用,我想邀請你幫我三個小忙:

點贊跳芳,轉發(fā)芍锦,有你們的 『點贊和評論』,才是我創(chuàng)造的動力飞盆。

關注公眾號 『 Java斗帝 』娄琉,不定期分享原創(chuàng)知識。

同時可以期待后續(xù)文章ing??

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末吓歇,一起剝皮案震驚了整個濱河市孽水,隨后出現的幾起案子,更是在濱河造成了極大的恐慌城看,老刑警劉巖女气,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異测柠,居然都是意外死亡炼鞠,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門轰胁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來谒主,“玉大人,你說我怎么就攤上這事赃阀■希” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵榛斯,是天一觀的道長观游。 經常有香客問我,道長驮俗,這世上最難降的妖魔是什么懂缕? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮王凑,結果婚禮上提佣,老公的妹妹穿的比我還像新娘吮蛹。我一直安慰自己,他們只是感情好拌屏,可當我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著术荤,像睡著了一般倚喂。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上瓣戚,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天端圈,我揣著相機與錄音,去河邊找鬼子库。 笑死舱权,一個胖子當著我的面吹牛,可吹牛的內容都是我干的仑嗅。 我是一名探鬼主播宴倍,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼仓技!你這毒婦竟也來了鸵贬?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤脖捻,失蹤者是張志新(化名)和其女友劉穎阔逼,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體地沮,經...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡嗜浮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了摩疑。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片危融。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖未荒,靈堂內的尸體忽然破棺而出专挪,到底是詐尸還是另有隱情,我是刑警寧澤片排,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布寨腔,位于F島的核電站,受9級特大地震影響率寡,放射性物質發(fā)生泄漏迫卢。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一冶共、第九天 我趴在偏房一處隱蔽的房頂上張望乾蛤。 院中可真熱鬧每界,春花似錦、人聲如沸家卖。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽上荡。三九已至趴樱,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間酪捡,已是汗流浹背叁征。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留逛薇,地道東北人捺疼。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像永罚,于是被迫代替她去往敵國和親啤呼。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內容