三分鐘帶你搞懂分布式鏈路追蹤系統原理

分布式系統為什么需要鏈路追蹤颊艳？

隨著互聯網業(yè)務快速擴展茅特，軟件架構也日益變得復雜，為了適應海量用戶高并發(fā)請求棋枕，系統中越來越多的組件開始走向分布式化白修，如單體架構拆分為微服務、服務內緩存變?yōu)榉植际骄彺娼溆啤⒎战M件通信變?yōu)榉植际较揪＃@些組件共同構成了繁雜的分布式網絡。

假如現在有一個系統部署了成千上萬個服務，用戶通過瀏覽器在主界面上下單一箱茅臺酒卤恳，結果系統給用戶提示：系統內部錯誤累盗，相信用戶是很崩潰的。

運營人員將問題拋給開發(fā)人員定位突琳，開發(fā)人員只知道有異常若债，但是這個異常具體是由哪個微服務引起的就需要逐個服務排查了。

開發(fā)人員借助日志逐個排查的效率是非常低的拆融，那有沒有更好的解決方案了蠢琳？

答案是引入鏈路追蹤系統。

什么是鏈路追蹤镜豹？

分布式鏈路追蹤就是將一次分布式請求還原成調用鏈路傲须，將一次分布式請求的調用情況集中展示，比如各個服務節(jié)點上的耗時趟脂、請求具體到達哪臺機器上泰讽、每個服務節(jié)點的請求狀態(tài)等等。

鏈路跟蹤主要功能：

故障快速定位：可以通過調用鏈結合業(yè)務日志快速定位錯誤信息昔期。
鏈路性能可視化：各個階段鏈路耗時已卸、服務依賴關系可以通過可視化界面展現出來。
鏈路分析：通過分析鏈路耗時硼一、服務依賴關系可以得到用戶的行為路徑累澡，匯總分析應用在很多業(yè)務場景。

鏈路追蹤基本原理

鏈路追蹤系統（可能）最早是由Goggle公開發(fā)布的一篇論文

《Dapper, a Large-Scale Distributed Systems Tracing Infrastructure》

被大家廣泛熟悉般贼，所以各位技術大牛們如果有黑武器不要藏起來趕緊去發(fā)表論文吧愧哟。

在這篇著名的論文中主要講述了Dapper鏈路追蹤系統的基本原理和關鍵技術點。接下來挑幾個重點的技術點詳細給大家介紹一下哼蛆。

Trace

Trace的含義比較直觀翅雏，就是鏈路，指一個請求經過所有服務的路徑人芽，可以用下面樹狀的圖形表示。

圖中一條完整的鏈路是：chrome -> 服務A -> 服務B -> 服務C -> 服務D -> 服務E -> 服務C -> 服務A -> chrome绩脆。服務間經過的局部鏈路構成了一條完整的鏈路萤厅，其中每一條局部鏈路都用一個全局唯一的traceid來標識。

Span

在上圖中可以看出來請求經過了服務A靴迫，同時服務A又調用了服務B和服務C惕味，但是先調的服務B還是服務C呢？從圖中很難看出來玉锌，只有通過查看源碼才知道順序名挥。

為了表達這種父子關系引入了Span的概念。

同一層級parent id相同主守，span id不同禀倔，span id從小到大表示請求的順序榄融，從下圖中可以很明顯看出服務A是先調了服務B然后再調用了C。

上下層級代表調用關系救湖，如下圖服務C的span id為2愧杯，服務D的parent id為2，這就表示服務C和服務D形成了父子關系鞋既，很明顯是服務C調用了服務D力九。

總結：通過事先在日志中埋點，找出相同traceId的日志邑闺，再加上parent id和span id就可以將一條完整的請求調用鏈串聯起來跌前。

Annotations

Dapper中還定義了annotation的概念，用于用戶自定義事件陡舅，用來輔助定位問題抵乓。

通****常****包含四個注解信息：

cs：Client Start，表示客戶端發(fā)起請求蹭沛；

sr：ServerReceived臂寝，表示服務端收到請求；

ss：Server Send摊灭，表示服務端完成處理咆贬，并將結果發(fā)送給客戶端；

cr：ClientReceived帚呼，表示客戶端獲取到服務端返回信息掏缎；

上圖中描述了一次請求和響應的過程，四個點也就是對應四個Annotation事件煤杀。

如下面的圖表示從客戶端調用服務端的一次完整過程眷蜈。如果要計算一次調用的耗時，只需要將客戶端接收的時間點減去客戶端開始的時間點沈自，也就是圖中時間線上的T4 - T1酌儒。如果要計算客戶端發(fā)送網絡耗時，也就是圖中時間線上的T2 - T1枯途，其他類似可計算忌怎。

帶內數據與帶外數據

鏈路信息的還原依賴于帶內和帶外兩種數據。

帶外數據是各個節(jié)點產生的事件酪夷，如cs榴啸，ss，這些數據可以由節(jié)點獨立生成晚岭，并且需要集中上報到存儲端鸥印。通過帶外數據，可以在存儲端分析更多鏈路的細節(jié)。

帶內數據如traceid,spanid,parentid库说，用來標識trace狂鞋，span，以及span在一個trace中的位置璃弄，這些數據需要從鏈路的起點一直傳遞到終點要销。通過帶內數據的傳遞，可以將一個鏈路的所有過程串起來夏块。

采樣

由于每一個請求都會生成一個鏈路疏咐，為了減少性能消耗，避免存儲資源的浪費脐供，dapper并不會上報所有的span數據浑塞，而是使用采樣的方式。舉個例子政己，每秒有1000個請求訪問系統酌壕，如果設置采樣率為1/1000，那么只會上報一個請求到存儲端歇由。

通過采集端自適應地調整采樣率卵牍，控制span上報的數量，可以在發(fā)現性能瓶頸的同時沦泌，有效減少性能損耗糊昙。

存儲

鏈路中的span數據經過收集和上報后會集中存儲在一個地方，Dapper使用了BigTable數據倉庫谢谦，常用的存儲還有ElasticSearch, HBase, In-memory DB等释牺。

業(yè)界常用鏈路追蹤系統

Google Dapper論文發(fā)出來之后，很多公司基于鏈路追蹤的基本原理給出了各自的解決方案回挽，如Twitter的Zipkin没咙，Uber的Jaeger，pinpoint千劈，Apache開源的skywalking祭刚，還有國產如阿里的鷹眼，美團的Mtrace墙牌，滴滴Trace袁梗，新浪的Watchman，京東的Hydra憔古，不過國內的這些基本都沒有開源。

為了便于各系統間能彼此兼容互通淋袖，OpenTracing組織制定了一系列標準鸿市，旨在讓各系統提供統一的接口。

下面對比一下幾個開源組件，方便日后大家做技術選型焰情。

附各大開源組件的地址：

zipkin -> https://zipkin.io/
Jaeger -> https://www.jaegertracing.io/
Pinpoint -> https://github.com/pinpoint-apm/pinpoint
SkyWalking -> http://skywalking.apache.org/

接下來介紹一下Zipkin基本實現陌凳。

分布式鏈路追蹤系統Zipkin實現

Zipkin 是 Twitter 的一個開源項目，它基于 Google Dapper 實現内舟，它致力于收集服務的定時數據合敦，以解決微服務架構中的延遲問題，包括數據的收集验游、存儲充岛、查找和展現。

Zipkin基本架構

在服務運行的過程中會產生很多鏈路信息耕蝉，產生數據的地方可以稱之為Reporter崔梗。將鏈路信息通過多種傳輸方式如HTTP，RPC垒在，kafka消息隊列等發(fā)送到Zipkin的采集器蒜魄，Zipkin處理后最終將鏈路信息保存到存儲器中。運維人員通過UI界面調用接口即可查詢調用鏈信息场躯。

Zipkin核心組件

Zipkin有四大核心組件

（1）Collector

一旦Collector采集線程獲取到鏈路追蹤數據谈为，Zipkin就會對其進行驗證、存儲和索引踢关，并調用存儲接口保存數據伞鲫，以便進行查找。

（2）Storage

Zipkin Storage最初是為了在Cassandra上存儲數據而構建的耘成，因為Cassandra是可伸縮的榔昔，具有靈活的模式，并且在Twitter中大量使用瘪菌。除了Cassandra撒会，還支持支持ElasticSearch和MySQL存儲，后續(xù)可能會提供第三方擴展师妙。

（3）Query Service

鏈路追蹤數據被存儲和索引之后诵肛，webui 可以調用query service查詢任意數據幫助運維人員快速定位線上問題。query service提供了簡單的json api來查找和檢索數據默穴。

（4）Web UI

Zipkin 提供了基本查詢怔檩、搜索的web界面，運維人員可以根據具體的調用鏈信息快速識別線上問題蓄诽。

總結

分布式鏈路追蹤就是將每一次分布式請求還原成調用鏈路薛训。
鏈路追蹤的核心概念：Trace、Span仑氛、Annotation乙埃、帶內和帶外數據闸英、采樣、存儲介袜。
業(yè)界常用的開源組件都是基于谷歌Dapper論文演變而來甫何；
Zipkin核心組件有：Collector太抓、Storage奏夫、Query Service髓需、Web UI朴沿。

為什么阿里巴巴的程序員成長速度這么快僧须？

霸榜GitHub的Offer來了原理篇＋框架篇杯矩，開放分享拍柒；

50W年薪程序員需要的技術棧分析

看完三件事??

如果你覺得這篇內容對你還蠻有幫助南用，我想邀請你幫我三個小忙：

點贊跳芳，轉發(fā)芍锦，有你們的『點贊和評論』，才是我創(chuàng)造的動力飞盆。

關注公眾號『 Java斗帝』娄琉，不定期分享原創(chuàng)知識。

同時可以期待后續(xù)文章ing??

?著作權歸作者所有,轉載或內容合作請聯系作者

人面猴
序言：七十年代末吓歇，一起剝皮案震驚了整個濱河市孽水，隨后出現的幾起案子，更是在濱河造成了極大的恐慌城看，老刑警劉巖女气，帶你破解...
沈念sama閱讀 206,126評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現場離奇詭異测柠，居然都是意外死亡炼鞠，警方通過查閱死者的電腦和手機，發(fā)現死者居然都...
沈念sama閱讀 88,254評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門轰胁，熙熙樓的掌柜王于貴愁眉苦臉地迎上來谒主，“玉大人，你說我怎么就攤上這事赃阀■希” “怎么了？”我有些...
開封第一講書人閱讀 152,445評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵榛斯，是天一觀的道長观游。經常有香客問我，道長驮俗，這世上最難降的妖魔是什么懂缕？我笑而不...
開封第一講書人閱讀 55,185評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮王凑，結果婚禮上提佣，老公的妹妹穿的比我還像新娘吮蛹。我一直安慰自己，他們只是感情好拌屏，可當我...
茶點故事閱讀 64,178評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著术荤，像睡著了一般倚喂。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上瓣戚，一...
開封第一講書人閱讀 48,970評論 1贊 284
城市分裂傳說
那天端圈，我揣著相機與錄音，去河邊找鬼子库。笑死舱权，一個胖子當著我的面吹牛，可吹牛的內容都是我干的仑嗅。我是一名探鬼主播宴倍，決...
沈念sama閱讀 38,276評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼仓技！你這毒婦竟也來了鸵贬？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 36,927評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤脖捻，失蹤者是張志新（化名）和其女友劉穎阔逼，沒想到半個月后，有當地人在樹林里發(fā)現了一具尸體地沮，經...
沈念sama閱讀 43,400評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡嗜浮，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 35,883評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現自己被綠了摩疑。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片危融。...
茶點故事閱讀 37,997評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖未荒，靈堂內的尸體忽然破棺而出专挪，到底是詐尸還是另有隱情，我是刑警寧澤片排，帶...
沈念sama閱讀 33,646評論 4贊 322
?日本核電站爆炸內幕
正文年R本政府宣布寨腔，位于F島的核電站，受9級特大地震影響率寡，放射性物質發(fā)生泄漏迫卢。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,213評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一冶共、第九天我趴在偏房一處隱蔽的房頂上張望乾蛤。院中可真熱鬧每界，春花似錦、人聲如沸家卖。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,204評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽上荡。三九已至趴樱，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間酪捡，已是汗流浹背叁征。一陣腳步聲響...
開封第一講書人閱讀 31,423評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留逛薇，地道東北人捺疼。一個月前我還...
沈念sama閱讀 45,423評論 2贊 352
代替公主和親
正文我出身青樓，卻偏偏與公主長得像永罚，于是被迫代替她去往敵國和親啤呼。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 42,722評論 2贊 345