今天在調(diào)用大數(shù)據(jù)平臺遇到一個問題焚碌,有張表的數(shù)據(jù)超10億,直接查死,因此就在想有什么方式可以快速定位系統(tǒng)瓶頸俱诸,方便優(yōu)化升級,因此想到分布式調(diào)用跟蹤
分布式調(diào)用跟蹤主要場景
1.通過鏈路跟蹤赊舶,分析一個請求的邏輯軌跡睁搭,快速進行故障定位
2.找到各個環(huán)節(jié)的評級,有利于優(yōu)化升級
3.方便調(diào)整薄弱的數(shù)據(jù)請求環(huán)節(jié)笼平,如加緩存园骆,持久層,提高系統(tǒng)可用性
4.調(diào)用鏈是一個完整的業(yè)務(wù)日志寓调,可以用于用戶行為分析
對分布式調(diào)用鏈架構(gòu)的要求
1.侵入性低锌唾,應(yīng)用透明。開發(fā)人員無需關(guān)心
2.埋點進行鏈路跟蹤低損耗
3.抓取存儲日志
4.分析和統(tǒng)計調(diào)用鏈數(shù)據(jù)
5.計算和展示能力
比較成熟的解決方案
Google的Dapper夺英,Twitter的zipkin晌涕,淘寶的鷹眼,新浪的Watchman痛悯,京東的Hydra等
如何落地
springboot+zipkin
展望
開發(fā)階段既發(fā)現(xiàn)類似瓶頸余黎,不會像今天這樣措手不及~
可以在未來的大平臺中,加入鏈路跟蹤體系~