【融云分析】從過剩存儲資源到分布式時序數(shù)據(jù)庫的長存儲

背景介紹:

作為一名 Infra羹奉,管理平臺的各種基礎(chǔ)組建以及基本的服務(wù)質(zhì)量是必修的功課骑脱,而如何對復(fù)雜和繁多的基礎(chǔ)平臺渴庆,甚至包括上面運行的 Ops 系統(tǒng)、業(yè)務(wù)系統(tǒng)捺氢,其穩(wěn)定性的各項指標都是衡量 Infra 是否稱職的非常重要的標準藻丢。

單純離散的指標本身是沒有實際意義的,只有將離散的指標通過某種方式進行存儲摄乒,并支持對終端用戶友好的查詢以及聚合悠反,才會真正的有意義。因此馍佑,一個性能足夠的斋否,分布式的,用戶友好且方便下面 DevOps 團隊進行部署的 TSDB ( Time Series Database )就成了一個不可缺少的系統(tǒng)拭荤。

常見的 TSDB 包括 InfluxDB , OpenTSDB , Prometheus 等茵臭,其中,開源版本的 InfluxDB 雖然優(yōu)秀舅世,但并不支持集群部署旦委,且 TICK Stack 本身對數(shù)據(jù)清洗的靈活性支持并不太好,直接使用開源版本雏亚,會有統(tǒng)計信息被收集并上報缨硝;而 OpenTSDB 由于基于 HBase ,在部署時成本過高罢低,且本身并不是一套完整的監(jiān)控系統(tǒng)查辩,而基于 Prometheus 與 TiKV 進行開發(fā)的話,整個系統(tǒng)可在保持最簡潔的同時,也有非常豐富的生態(tài)支持宜岛。

因此长踊,基于實際情況,融云最終選擇 TiPrometheus 作為 Infra 部的監(jiān)控平臺存儲方案萍倡。

項目簡介:

上圖為 Prometheus 的官方系統(tǒng)架構(gòu)圖身弊,而實現(xiàn) TiPrometheus ,用到了上圖中沒有體現(xiàn)到的一個 Prometheus 的功能:Remote Storage 遣铝,如其名所示佑刷,其主要功能是給 Prometheus 提供了遠程寫的能力,這個功能對于查詢是透明的酿炸,主要用于長存儲。而我們當時的 TiPrometheus 實現(xiàn)了基于 TiKV 以及 PD 實現(xiàn)的 Prometheus 的 Remote Storage 涨冀。

核心實現(xiàn)

Prometheus 記錄的數(shù)據(jù)結(jié)構(gòu)分為兩部分 Label 及 Samples 填硕。 Label 記錄了一些特征信息,Samples 包含了指標數(shù)據(jù)和 Timestamp 鹿鳖。

Label 和時間范圍結(jié)合扁眯,可以查詢到需要的 Value 。

為了查詢這些記錄翅帜,需要構(gòu)建兩種索引 Label Index 和 Time Index 姻檀,并以特殊的 Key 存儲 Value 。

l Label Index

每對 Label 為會以 index:label:<name>#<latency> 為 key 涝滴,labelID 為 Value 存入绣版。新的記錄會 "," 分割追加到 Value 后面。這是一種搜索中常用的倒排索引歼疮。

l Time Index

每個 Sample 項會以 index:timeseries:<labelID>:<splitTime> 為 Key杂抽,Timestamp 為 Value ,SplitTime 為時間切片的起始點韩脏。追加的 Timestamp 同樣以","分割缩麸。

l Doc 存儲

我們將每一條 Samples 記錄以 timeseries:doc:<labelID>:<timestamp> 為 Key 存入 TiKV ,其中 LabelID 是 Label 全文的散列值赡矢。

下面做一個梳理:

寫入過程

1. 生成 labelID

2. 構(gòu)建 time index杭朱,index:timeseries:<labelID>:<splitTime>"ts,ts"

3. 寫入時序數(shù)據(jù) timeseries:doc:<labelID>:<timestamp> "value"

4. 寫入時序數(shù)據(jù) timeseries:doc:<labelID>:<timestamp> "value"

查詢過程

1. 根據(jù)倒排索引查出 labelID 的集合,多對 Label 的查詢會對 labelID 集合求交集吹散。

2. 根據(jù) labelID 和時間范圍內(nèi)的時間分片查詢包含的 Timestamp 弧械。

3. 根據(jù) labelID 和 Timestamp 查出所需的 Value 。

Why TiPrometheus

該項目最初源于參加 PingCAP 組織的 Hackathon 送浊,當時希望與參與者一起完成大家腦海里的想法梦谜,其實最重要的事情就是,做出來的東西并不是為了單純的 Demo ,而是要做一個在實際工作中應(yīng)用于生產(chǎn)環(huán)境的實際能力唁桩,且能解決生產(chǎn)中的問題闭树。

剛開始還有過各種奇思妙想,包括在 TiSpark 上做一套 ML 荒澡,Hadoop over TiKV 等报辱,不過這些想法實現(xiàn)起來都有些過于硬核,對于只有兩天工作時間就需要完成的項目來說单山,可能性太邪帧;或者說米奸,如果希望實現(xiàn) Demo 昼接,所需 Hack 的點過多。而 GEO 全文檢索在融云現(xiàn)有的生產(chǎn)上悴晰,以及現(xiàn)有的系統(tǒng)中慢睡,也并沒有需要去填補的大坑,因此铡溪,也就沒有什么必要去在這方面花費力氣去解決一個并不存在的問題漂辐。

由于 IM 服務(wù)是一種計算密集型的服務(wù),且服務(wù)質(zhì)量是融云的核心競爭力棕硫;而目前存儲資源呈現(xiàn)出零散分布的節(jié)點髓涯,且每個節(jié)點的存儲資源使用率并不高,為了最大化利用現(xiàn)有的閑置資源哈扮,融云最終設(shè)計并實現(xiàn)了這套 TiPrometheus 系統(tǒng)纬纪。

Result

打通了 TiKV 與 Prometheus ,為基于 K , V 存儲的時序數(shù)據(jù)庫設(shè)計提供了一個可行的思路灶泵。

為 Prometheus 的長存儲提供了一套實用的解決方案育八。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市赦邻,隨后出現(xiàn)的幾起案子髓棋,更是在濱河造成了極大的恐慌,老刑警劉巖惶洲,帶你破解...
    沈念sama閱讀 211,948評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件按声,死亡現(xiàn)場離奇詭異,居然都是意外死亡恬吕,警方通過查閱死者的電腦和手機签则,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,371評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來铐料,“玉大人渐裂,你說我怎么就攤上這事豺旬。” “怎么了柒凉?”我有些...
    開封第一講書人閱讀 157,490評論 0 348
  • 文/不壞的土叔 我叫張陵族阅,是天一觀的道長。 經(jīng)常有香客問我膝捞,道長坦刀,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,521評論 1 284
  • 正文 為了忘掉前任蔬咬,我火速辦了婚禮鲤遥,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘林艘。我一直安慰自己盖奈,他們只是感情好,可當我...
    茶點故事閱讀 65,627評論 6 386
  • 文/花漫 我一把揭開白布北启。 她就那樣靜靜地躺著卜朗,像睡著了一般。 火紅的嫁衣襯著肌膚如雪咕村。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,842評論 1 290
  • 那天蚊俺,我揣著相機與錄音懈涛,去河邊找鬼。 笑死泳猬,一個胖子當著我的面吹牛批钠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播得封,決...
    沈念sama閱讀 38,997評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼埋心,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了忙上?” 一聲冷哼從身側(cè)響起拷呆,我...
    開封第一講書人閱讀 37,741評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎疫粥,沒想到半個月后茬斧,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,203評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡梗逮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,534評論 2 327
  • 正文 我和宋清朗相戀三年项秉,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片慷彤。...
    茶點故事閱讀 38,673評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡娄蔼,死狀恐怖怖喻,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情岁诉,我是刑警寧澤锚沸,帶...
    沈念sama閱讀 34,339評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站唉侄,受9級特大地震影響咒吐,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜属划,卻給世界環(huán)境...
    茶點故事閱讀 39,955評論 3 313
  • 文/蒙蒙 一恬叹、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧同眯,春花似錦绽昼、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,770評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至明肮,卻和暖如春菱农,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背柿估。 一陣腳步聲響...
    開封第一講書人閱讀 32,000評論 1 266
  • 我被黑心中介騙來泰國打工循未, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人秫舌。 一個月前我還...
    沈念sama閱讀 46,394評論 2 360
  • 正文 我出身青樓的妖,卻偏偏與公主長得像,于是被迫代替她去往敵國和親足陨。 傳聞我的和親對象是個殘疾皇子嫂粟,可洞房花燭夜當晚...
    茶點故事閱讀 43,562評論 2 349

推薦閱讀更多精彩內(nèi)容

  • 初稿待修星虹,看完請您提意見: 發(fā)刊詞:好的溝通是現(xiàn)代社會的最大生產(chǎn)力! 這篇文章我希望傳遞幾個觀點: 1.現(xiàn)狀:卜絲...
    劉書亞的天堂之路閱讀 2,950評論 0 1
  • 老友重逢飒房,驚喜交加搁凸,喜的是見面,驚的是變化狠毯。有的沒了棱角护糖,有的生了冷靜,相同的都帶了一臉風霜嚼松,不同的都有了...
    冰夫閱讀 179評論 0 0
  • 本月老師主要講了網(wǎng)文和自媒體兩種文體類型的寫作思路和技巧,應(yīng)該說全是干貨寝受。網(wǎng)文那塊只作為了解看了看坷牛,并沒有參與作業(yè)...
    紫果凍閱讀 271評論 0 0
  • 每個人心中都有一套自我評價體系,然而絕大多數(shù)人的這個體系是錯誤的很澄,所以會導致一系列的問題京闰。或許這也是自古以來無完人...
    萌萌AC閱讀 164評論 0 1
  • 這里使用的StoryBoard連線的delegate和dataSource 值得一提的是圖片的賦值方式: 不僅僅可...
    iOS_July閱讀 1,055評論 0 0