流式數(shù)據(jù)Pipeline質(zhì)量控制淺談

一般而言,實(shí)現(xiàn)某個(gè)特定業(yè)務(wù)的數(shù)據(jù)Pipeline都會(huì)比較長(zhǎng)绽媒,這個(gè)時(shí)候?qū)ζ渲心硞€(gè)組件進(jìn)行變更就是很有壓力的事情。我們?nèi)绾伪WC數(shù)據(jù)的準(zhǔn)確性和完整性呢是辕?

引子

以我們公司的實(shí)時(shí)帶寬計(jì)算為例获三,就是一個(gè)長(zhǎng)長(zhǎng)的Pipeline,中間經(jīng)過的組件其實(shí)是很多的石窑,比如解析模塊,指標(biāo)拼接模塊松逊,累加器模塊等肯夏,這些模塊可能是獨(dú)立部署,也可能是在一個(gè)系統(tǒng)中驯击,它們根據(jù)業(yè)務(wù)需求會(huì)經(jīng)常發(fā)生變更徊都。

因?yàn)樽罱K數(shù)據(jù)需要每一個(gè)環(huán)節(jié)的銜接和計(jì)算都沒有問題,才能得出正確的結(jié)果暇矫。然而讓人遺憾的是李根,一個(gè)變更可能不影響最終呈現(xiàn),但是其實(shí)是有問題的房轿,這種問題往往令人難以察覺。那問題來了夯接,發(fā)生變更后盔几,如何保證數(shù)據(jù)的正確性晴弃?

需要做的事情其實(shí)很多的。經(jīng)過實(shí)踐粒蜈,我們發(fā)現(xiàn)如下四個(gè)舉措可以減少變更帶來的風(fēng)險(xiǎn)。

變更前并行運(yùn)行

通常我們有一個(gè)模塊變更后注整,我們會(huì)在準(zhǔn)生產(chǎn)環(huán)境并行運(yùn)行一段時(shí)間(一般而言是一周)肿轨,對(duì)計(jì)算結(jié)果會(huì)繪制成曲線圖椒袍,然后和線上的曲線進(jìn)行擬合藻茂。如果完全重疊,則證明沒有問題优俘,具備上線條件帆焕。

這個(gè)可以保證數(shù)據(jù)的準(zhǔn)確性不恭,而且這種準(zhǔn)生產(chǎn)環(huán)境的服務(wù)器資源也是值得投入的换吧。

探針

探針可以檢測(cè)全流程數(shù)據(jù)是否會(huì)丟失,而且能檢驗(yàn)延時(shí)情況筋遭。 探針可以是數(shù)據(jù)源提供的,也可以是自己仿造的编饺。

這個(gè)可以一定程度上保證數(shù)據(jù)的完整性透且。

離線數(shù)據(jù)存儲(chǔ)

離線數(shù)據(jù)需要得到保留,可以是最原始的數(shù)據(jù)秽誊,也可以是某個(gè)中間結(jié)果的數(shù)據(jù)琳骡,還可以是某個(gè)數(shù)據(jù)的偏移量(譬如Kafka的偏移量)锅论,這樣可以保證上線變更導(dǎo)致計(jì)算異常(邏輯上的或者物理上的)能夠得到補(bǔ)救。一旦有異常楣号,可以拿這些離線數(shù)據(jù)進(jìn)行計(jì)算恢復(fù)數(shù)據(jù)曲線最易。實(shí)時(shí)計(jì)算中很大的一個(gè)問題是發(fā)生故障或者程序邏輯異常時(shí)導(dǎo)致某一段時(shí)間區(qū)段的結(jié)果計(jì)算不準(zhǔn)確了。

埋點(diǎn)統(tǒng)計(jì)

當(dāng)然炫狱,真正要實(shí)現(xiàn)全鏈路的質(zhì)量監(jiān)控藻懒,保證不發(fā)生問題或者及時(shí)發(fā)現(xiàn)問題,還是需要對(duì)每個(gè)環(huán)節(jié)設(shè)置各種指標(biāo)视译,我們其實(shí)對(duì)各個(gè)環(huán)節(jié)也抽象出了很多指標(biāo)嬉荆,通過一個(gè)高效的計(jì)數(shù)系統(tǒng)來實(shí)現(xiàn)。這里唯一的問題是需要進(jìn)行埋點(diǎn)酷含。

總結(jié)

質(zhì)量控制其實(shí)是一個(gè)比較復(fù)雜的問題员寇,上面的做的事情通過并行運(yùn)算確保最終結(jié)果無異常,離線數(shù)據(jù)存儲(chǔ)保證數(shù)據(jù)計(jì)算結(jié)果的可恢復(fù)第美,探針可以檢測(cè)延時(shí)或者數(shù)據(jù)的完整性蝶锋,埋點(diǎn)可以讓我們對(duì)各個(gè)組件的狀態(tài)有更多的追蹤扳缕。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末省古,一起剝皮案震驚了整個(gè)濱河市惜互,隨后出現(xiàn)的幾起案子描验,更是在濱河造成了極大的恐慌膘流,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,265評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異马靠,居然都是意外死亡逞度,警方通過查閱死者的電腦和手機(jī)俊戳,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門渐北,熙熙樓的掌柜王于貴愁眉苦臉地迎上來恃锉,“玉大人,你說我怎么就攤上這事土砂∥林ィ” “怎么了晤郑?”我有些...
    開封第一講書人閱讀 156,852評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵吭练,是天一觀的道長(zhǎng)鲫咽。 經(jīng)常有香客問我锦聊,道長(zhǎng),這世上最難降的妖魔是什么圆到? 我笑而不...
    開封第一講書人閱讀 56,408評(píng)論 1 283
  • 正文 為了忘掉前任挣菲,我火速辦了婚禮己单,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘廷痘。我一直安慰自己,他們只是感情好茉盏,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評(píng)論 5 384
  • 文/花漫 我一把揭開白布淹真。 她就那樣靜靜地躺著巍糯,像睡著了一般。 火紅的嫁衣襯著肌膚如雪搀愧。 梳的紋絲不亂的頭發(fā)上杆故,一...
    開封第一講書人閱讀 49,772評(píng)論 1 290
  • 那天撤蟆,我揣著相機(jī)與錄音,去河邊找鬼讨衣。 笑死,一個(gè)胖子當(dāng)著我的面吹牛夕玩,可吹牛的內(nèi)容都是我干的风秤。 我是一名探鬼主播缤弦,決...
    沈念sama閱讀 38,921評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼斋陪!你這毒婦竟也來了友题?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,688評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤划鸽,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,130評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡缴淋,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,617評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡饿凛,死狀恐怖纠吴,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情伐坏,我是刑警寧澤纯露,帶...
    沈念sama閱讀 34,276評(píng)論 4 329
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響遵班,放射性物質(zhì)發(fā)生泄漏翰萨。R本人自食惡果不足惜阿蝶,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評(píng)論 3 312
  • 文/蒙蒙 一粤蝎、第九天 我趴在偏房一處隱蔽的房頂上張望谤狡。 院中可真熱鬧霉囚,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至垂攘,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評(píng)論 1 265
  • 我被黑心中介騙來泰國(guó)打工鸟雏, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留惶室,地道東北人夹界。 一個(gè)月前我還...
    沈念sama閱讀 46,315評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像评汰,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子惨缆,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容