分布式最佳實踐:數(shù)據(jù)分發(fā)

為什么

在微服務架構(gòu)中党涕,在服務拆分后计技,每個服務都會根據(jù)自身業(yè)務維護獨立的數(shù)據(jù)享钞,服務之間需要進行數(shù)據(jù)交互割岛,一般會采用 RPC 或 RESTful API 進行通信愉适。

在某些復雜場景下,微服務通常不僅需要更新本地數(shù)據(jù)存儲癣漆,而且還需要將發(fā)生的數(shù)據(jù)變更通知其他服務。比如去數(shù)據(jù)庫 join剂买、同步數(shù)據(jù)到數(shù)據(jù)倉儲惠爽,那么如果只是通過常用的進程間通信方式來處理數(shù)據(jù)癌蓖,那么性能是非常差的。

數(shù)據(jù)分發(fā)則是為了解決這類問題婚肆,通過某種方式將數(shù)據(jù)源中的數(shù)據(jù)分發(fā)給第三方租副,數(shù)據(jù)分發(fā)需要遵守一個原則:Single Source of Truth,也就是說分發(fā)數(shù)據(jù)的服務應該是該數(shù)據(jù)的唯一主人较性,分發(fā)到其它系統(tǒng)的數(shù)據(jù)應該是只讀的用僧,非權(quán)威的,不能保證準確性赞咙。

常見的數(shù)據(jù)分發(fā)場景

  • 同步數(shù)據(jù)倉庫/搜索引擎
  • 去數(shù)據(jù)庫 join(通過數(shù)據(jù)分發(fā)冗余责循,避免跨庫join)
  • 實現(xiàn)分布式事務
  • 數(shù)據(jù)庫拆分的遷移

怎么做

開始之前,我們先舉一個簡單的例子攀操,假如有一個用戶服務(user-service)院仿,當對用戶信息進行變更時,需要將變更的信息同步給第三方(order-service)

雙寫

第一個想到的應該就是直接雙寫速和,在 user-service 中對用戶數(shù)據(jù)修改后歹垫,立馬調(diào)用第三方接口進行同步。

首先我們引入了分布式事務來解決了雙寫的強一致性問題颠放,事實上排惨,數(shù)據(jù)分發(fā)對于一致性的要求并不是非常高,一般來說要求最終一致性即可碰凶,現(xiàn)在來看若贮,同步了一個三方,我們還能接受痒留。

隨著業(yè)務規(guī)模的擴張谴麦,現(xiàn)在需要對用戶的信息進行報表分析,現(xiàn)在需要將用戶信息再同步到數(shù)據(jù)倉庫中伸头,于是


隨著需要同步的三方服務越來越多匾效,分布式事務引入的技術(shù)復雜性也越來越高,對于 userService 服務本身來說耦合性也越來越高恤磷,最終就會導致服務的維護性越來越差面哼。

事務性發(fā)件箱(Transactional Outbox)

可以看到 雙寫 是一個不太靠譜的方案。它會帶來兩個問題

  • 引入分布式事務扫步,導致復雜性增高
  • 耦合性太高
    而且是隨著接入的三方的增多魔策,復雜性也會線性增大。

事務性發(fā)件箱模式則可以很好的解決這兩個問題河胎,它做了兩件事

  1. 將分布式事務轉(zhuǎn)換成本地事務闯袒,在 user 表所在的數(shù)據(jù)庫中新增一個 outbox 表,更新用戶信息的同時把對用戶的變更信息一起插入到 outbox 表中,可以直接使用本地事務保證原子性政敢。
  2. 新增一個 Message Relay 線程其徙,定時從 outbox 表中拉取未處理的數(shù)據(jù),發(fā)布到 MQ 中喷户,在三方系統(tǒng)中只需要訂閱 topic 即可唾那,這樣大大的降低了服務的耦合性

看起來很完美,解決了分布式事務的復雜性和耦合性褪尝。但引入了新的技術(shù)棧和 Message Relay 節(jié)點闹获,沒有銀彈... 依舊會出現(xiàn)新的需要考慮的問題

  • 消費方在消費MQ數(shù)據(jù)時需要做冪等處理
  • 需要保證 Message Relay 的高可用,高可用的同時需要考慮選主問題(一般只需要一個 Message Relay 線程工作)
  • 需要對錯誤消息跟蹤處理

雖然引入了新的復雜性河哑,但長遠來看是可以接受的避诽。維護成本也比較小,但由于 Message Relay 是從 outbox 中定時拉取數(shù)據(jù)灾馒,然后發(fā)布到 MQ茎用,最后訂閱方在進行消費,這個數(shù)據(jù)流還是比較長的睬罗,也就意味著使用 事務性發(fā)件箱模式 數(shù)據(jù)的實時性并不高轨功,同時也會有一定的侵入性。

變更數(shù)據(jù)捕獲(Change Data Capture, CDC)

Transactional Outbox 模式的一個硬傷就是實時性較差容达,主要原因就在于 Message Relay 拉取 Outbox 的頻率古涧,如果直接輪詢,對數(shù)據(jù)庫就會造成很大的壓力花盐,如果定期拉取羡滑,實時性就很差。

Change Data Capture 是通過捕獲增量數(shù)據(jù)的方式進行數(shù)據(jù)的同步算芯,其利用了數(shù)據(jù)庫的事務日志通知的特性柒昏,捕獲記錄的變更記錄,從而可以及時的感知到數(shù)據(jù)的變動熙揍,大大的提高了實時性职祷。

CDC 的原理也非常簡單,一般數(shù)據(jù)庫届囚,對于變更提交操作有梆,都記錄所謂事務日志Transaction Log,也稱為提交日志Commit Log意系,比如 MySQL 支持 binlog泥耀,Postgres 支持 Write Ahead log。事務日志可以簡單理解為數(shù)據(jù)庫本地的一個文件隊列蛔添,它記錄了按時間順序發(fā)生的對數(shù)據(jù)庫表的變更提交記錄痰催。

同樣 CDC 也引入了一些新的復雜性

  • Transactional log miner 的高可用以及監(jiān)控告警
  • 需要深入理解數(shù)據(jù)庫的事務日志格式和協(xié)議

國內(nèi)用的比較多的 CDC 解決方案是阿里的 Canal兜辞,其核心原理就是借助了 MySQL 的主從復制功能,模擬成 MySQL 的 salve 節(jié)點陨囊,向 MySQL 發(fā)送 dump 協(xié)議弦疮,接收 MySQL 推送的 binlog夹攒。

總結(jié)

面向業(yè)務系統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)集成場景中蜘醋,數(shù)據(jù)分發(fā)的場景會越來越多,在保證數(shù)據(jù)最終一致性的前提下咏尝,數(shù)據(jù)的實時性越來越重要压语。本文介紹了三種數(shù)據(jù)分發(fā)的方式

雙寫
適合簡單的業(yè)務場景,不引入新的技術(shù)棧直接通過常規(guī)的進程間通信方式進行數(shù)據(jù)分發(fā)编检。為了解決分布式事務的問題胎食,需要引入分布式事務解決方案,當然也可以使用最簡單的補償方式來避免引入分布式事務的復雜度允懂。

事務性發(fā)件箱 Transactional Outbox
適合中小規(guī)模的業(yè)務場景厕怜,雖然引入了新的技術(shù)棧帶來一些新的問題,但這些問題都有比較成熟的解決方案蕾总。對于 Transactional Outbox 模式來說沒辦法避免的就是兩點

  • 對服務會較小的侵入性
  • 數(shù)據(jù)的實時性相對較差
    所以如果我們能夠接受這兩個缺點粥航,那么 Transactional Outbox 模式是個不錯的選擇。

變更數(shù)據(jù)捕獲 Change Data Capture
相較于 Transactional Outbox 來說生百,雖然有現(xiàn)成的解決方案递雀,但 CDC 的綜合復雜性依舊會更高,甚至需要單獨的進行維護蚀浆。CDC 帶來的最大好處就是實時性很高缀程,所以 CDC 更適合于大規(guī)模且實時性要求更高的業(yè)務場景。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末市俊,一起剝皮案震驚了整個濱河市杨凑,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌摆昧,老刑警劉巖撩满,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異据忘,居然都是意外死亡鹦牛,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進店門勇吊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來曼追,“玉大人,你說我怎么就攤上這事汉规±袷猓” “怎么了驹吮?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長晶伦。 經(jīng)常有香客問我碟狞,道長,這世上最難降的妖魔是什么婚陪? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任族沃,我火速辦了婚禮,結(jié)果婚禮上泌参,老公的妹妹穿的比我還像新娘脆淹。我一直安慰自己,他們只是感情好沽一,可當我...
    茶點故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布盖溺。 她就那樣靜靜地躺著,像睡著了一般铣缠。 火紅的嫁衣襯著肌膚如雪烘嘱。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天蝗蛙,我揣著相機與錄音蝇庭,去河邊找鬼。 笑死歼郭,一個胖子當著我的面吹牛遗契,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播病曾,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼牍蜂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了泰涂?” 一聲冷哼從身側(cè)響起鲫竞,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎逼蒙,沒想到半個月后从绘,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡是牢,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年僵井,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片驳棱。...
    茶點故事閱讀 39,834評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡批什,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出社搅,到底是詐尸還是另有隱情驻债,我是刑警寧澤乳规,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站合呐,受9級特大地震影響暮的,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜淌实,卻給世界環(huán)境...
    茶點故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一冻辩、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧翩伪,春花似錦微猖、人聲如沸谈息。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽侠仇。三九已至轻姿,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間逻炊,已是汗流浹背互亮。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留余素,地道東北人豹休。 一個月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像桨吊,于是被迫代替她去往敵國和親威根。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內(nèi)容