建設(shè)實(shí)時(shí)數(shù)倉(cāng)之前的思考與方案記錄

前言

隨著這次新冠疫情帶來的機(jī)遇涯塔，我司業(yè)務(wù)飛速增長(zhǎng)，實(shí)時(shí)數(shù)倉(cāng)的建設(shè)已經(jīng)提上了日程惯驼。雖然還沒有正式開始實(shí)施蹲嚣，但是汲取前人的經(jīng)驗(yàn)，做好萬全的準(zhǔn)備總是必要的祟牲。本文簡(jiǎn)單松散地記錄一下想法隙畜，不涉及維度建模方法論的事情（這個(gè)就老老實(shí)實(shí)去問Kimball他老人家吧）。

動(dòng)機(jī)

隨著業(yè)務(wù)快速增長(zhǎng)说贝，傳統(tǒng)離線數(shù)倉(cāng)的不足暴露出來：

運(yùn)維層面——所有調(diào)度任務(wù)只能在業(yè)務(wù)閑時(shí)（凌晨）集中啟動(dòng)议惰，集群壓力大，耗時(shí)越來越長(zhǎng)乡恕；
業(yè)務(wù)層面——數(shù)據(jù)按T+1更新言询，延遲高俯萎，數(shù)據(jù)時(shí)效價(jià)值打折扣，無法精細(xì)化運(yùn)營(yíng)與及時(shí)感知異常运杭。

實(shí)時(shí)數(shù)倉(cāng)即離線數(shù)倉(cāng)的時(shí)效性改進(jìn)方案夫啊，從原本的小時(shí)/天級(jí)別做到秒/分鐘級(jí)別。

底層設(shè)計(jì)變動(dòng)的同時(shí)辆憔，需要盡力保證平滑遷移涮母，不影響用戶（分析人員）之前的使用習(xí)慣。

指導(dǎo)思想：Kappa架構(gòu)

一圖流躁愿。

計(jì)算引擎

硬性要求：

批流一體化——能同時(shí)進(jìn)行實(shí)時(shí)和離線的操作；
提供統(tǒng)一易用的SQL interface——方便開發(fā)人員和分析人員沪蓬。

可選項(xiàng)：Spark彤钟、Flink
較優(yōu)解：Flink
優(yōu)點(diǎn)：

嚴(yán)格按照Google Dataflow模型實(shí)現(xiàn)；
在事件時(shí)間跷叉、窗口逸雹、狀態(tài)、exactly-once等方面更有優(yōu)勢(shì)云挟；
非微批次處理梆砸，真正的實(shí)時(shí)流處理；
多層API园欣，對(duì)table/SQL支持良好帖世，支持UDF、流式j(luò)oin等高級(jí)用法沸枯。

缺點(diǎn)：

生態(tài)系統(tǒng)沒有Spark強(qiáng)大（不太重要）日矫；
1.10版本相比1.9版本的改動(dòng)較多，需要仔細(xì)研究绑榴。

底層（事實(shí)數(shù)據(jù)）存儲(chǔ)引擎

硬性要求：

數(shù)據(jù)in-flight——不能中途落地哪轿，處理完之后直接給到下游，最小化延遲翔怎；
可靠存儲(chǔ)——有一定持久化能力窃诉，高可用，支持?jǐn)?shù)據(jù)重放赤套。

可選項(xiàng)：各種消息隊(duì)列組件（Kafka飘痛、RabbitMQ、RocketMQ于毙、Pulsar敦冬、...）
較優(yōu)解：Kafka
優(yōu)點(diǎn)：

吞吐量很大；
與Flink唯沮、Canal等外部系統(tǒng)的對(duì)接方案非常成熟脖旱，容易操作堪遂；
團(tuán)隊(duì)使用經(jīng)驗(yàn)豐富。

中間層（維度數(shù)據(jù)）存儲(chǔ)引擎

硬性要求：

支持較大規(guī)模的查詢（主要是與事實(shí)數(shù)據(jù)join的查詢）萌庆；
能夠快速實(shí)時(shí)更新溶褪。

可選項(xiàng)：RDBMS（MySQL等）、NoSQL（HBase践险、Redis猿妈、Cassandra等）
較優(yōu)解：HBase
優(yōu)點(diǎn)：

實(shí)時(shí)寫入性能高，且支持基于時(shí)間戳的多版本機(jī)制巍虫；
接入業(yè)務(wù)庫(kù)MySQL binlog簡(jiǎn)單彭则；
可以通過集成Phoenix獲得SQL能力。

高層（明細(xì)/匯總數(shù)據(jù)）存儲(chǔ)/查詢引擎

根據(jù)不同的需求占遥，按照業(yè)務(wù)特點(diǎn)選擇不同的方案俯抖。

當(dāng)前已大規(guī)模應(yīng)用，可隨時(shí)利用的組件：

Greenplum——業(yè)務(wù)歷史明細(xì)瓦胎、BI支持芬萍、大寬表MOLAP
Redis——大列表業(yè)務(wù)結(jié)果（PV/UV、標(biāo)簽搔啊、推薦結(jié)果柬祠、Top-N等）
HBase——高并發(fā)匯總指標(biāo)（用戶畫像？）
MySQL——普通匯總指標(biāo)负芋、匯總模型等

當(dāng)前未有或未大規(guī)模應(yīng)用的組件：

ElasticSearch（ELK）——日志明細(xì)漫蛔，似乎也可以用作OLAP？
Druid——OLAP
InfluxDB/OpenTSDB——時(shí)序數(shù)據(jù)

數(shù)倉(cāng)分層設(shè)計(jì)

參照傳統(tǒng)數(shù)倉(cāng)分層旧蛾，盡量扁平惩猫，減少數(shù)據(jù)中途的lag，草圖如下蚜点。

元數(shù)據(jù)管理

必要性：
Kafka本身沒有Hive/GP等傳統(tǒng)數(shù)倉(cāng)組件的metastore轧房，必須自己維護(hù)數(shù)據(jù)schema。
（Flink 1.10開始正式在Table API中支持Catalog绍绘，用于外部元數(shù)據(jù)對(duì)接奶镶。）
可行方案：

外部存儲(chǔ)（e.g. MySQL） + Flink ExternalCatalog
Hive metastore + Flink HiveCatalog（與上一種方案本質(zhì)相同，但是借用Hive的表描述與元數(shù)據(jù)體系）
Confluent Schema Registry (CSR) + Kafka Avro Serializer/Deserializer
現(xiàn)在仍然糾結(jié)中陪拘。

CSR是開源的元數(shù)據(jù)注冊(cè)中心厂镇，能與Kafka無縫集成，支持RESTful風(fēng)格管理左刽。producer和consumer通過Avro序列化/反序列化來利用元數(shù)據(jù)捺信。

SQL作業(yè)管理

必要性：
實(shí)時(shí)數(shù)倉(cāng)平臺(tái)展現(xiàn)給分析人員的開發(fā)界面應(yīng)該是類似Hue的交互式查詢UI，即用戶寫標(biāo)準(zhǔn)SQL，在平臺(tái)上提交作業(yè)并返回結(jié)果迄靠，底層是透明的秒咨。
但僅靠Flink SQL無法實(shí)現(xiàn)，需要我們自行填補(bǔ)這個(gè)gap掌挚。
可行方案：AthenaX（由Uber開源）
該項(xiàng)目比較老舊雨席，是基于Flink 1.5構(gòu)建的，預(yù)計(jì)需要花比較多的時(shí)間精力來搞二次開發(fā)吠式。

流程：用戶提交SQL → 通過Catalog獲取元數(shù)據(jù) → 解釋陡厘、校驗(yàn)、優(yōu)化SQL → 編譯為Flink Table/SQL job → 部署到Y(jié)ARN集群并運(yùn)行 → 輸出結(jié)果

重點(diǎn)仍然是元數(shù)據(jù)問題：如何將AthenaX的Catalog與Flink的Catalog打通特占？

需要將外部元數(shù)據(jù)的對(duì)應(yīng)到Flink的TableDescriptor（包含connector糙置、format、schema三類參數(shù)）是目，進(jìn)而映射到相應(yīng)的TableFactory并注冊(cè)表罢低。

另外還需要控制SQL作業(yè)對(duì)YARN資源的占用，考慮用YARN隊(duì)列實(shí)現(xiàn)胖笛，視情況調(diào)整調(diào)度策略。

性能監(jiān)控

使用Flink Metrics宜岛，主要考慮兩點(diǎn)：

算子數(shù)據(jù)吞吐量（numRecordsInPerSecond/numRecordsOutPerSecond）
Kafka鏈路延遲（records-lag-max）→ 如果搞全鏈路延遲长踊，需要做數(shù)據(jù)血緣分析

其他方面待定（畢竟我不是專業(yè)搞監(jiān)控系統(tǒng)的）

數(shù)據(jù)質(zhì)量保證

手動(dòng)對(duì)數(shù)——旁路寫明細(xì)表，定期與數(shù)據(jù)源交叉驗(yàn)證
自動(dòng)監(jiān)控——數(shù)據(jù)指標(biāo)波動(dòng)告警 etc.

The End

民那晚安晚安萍倡。

炒雞感謝@小阿嫵提供思路~

最后編輯于：2020.03.21 18:22:13

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末身弊，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子列敲，更是在濱河造成了極大的恐慌阱佛，老刑警劉巖，帶你破解...
沈念sama閱讀 221,198評(píng)論 6贊 514
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件戴而，死亡現(xiàn)場(chǎng)離奇詭異凑术，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)所意，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,334評(píng)論 3贊 398
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門淮逊，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人扶踊，你說我怎么就攤上這事泄鹏。” “怎么了秧耗？”我有些...
開封第一講書人閱讀 167,643評(píng)論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵备籽，是天一觀的道長(zhǎng)。經(jīng)常有香客問我分井，道長(zhǎng)车猬，這世上最難降的妖魔是什么霉猛？我笑而不...
開封第一講書人閱讀 59,495評(píng)論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮诈唬，結(jié)果婚禮上韩脏，老公的妹妹穿的比我還像新娘。我一直安慰自己铸磅，他們只是感情好赡矢，可當(dāng)我...
茶點(diǎn)故事閱讀 68,502評(píng)論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著阅仔，像睡著了一般吹散。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上八酒，一...
開封第一講書人閱讀 52,156評(píng)論 1贊 308
城市分裂傳說
那天空民，我揣著相機(jī)與錄音，去河邊找鬼羞迷。笑死界轩，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的衔瓮。我是一名探鬼主播浊猾，決...
沈念sama閱讀 40,743評(píng)論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼热鞍！你這毒婦竟也來了葫慎？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,659評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤薇宠，失蹤者是張志新（化名）和其女友劉穎偷办，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體澄港，經(jīng)...
沈念sama閱讀 46,200評(píng)論 1贊 319
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡椒涯，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,282評(píng)論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了回梧。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片逐工。...
茶點(diǎn)故事閱讀 40,424評(píng)論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖漂辐，靈堂內(nèi)的尸體忽然破棺而出泪喊，到底是詐尸還是另有隱情，我是刑警寧澤髓涯，帶...
沈念sama閱讀 36,107評(píng)論 5贊 349
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布袒啼，位于F島的核電站，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏蚓再。R本人自食惡果不足惜滑肉，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,789評(píng)論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望摘仅。院中可真熱鬧靶庙，春花似錦、人聲如沸娃属。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,264評(píng)論 0贊 23
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽矾端。三九已至掏击，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間秩铆，已是汗流浹背砚亭。一陣腳步聲響...
開封第一講書人閱讀 33,390評(píng)論 1贊 271
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留殴玛，地道東北人捅膘。一個(gè)月前我還...
沈念sama閱讀 48,798評(píng)論 3贊 376
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像滚粟，于是被迫代替她去往敵國(guó)和親寻仗。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,435評(píng)論 2贊 359