數(shù)倉總結(jié)目錄:
說說數(shù)倉(1) - 什么是數(shù)倉
說說數(shù)倉(2) - 傳統(tǒng)數(shù)倉與互聯(lián)網(wǎng)數(shù)倉
說說數(shù)倉(3) - 數(shù)倉架構(gòu)
說說數(shù)倉(4) - 指標字典
說說數(shù)倉(5)-最重要的維度之日期維度
說說數(shù)倉(6)-關(guān)于命名規(guī)范
說說數(shù)倉(7)-淺談數(shù)據(jù)治理
說說數(shù)倉(8)-關(guān)于增量
說說數(shù)倉(9)-上下游約定
說說數(shù)倉(10)-任務(wù)注釋
我忘記是在哪里看到慢显,還是自以為的,反正目前我依然是這么想的:
廣義數(shù)據(jù)倉庫的建設(shè)包含很多的解決方案泰涂,其中就包含數(shù)據(jù)治理拦宣,數(shù)據(jù)治理也是貫穿整個項目始終的,是一件長久的事情。
現(xiàn)在很多人都把數(shù)據(jù)倉庫簡單的理解成數(shù)據(jù)建模了适篙。
數(shù)據(jù)治理包含很多的事情,我也沒做過箫爷,所以在網(wǎng)上找些資料分享下嚷节。
為什么要做數(shù)據(jù)治理
隨著數(shù)據(jù)量越來越大聂儒,數(shù)據(jù)成為一種資產(chǎn),我們需要更好地管理這些數(shù)據(jù)硫痰,更好地體現(xiàn)數(shù)據(jù)的價值衩婚,這就需要數(shù)據(jù)治理。
其實在搭建數(shù)據(jù)平臺的時候碍论,我們遇到的一系列問題都可以通過數(shù)據(jù)治理來解決:
- 數(shù)據(jù)質(zhì)量越來越差谅猾,問題發(fā)現(xiàn)嚴重滯后
- 缺少數(shù)據(jù)標準柄慰,各個部門標準不統(tǒng)一
- 數(shù)據(jù)變更對下游的影響不清晰鳍悠,無法確認影響范圍
什么是數(shù)據(jù)治理
數(shù)據(jù)治理(Data Governance),是一套持續(xù)改善管理機制坐搔,通常包括了數(shù)據(jù)架構(gòu)組織藏研、數(shù)據(jù)模型、政策及體系制定概行、技術(shù)工具蠢挡、數(shù)據(jù)標準、數(shù)據(jù)質(zhì)量凳忙、影響度分析业踏、作業(yè)流程、監(jiān)督及考核流程等內(nèi)容涧卵。
簡單來說就是有很多流程和標準勤家,像“元數(shù)據(jù)管理”、“主數(shù)據(jù)管理”柳恐、“數(shù)據(jù)質(zhì)量”都包含其中伐脖。
通過數(shù)據(jù)治理來解決我們使用數(shù)據(jù)的過程中遇到的問題。
- 數(shù)據(jù)標準
各種各樣的規(guī)范:命名規(guī)范乐设,數(shù)據(jù)定義讼庇,數(shù)據(jù)類型,前面我有說過這個問題近尚,這里提到了“詞素”這個概念蠕啄,我前面管它叫詞根了,說說數(shù)倉(6)-關(guān)于命名規(guī)范
標準規(guī)范這東西戈锻,好是好歼跟,不過冷不丁一看還是頭大,先整理這些舶沛,后面緩過來繼續(xù)嘹承。
可以參考IBM的文章:大數(shù)據(jù)治理系列
-- 未完待續(xù)