說說數(shù)倉(6)-關(guān)于命名規(guī)范


數(shù)倉總結(jié)目錄:
說說數(shù)倉(1) - 什么是數(shù)倉
說說數(shù)倉(2) - 傳統(tǒng)數(shù)倉與互聯(lián)網(wǎng)數(shù)倉
說說數(shù)倉(3) - 數(shù)倉架構(gòu)
說說數(shù)倉(4) - 指標字典
說說數(shù)倉(5)-最重要的維度之日期維度
說說數(shù)倉(6)-關(guān)于命名規(guī)范
說說數(shù)倉(7)-淺談數(shù)據(jù)治理
說說數(shù)倉(8)-關(guān)于增量
說說數(shù)倉(9)-上下游約定
說說數(shù)倉(10)-任務注釋


話說措嵌,沒有規(guī)矩不成方圓躲叼。在搭建數(shù)據(jù)平臺的時候,在數(shù)據(jù)組內(nèi)部企巢,一定要先制定好各種規(guī)范枫慷,越早越好,并且不斷的監(jiān)督大家是否按照約定執(zhí)行浪规。一旦讓大家自由發(fā)揮或听,后期想要統(tǒng)一或者重構(gòu),會浪費很大的人力成本和時間成本笋婿,記住誉裆,這都是坑。

這里以我目前公司的一些經(jīng)驗缸濒,分享下足丢。

關(guān)于項目

常規(guī)來說,數(shù)倉的建設是按照數(shù)倉分層模型開發(fā)的绍填。也有會按照業(yè)務線來分層霎桅,在各自業(yè)務線下重新分層,單獨開發(fā)的讨永。
我這里使用的是阿里云的MaxCompute滔驶,這是阿里提供的數(shù)據(jù)平臺,一整套開發(fā)環(huán)境卿闹,用起來還是很方便的揭糕,省去了自建平臺的麻煩。MaxCompute里面有一個項目的概念锻霎,一開始本來打算直接根據(jù)分層模型的設計來創(chuàng)建項目著角,但是由于某種原因,改成了按照業(yè)務線來創(chuàng)建項目旋恼。對于這個項目名吏口,一定要想好,不管根據(jù)什么來設計冰更,都需要想清楚产徊,想明白,定了以后就不要再改了蜀细,也沒法改舟铜。

關(guān)于詞根

我忘記是不是叫“詞根”了,先寫著奠衔,后面找本書確認下谆刨。詞根屬于數(shù)倉建設中的規(guī)范塘娶,屬于元數(shù)據(jù)管理的范疇。哦刁岸,現(xiàn)在都把這個劃到數(shù)據(jù)治理的一部分生兆。

正常來說,完整的數(shù)倉建設是包含數(shù)據(jù)治理的,只是現(xiàn)在談到數(shù)倉偏向于數(shù)據(jù)建模员淫,而談到數(shù)據(jù)治理介返,更多的是關(guān)于數(shù)據(jù)規(guī)范、數(shù)據(jù)管理刃宵。

接著說我們的主角-詞根徘公。
我們學習英語的時候應該有了解過詞根這個東西关面,它就是最細粒度的最簡單的一個詞語,我們主要用來規(guī)范中文和英文的映射關(guān)系捂齐。我們公司一部分業(yè)務是關(guān)于貨架的缩抡,英文名是:rack,rack就是一個詞根压真,那我們就在所有的表榴都、字段等用到的地方都叫rack漠其,不要叫成別的什么竿音。這就是詞根的作用春瞬,用來統(tǒng)一命名套啤,表達同一個含義。
指標體系中有很多“率”的指標萄涯,都可以拆解成XXX+率涝影,率可以叫rate争占,那我們所有的指標都叫做XXX+rate。
詞根可以用來統(tǒng)一表名伯襟、字段名姆怪、主題域名等等舆瘪。

表名

表名需要見名知意,通過表名就可以知道它是哪個業(yè)務域英古,干嘛用的,什么粒度的數(shù)據(jù)膨桥。

  • 常規(guī)表
    常規(guī)表是我們需要固化的表只嚣,是正式使用的表,是目前一段時間內(nèi)需要去維護去完善的表册舞。
    規(guī)范:分層前綴[dwd|dws|ads|bi]_業(yè)務域_主題域_XXX_粒度
    業(yè)務域调鲸、主題域我們都可以用詞根的方式枚舉清楚,不斷完善藐石,粒度也是同樣的,主要的是時間粒度于微、日株依、月、年雷滚、周等吗坚,使用詞根定義好簡稱呆万。

  • 中間表
    中間表一般出現(xiàn)在Job中谋减,是Job中臨時存儲的中間數(shù)據(jù)的表,中間表的作用域只限于當前Job執(zhí)行過程中庄吼,Job一旦執(zhí)行完成严就,該中間表的使命就完成了,是可以刪除的(按照自己公司的場景自由選擇渐行,以前公司會保留幾天的中間表數(shù)據(jù)祟印,用來排查問題)粟害。
    規(guī)范:mid_table_name_[0~9|dim]
    table_name是我們?nèi)蝿罩心繕吮淼拿郑ǔ碚f一個任務只有一個目標表悲幅。
    這里加上表名,是為了防止自由發(fā)揮的時候表名沖突芋哭,而末尾大家可以選擇自由發(fā)揮,起一些有意義的名字减牺,或者簡單粗暴,使用數(shù)字代替肥隆,各有優(yōu)劣吧栋艳,謹慎選擇句各。
    通常會遇到需要補全維度的表,這里我喜歡使用dim結(jié)尾矾屯。

中間表在創(chuàng)建時初厚,請加上 ,如果要保留歷史的中間表,可以加上日期或者時間戳

drop table if exists table_name;
create table_name as xxx;
  • 臨時表
    臨時表是臨時測試的表排作,是臨時使用一次的表亚情,就是暫時保存下數(shù)據(jù)看看势似,后續(xù)一般不再使用的表,是可以隨時刪除的表障簿。
    規(guī)范:tmp_xxx
    只要加上tmp開頭即可栅迄,其他名字隨意,
    注意tmp開頭的表不要用來實際使用,只是測試驗證而已愈腾。

  • 維度表
    維度表是基于底層數(shù)據(jù)岂津,抽象出來的描述類的表。維度表可以自動從底層表抽象出來橱乱,也可以手工來維護泳叠。
    規(guī)范:dim_xxx
    維度表茶宵,統(tǒng)一以dim開頭,后面加上种蝶,對該指標的描述蛤吓,可以自由發(fā)揮糠赦。

  • 手工表
    手工表是手工維護的表拙泽,手工初始化一次之后顾瞻,一般不會自動改變德绿,后面變更,也是手工來維護蕴纳。
    一般來說古毛,手工的數(shù)據(jù)粒度是偏細的,所以嫂冻,暫時我們統(tǒng)一放在dwd層塞椎,后面如果有目標值或者其他類型手工數(shù)據(jù)案狠,再根據(jù)實際情況分層。
    規(guī)范:dwd_業(yè)務域_manual_xxx
    手工表伴嗡,增加特殊的主題域瘪校,manual名段,表示手工維護表

指標

指標的命名也參考詞根阱扬,避免出現(xiàn)同一個指標麻惶,10個人有10個命名方法窃蹋。

后記

具體操作結(jié)合公司實際情況静稻,規(guī)范及早制定。

附上之前我們再阿里DataWorks上的一個規(guī)范示例

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市树酪,隨后出現(xiàn)的幾起案子续语,更是在濱河造成了極大的恐慌厦画,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,820評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件焚虱,死亡現(xiàn)場離奇詭異鹃栽,居然都是意外死亡民鼓,警方通過查閱死者的電腦和手機丰嘉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評論 3 399
  • 文/潘曉璐 我一進店門饮亏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來路幸,“玉大人付翁,你說我怎么就攤上這事简肴。” “怎么了百侧?”我有些...
    開封第一講書人閱讀 168,324評論 0 360
  • 文/不壞的土叔 我叫張陵砰识,是天一觀的道長。 經(jīng)常有香客問我佣渴,道長仍翰,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,714評論 1 297
  • 正文 為了忘掉前任观话,我火速辦了婚禮,結(jié)果婚禮上越平,老公的妹妹穿的比我還像新娘频蛔。我一直安慰自己,他們只是感情好秦叛,可當我...
    茶點故事閱讀 68,724評論 6 397
  • 文/花漫 我一把揭開白布晦溪。 她就那樣靜靜地躺著,像睡著了一般修噪。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上脏款,一...
    開封第一講書人閱讀 52,328評論 1 310
  • 那天剃盾,我揣著相機與錄音,去河邊找鬼闰歪。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播彪笼,決...
    沈念sama閱讀 40,897評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼泵肄,長吁一口氣:“原來是場噩夢啊……” “哼品追!你這毒婦竟也來了银还?” 一聲冷哼從身側(cè)響起戒财,我...
    開封第一講書人閱讀 39,804評論 0 276
  • 序言:老撾萬榮一對情侶失蹤幽崩,失蹤者是張志新(化名)和其女友劉穎慌申,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,345評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡冀膝,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,431評論 3 340
  • 正文 我和宋清朗相戀三年论笔,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,561評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡犯建,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情嗦随,我是刑警寧澤,帶...
    沈念sama閱讀 36,238評論 5 350
  • 正文 年R本政府宣布呜舒,位于F島的核電站到腥,受9級特大地震影響啤咽,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,928評論 3 334
  • 文/蒙蒙 一埃儿、第九天 我趴在偏房一處隱蔽的房頂上張望剃斧。 院中可真熱鬧根蟹,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,417評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽贪庙。三九已至这橙,卻和暖如春屈扎,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背忍疾。 一陣腳步聲響...
    開封第一講書人閱讀 33,528評論 1 272
  • 我被黑心中介騙來泰國打工膝昆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留收叶,地道東北人蜓萄。 一個月前我還...
    沈念sama閱讀 48,983評論 3 376
  • 正文 我出身青樓绸硕,卻偏偏與公主長得像烦秩,于是被迫代替她去往敵國和親墩剖。 傳聞我的和親對象是個殘疾皇子猴凹,可洞房花燭夜當晚...
    茶點故事閱讀 45,573評論 2 359

推薦閱讀更多精彩內(nèi)容