數(shù)倉(cāng)--DW--Hadoop數(shù)倉(cāng)實(shí)踐Case-08-退化維度

退化維度概述

  • 退化維度固歪,該技術(shù)減少維度的數(shù)量, 簡(jiǎn)化維度數(shù)據(jù)倉(cāng)庫(kù)模式胯努。 簡(jiǎn)單的模式比復(fù)雜的更容易理解牢裳, 也有更好的查詢性能。
  • 有時(shí)叶沛, 維度表中除了業(yè)務(wù)主鍵外沒(méi)有其他內(nèi)容蒲讯。 例如, 在我們的銷售訂單示例中灰署, 訂單維度表除了訂單號(hào)判帮, 沒(méi)有任何其他屬性, 而訂單號(hào)是事務(wù)表的主鍵溉箕。 我們將這種維度稱為退化維度晦墙。 業(yè)務(wù)系統(tǒng)中的主鍵通常是不允許修改的。 銷售訂單只能新增肴茄, 不能修改已經(jīng)存在的訂單號(hào)晌畅, 也不會(huì)刪除訂單記錄。 因此訂單維度表也不會(huì)有歷史數(shù)據(jù)版本問(wèn)題寡痰。 退化維度常見(jiàn)于事務(wù)和累積快照事實(shí)表中抗楔。
  • 銷售訂單事實(shí)表中的每行記錄都包括作為退化維度的訂單號(hào)代理鍵。 在操作型系統(tǒng)中拦坠, 銷售訂單表是最細(xì)節(jié)事務(wù)表连躏, 訂單號(hào)是訂單表的主鍵, 每條訂單都可以通過(guò)訂單號(hào)定位贞滨, 訂單中的其他屬性反粥, 如客戶、 產(chǎn)品等, 都依賴于訂單號(hào)才顿。 也就是說(shuō),訂單號(hào)把與訂單屬性有關(guān)的表聯(lián)系起來(lái)尤蒿。 但是郑气, 在維度模型中, 事實(shí)表中的訂單號(hào)代理鍵通常與訂單屬性的其他表沒(méi)有關(guān)聯(lián)腰池。 可以將訂單事實(shí)表所有關(guān)心的屬性分類到不同的維度中尾组, 例如, 訂單日期關(guān)聯(lián)到日期維度示弓, 客戶關(guān)聯(lián)到客戶維度等讳侨。 在事實(shí)表中保留訂單號(hào)最主要的原因是用于連接數(shù)據(jù)倉(cāng)庫(kù)與操作型系統(tǒng), 它也可以起到事實(shí)表主鍵的作用奏属。 某些情況下跨跨, 可能會(huì)有一個(gè)或兩個(gè)屬性仍然屬于訂單而不屬于其他維度。 當(dāng)然囱皿, 此時(shí)訂單維度就不再是退化維度了勇婴。
  • 退化維度通常被保留作為操作型事務(wù)的標(biāo)識(shí)符。 實(shí)際上可以將訂單號(hào)作為一個(gè)屬性加入到事實(shí)表中嘱腥。 這樣訂單維度就沒(méi)有數(shù)據(jù)倉(cāng)庫(kù)需要的任何數(shù)據(jù)耕渴, 此時(shí)就可以退化訂單維度。 需要把退化維度的相關(guān)數(shù)據(jù)遷移到事實(shí)表中齿兔, 然后刪除退化的維度橱脸。
  • 注意, 操作型事務(wù)中的控制號(hào)碼分苇, 例如添诉, 訂單號(hào)碼、 發(fā)票號(hào)碼组砚、 提貨單號(hào)碼等通常產(chǎn)生空的維度并且表示為事務(wù)事實(shí)表中的退化維度吻商。

退化訂單維度

  • 使用維度退化技術(shù)時(shí)先要識(shí)別數(shù)據(jù), 分析從來(lái)不用的數(shù)據(jù)列糟红。 例如艾帐, 訂單維度的order_number列就可能是這樣的一列。 如果用戶想看事務(wù)的細(xì)節(jié)盆偿, 還需要訂單號(hào)柒爸。 因此, 在退化訂單維度前事扭, 要把訂單號(hào)遷移到sales_order_fact事實(shí)表捎稚。
    下圖為修改過(guò)的模式:


    退化訂單維度.PNG
  • 在實(shí)際開(kāi)發(fā)中,維度的退化,是需要在數(shù)倉(cāng)建模設(shè)計(jì)之前規(guī)劃好的今野,不建議在數(shù)倉(cāng)建設(shè)的途中進(jìn)行退化維度葡公,成本比較高。

  • 按順序執(zhí)行以下四步進(jìn)行維度退化条霜,source_order_dim維度退化催什。
    (1)給dw.sale_order_fact表添加order_number;
    (2)把source.source_order_dim中的訂單號(hào)遷移到dw.sale_order_fact表中宰睡;
    (3)刪除dw.sale_order_fact表中的order_sk蒲凶;
    (4)刪除source.source_order_dim表,維度退化完成拆内。

修改定期裝載腳本

  • 采用"騰籠換鳥(niǎo)"的方式將dw.sale_order_fact進(jìn)行替換旋圆、重寫(xiě)
    腳本如下:
-- 修改dw.sale_order_fact名稱,重命名
alter table dw.sale_order_fact rename to dw.sale_order_fact_old;
-- 創(chuàng)建新表麸恍,添加order_number列
create table 
    dw.sale_order_fact(
    order_number int comment 'order_number',
    customer_sk int comment 'customer surrogate key',
    product_sk int comment 'product surrogate key',
    order_date_sk string comment 'date surrogate key',
    request_delivery_date_sk int comment 'request_delivery_date_sk',
    order_amount decimal (10 , 2 ) comment'order amount',
    order_quantity int comment 'order_quantity'
    )
clustered by (order_number)
into 8 buckets
stored as orc tblproperties('transactional'='true');
-- 將數(shù)據(jù)插入到新建的表中
insert into table
    dw.sale_order_fact
select
    t2.order_number,
    t1.customer_sk,
    t1.product_sk,
    t1.order_date_sk,
    t1.request_delivery_date_sk,
    t1.order_amount,
    t1.order_quantity
from 
    dw.sale_order_fact_old t1
inner join
    source.source_order_dim t2
on
    t1.order_sk=t2.order_key;
-- 刪除舊表中的數(shù)據(jù)
drop table dw.sale_order_fact_old;
  • 語(yǔ)句說(shuō)明灵巧,語(yǔ)句的策略就是將老的數(shù)據(jù)重新加載到新定義的規(guī)則中。
  • 另外需要對(duì)定期裝載腳本進(jìn)行修改或南,不需要再裝載source.source_order_dim了孩等。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市采够,隨后出現(xiàn)的幾起案子肄方,更是在濱河造成了極大的恐慌,老刑警劉巖蹬癌,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件权她,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡逝薪,警方通過(guò)查閱死者的電腦和手機(jī)隅要,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)董济,“玉大人步清,你說(shuō)我怎么就攤上這事÷采觯” “怎么了廓啊?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)封豪。 經(jīng)常有香客問(wèn)我谴轮,道長(zhǎng),這世上最難降的妖魔是什么吹埠? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任第步,我火速辦了婚禮疮装,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘粘都。我一直安慰自己廓推,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布翩隧。 她就那樣靜靜地躺著受啥,像睡著了一般。 火紅的嫁衣襯著肌膚如雪鸽心。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,146評(píng)論 1 297
  • 那天居暖,我揣著相機(jī)與錄音顽频,去河邊找鬼。 笑死太闺,一個(gè)胖子當(dāng)著我的面吹牛糯景,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播省骂,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼蟀淮,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了钞澳?” 一聲冷哼從身側(cè)響起怠惶,我...
    開(kāi)封第一講書(shū)人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎轧粟,沒(méi)想到半個(gè)月后策治,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡兰吟,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年通惫,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片混蔼。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡履腋,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出惭嚣,到底是詐尸還是另有隱情遵湖,我是刑警寧澤,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布料按,位于F島的核電站奄侠,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏载矿。R本人自食惡果不足惜垄潮,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一烹卒、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧弯洗,春花似錦旅急、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至逃贝,卻和暖如春谣辞,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背沐扳。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工泥从, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人沪摄。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓躯嫉,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親杨拐。 傳聞我的和親對(duì)象是個(gè)殘疾皇子祈餐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容