電商數(shù)倉(cāng)架構(gòu)介紹

1.數(shù)倉(cāng)分層概述

數(shù)據(jù)倉(cāng)庫(kù)分為三層卖宠,自下而上為:
數(shù)據(jù)引入層(ODS,Operation Data Store)
數(shù)據(jù)公共層(CDM枫浙,Common Data Model)
數(shù)據(jù)應(yīng)用層(ADS泛范,Application Data Service)

  • 數(shù)據(jù)引入層(ODS,Operation Data Store):將原始數(shù)據(jù)幾乎無(wú)處理的存放在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)诅炉,結(jié)構(gòu)上與源系統(tǒng)基本保持一致,是數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)準(zhǔn)備區(qū)屋厘。
  • 數(shù)據(jù)公共層(CDM涕烧,Common Data Model,又稱通用數(shù)據(jù)模型層)汗洒,包含DIM維度表议纯、DWD和 DWS,由ODS層數(shù)據(jù)加工而成溢谤。主要完成數(shù)據(jù)加工與整合瞻凤,建立一致性的維度,構(gòu)建可復(fù)用的面向分析和統(tǒng)計(jì)的明細(xì)事實(shí)表世杀,以及匯總公共粒度的指標(biāo)阀参。這一層里又包括三層:
    1.公共維度層(DIM):全拼dimension
    ,基于維度建模理念思想瞻坝,建立整個(gè)企業(yè)的一致性維度结笨。降低數(shù)據(jù)計(jì)算口徑和算法不統(tǒng)一風(fēng)險(xiǎn)。公共維度層的表通常也被稱為邏輯維度表湿镀,維度和維度邏輯表通常一一對(duì)應(yīng)。
    2.數(shù)倉(cāng)明細(xì)層(DWD):全拼data warehouse detail
    大體作用:ods經(jīng)過(guò)清洗伐憾,落地這一層勉痴,一般是最細(xì)粒度。
    具體:以業(yè)務(wù)過(guò)程作為建模驅(qū)動(dòng)树肃,基于每個(gè)具體的業(yè)務(wù)過(guò)程特點(diǎn)蒸矛,構(gòu)建最細(xì)粒度的明細(xì)層事實(shí)表。可以結(jié)合企業(yè)的數(shù)據(jù)使用特點(diǎn)雏掠,將明細(xì)事實(shí)表的某些重要維度屬性字段做適當(dāng)冗余斩祭,也即寬表化處理。明細(xì)粒度事實(shí)層的表通常也被稱為邏輯事實(shí)表乡话。
    3.數(shù)據(jù)匯總層(DWS):全拼data warehouse service
    大體作用:對(duì)dwd的輕微聚合摧玫,對(duì)一些可累加的指標(biāo)進(jìn)行聚合,增加復(fù)用性
    具體:以分析的主題對(duì)象作為建模驅(qū)動(dòng)绑青,基于上層的應(yīng)用和產(chǎn)品的指標(biāo)需求诬像,構(gòu)建公共粒度的匯總指標(biāo)事實(shí)表,以寬表化手段物理化模型闸婴。構(gòu)建命名規(guī)范坏挠、口徑一致的統(tǒng)計(jì)指標(biāo),為上層提供公共指標(biāo)邪乍,建立匯總寬表降狠、明細(xì)事實(shí)表。公共匯總粒度事實(shí)層的表通常也被稱為匯總邏輯表庇楞,用于存放派生指標(biāo)數(shù)據(jù)榜配。
  • 數(shù)據(jù)應(yīng)用層(ADS,Application Data Service):存放數(shù)據(jù)產(chǎn)品個(gè)性化的統(tǒng)計(jì)指標(biāo)數(shù)據(jù)姐刁。根據(jù)CDM與ODS層加工生成
2.數(shù)倉(cāng)開(kāi)發(fā)規(guī)范

2.1 數(shù)據(jù)庫(kù)命名
命名規(guī)則:數(shù)倉(cāng)對(duì)應(yīng)分層_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}
命名示例:ods_nshop/dwd_nshop/dws_nshop/dim_nshop/ads_nshop/
2.2 數(shù)倉(cāng)各層對(duì)應(yīng)數(shù)據(jù)庫(kù)
ods/sda層 -> sda/ods_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}(原始數(shù)據(jù))
dw層 -> dwd_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目} (主題) + dws_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}(基于主題寬表匯總)
dim層 -> dim_維度 (維表庫(kù))
ads層 -> ads_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目} (應(yīng)用統(tǒng)計(jì)指標(biāo)等)
middle層 -> mid_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}(中間庫(kù)) 臨時(shí)數(shù)據(jù) -> temp_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}(臨時(shí)庫(kù))
2.3 數(shù)據(jù)庫(kù)表命名規(guī)則

  • 原始數(shù)據(jù)層
    命名規(guī)則:
    ods_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}_{數(shù)據(jù)來(lái)源類型}_{業(yè)務(wù)}
    ods_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}_{數(shù)據(jù)來(lái)源類型}_{業(yè)務(wù)}_{時(shí)間粒度}_delta
    delta代表增量芥牌,主要用于數(shù)據(jù)同步方向產(chǎn)生的原始數(shù)據(jù)表
    命名示例:
    ods_nshop_01_useractlog XX用戶日志原始數(shù)據(jù)表
    ods_nshop_02_user XX用戶表(全量)
    ods_nshop_02_user_delta XX用戶表(增量)
    ods_nshop_02_user_hh_delta XX用戶表(小時(shí)級(jí)增量 dd天)
  • 主題/事實(shí)數(shù)據(jù)層
    命名規(guī)則:
    dwd_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}_{主題域}_{子業(yè)務(wù)}
    命名示例:
    dwd_nshop_user_logproview XX用戶產(chǎn)品瀏覽日志事實(shí)表
    dwd_nshop_user_comment XX用戶關(guān)注事實(shí)表
  • 主題/事實(shí)匯總層
    命名規(guī)則:
    dws_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}_{主題域}_{匯總相關(guān)粒度}_{匯總時(shí)間周期}
    命名示例:
    dws_nshop_user_order_nd XX用戶訂單匯總N天統(tǒng)計(jì)表
    dws_nshop_user_cmtpro_nd XX用戶產(chǎn)品關(guān)注匯總N天統(tǒng)計(jì)表
  • 維表層
    命名規(guī)則:
    dim_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目|pub公共}_{維度}
    命名示例:
    dim_pub_date 時(shí)間維表
    dim_pub_area 地區(qū)維表
    dim_pub_category 商品分類
  • 集市層
    命名規(guī)則:ads_{業(yè)務(wù)線|業(yè)務(wù)項(xiàng)目}_{統(tǒng)計(jì)業(yè)務(wù)}_{報(bào)表form|熱門排序topN}
    命名示例:
    ads_nshop_order_form 訂單統(tǒng)計(jì)表 ads_nshop_orderpay_form 訂單支付統(tǒng)計(jì)
  • 數(shù)據(jù)來(lái)源說(shuō)明
    01 -> hdfs數(shù)據(jù) ods_nshop.ods_01_action_log 行為日志表
    02 -> mysql數(shù)據(jù) ods_nshop.ods_02_user 用戶表
    03 -> redis數(shù)據(jù)
    04 -> mongodb數(shù)據(jù)
    05 -> tidb數(shù)據(jù)
3.數(shù)據(jù)來(lái)源介紹

3.1 業(yè)務(wù)數(shù)據(jù)
業(yè)務(wù)數(shù)據(jù)往往產(chǎn)生于事務(wù)型過(guò)程處理,所以一般存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)中聂使,如mysql壁拉、oracle
業(yè)務(wù)數(shù)據(jù)源: 用戶基本信息、商品分類信息柏靶、商品信息弃理、店鋪信息、訂單數(shù)據(jù)屎蜓、訂單支付信息痘昌、活動(dòng)信息、物流信息等
3.2 埋點(diǎn)日志
埋點(diǎn)日志相對(duì)業(yè)務(wù)數(shù)據(jù)是用于數(shù)據(jù)分析炬转、挖掘需求辆苔,一般以日志形式存儲(chǔ)于日志文件中,隨后通過(guò)采集落地 分布式存儲(chǔ)介質(zhì)中如hdfs扼劈、hbase
用戶行為日志: 用戶瀏覽驻啤、用戶點(diǎn)評(píng)、用戶關(guān)注荐吵、用戶搜索骑冗、用戶投訴赊瞬、用戶咨詢
3.3 外部數(shù)據(jù)
當(dāng)前一般公司都會(huì)通過(guò)線上廣告來(lái)進(jìn)行獲客,與三方公司合作更多的提取相關(guān)數(shù)據(jù)來(lái)進(jìn)行深度刻畫用戶及用 戶群體贼涩,另外爬取公共公開(kāi)數(shù)據(jù)也是分析運(yùn)營(yíng)的常用方式巧涧。
外部數(shù)據(jù)源: 廣告投放數(shù)據(jù)、爬蟲(chóng)數(shù)據(jù)遥倦、三方接口數(shù)據(jù)

4.數(shù)倉(cāng)建設(shè)

4.1 ODS貼源層

1.ODS層存放您從業(yè)務(wù)系統(tǒng)獲取的最原始的數(shù)據(jù)谤绳,是其他上層數(shù)據(jù)的源數(shù)據(jù)。
2.ODS層數(shù)據(jù)主要包括:用戶基本信息谊迄、商品分類信息闷供、商品信息、店鋪信息统诺、 訂單數(shù)據(jù)歪脏、訂單支付信息、活動(dòng)信息粮呢、行為日志信息

  • MySQL業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)Hive表
中文含義 MYSQL表名 HIVE表名
用戶基本信息表 nshop.customer ods_nshop.ods_nshop_02_customer
用戶關(guān)注表 nshop.customer_attention ods_nshop.ods_nshop_02_customer_attention
收貨地址管理表 nshop.customer_consignee ods_nshop.ods_nshop_02_customer_consignee
訂單表 nshop.orders ods_nshop.ods_nshop_02_orders
訂單詳情表 nshop.order_detail ods_nshop.ods_nshop_02_order_detail
訂單支付記錄表 nshop.orders_pay_records ods_nshop.ods_nshop_02_orders_pay_records
  • 埋點(diǎn)日志對(duì)應(yīng)Hive表
中文含義 HIVE表名
用戶行為日志表 ods_nshop.ods_nshop_01_useractlog

電商平臺(tái)在網(wǎng)頁(yè)版或APP版終端上進(jìn)行業(yè)務(wù)埋點(diǎn)婿失,采集相關(guān)用戶行為數(shù)據(jù)發(fā)送給服務(wù)器進(jìn)行用戶行為分析。

  • 外部數(shù)據(jù)對(duì)應(yīng)Hive表
中文含義 HIVE表名
廣告投放信息表 ods_nshop.ods_nshop_01_releasedatas

外部數(shù)據(jù)來(lái)源主要有:
1 企業(yè)間的接口調(diào)用(如其他企業(yè)平臺(tái)上的廣告投放營(yíng)銷)
2 公共數(shù)據(jù)的爬蟲(chóng)數(shù)據(jù)(公共數(shù)據(jù)啄寡、友商數(shù)據(jù)豪硅、社區(qū)|社交平臺(tái)公開(kāi)數(shù)據(jù))

4.2 DW主題層

  • 主題劃分
    在不同的業(yè)務(wù)中,數(shù)倉(cāng)建設(shè)都會(huì)涉及到幾種類型的數(shù)據(jù):通用行為數(shù)據(jù)挺物、業(yè)務(wù)強(qiáng)相關(guān)的數(shù)據(jù)懒浮、通用行為衍生出的行為數(shù)據(jù)以及其它不易劃分的數(shù)據(jù):
    1 通用行為數(shù)據(jù)主題: 即各業(yè)務(wù)場(chǎng)景都容易出現(xiàn)行為,比如用戶行為日志中的曝光识藤、點(diǎn)擊和下載等砚著。
    2 業(yè)務(wù)行為數(shù)據(jù)主題: 主要是指和業(yè)務(wù)強(qiáng)相關(guān)的行為,比如說(shuō)電商下單業(yè)務(wù)痴昧,視頻業(yè)務(wù)中有播放行為稽穆。
    3 衍生行為數(shù)據(jù)主題: 主要是指非用戶原始的行為,比如說(shuō)留存赶撰,本身是由用戶活躍來(lái)描述的舌镶。
    4 其它行為數(shù)據(jù)主題: 有一些多主題交叉的數(shù)據(jù),比如跨業(yè)務(wù)和行為的閱讀帶來(lái)的購(gòu)買行為數(shù)據(jù)主題
    電商項(xiàng)目中所涉及的主題包括:
    【用戶主題】-> 衍生行為數(shù)據(jù)主題(更多的)
    【交易主題】-> 業(yè)務(wù)行為數(shù)據(jù)主題
    【營(yíng)銷活動(dòng)主題】-> 業(yè)務(wù)行為數(shù)據(jù)主題
    【事件(行為日志)主題】-> 通用行為數(shù)據(jù)主題

  • 主題概述
    描述:DW層分為DWD和DWS層豪娜,是數(shù)據(jù)倉(cāng)庫(kù)維度建模的核心餐胀,需緊繞業(yè) 務(wù)過(guò)程來(lái)設(shè)計(jì)。
    示例: 用戶產(chǎn)品瀏覽主題

CREATE external TABLE
IF NOT EXISTS dwd_nshop.dwd_nshop_actlog_product_view (
    user_id string COMMENT '用戶id',
    os string COMMENT '手機(jī)系統(tǒng)',
    os_version string COMMENT '手機(jī)系統(tǒng)版本',
    manufacturer string COMMENT '手機(jī)制造商',
    carrier string COMMENT '電信運(yùn)營(yíng)商',
    network_type string COMMENT '網(wǎng)絡(luò)類型',
    area_code string COMMENT '地區(qū)編碼',
    target_id string COMMENT '產(chǎn)品ID',
    ct BIGINT COMMENT '產(chǎn)生時(shí)間'
)

1 數(shù)據(jù)依賴: ODS層的用戶行為日志(ods_nshop.ods_nshop_01_useractlog)
2 哪些維度(包括關(guān)聯(lián)其他主題維度)瘤载、度量骂澄?
維度:
1 以用戶相關(guān)的維度【user_id、os惕虑、os_version坟冲、manufacturer等等】
2 關(guān)聯(lián)相關(guān)主題維度【target_id】
3 度量值 聚合操作(sum,count等等)

  • DWD明細(xì)層
    1.DWD概述
    明細(xì)粒度事實(shí)層以業(yè)務(wù)過(guò)程作為建模驅(qū)動(dòng),基于每個(gè)具體的業(yè)務(wù)過(guò)程特點(diǎn)溃蔫,構(gòu)建最細(xì)粒度的明細(xì)層事實(shí)表健提。可以結(jié)合企業(yè)的數(shù)據(jù)使用特點(diǎn)伟叛,將明細(xì)事實(shí)表的某些重要維度屬性字段做適當(dāng)冗余私痹,即寬表化處理. 明細(xì)粒度事實(shí)層(DWD)通常分為三種:事務(wù)事實(shí)表、周期快照事實(shí)表和累積快照事實(shí)表统刮。
    2 DWD中的信息有什么紊遵?
    事實(shí)表中一條記錄所表達(dá)的業(yè)務(wù)細(xì)節(jié)程度被稱為粒度。通常粒度可以通過(guò)兩種方式來(lái)表述:一種是維度屬性 組合所表示的細(xì)節(jié)程度侥蒙,一種是所表示的具體業(yè)務(wù)含義暗膜。
    作為度量業(yè)務(wù)過(guò)程的事實(shí),通常為整型或浮點(diǎn)型的十進(jìn)制數(shù)值鞭衩,有可加性学搜、半可加性和不可加性三種類型:
    (1) 可加性事實(shí)是指可以按照與事實(shí)表關(guān)聯(lián)的任意維度進(jìn)行匯總。
    示例:交易訂單記錄表中的【用戶ID】可以進(jìn)行count|distinct count匯總
    (2) 半可加性事實(shí)只能按照特定維度匯總论衍,不能對(duì)所有維度匯總瑞佩。
    示例:庫(kù)存可以按照地點(diǎn)和商品進(jìn)行匯總,而按時(shí) 間維度把一年中每個(gè)月的庫(kù)存累加則毫無(wú)意義坯台。 交易訂單記錄表中的【時(shí)間維度炬丸、地區(qū)維度】按照這類“自然屬性”的維度進(jìn)行統(tǒng)計(jì),在主題層沒(méi)有實(shí)際意 義蜒蕾,而偏統(tǒng)計(jì)報(bào)表類計(jì)算更多在DM層進(jìn)行匯總稠炬,或者在DWS層往往是以某個(gè)主題數(shù)據(jù)做核心,與其產(chǎn)生關(guān)系 的其他主題數(shù)據(jù)作為度量值來(lái)進(jìn)行統(tǒng)計(jì)匯總的滥搭。
    (3) 完全不可加性酸纲。
    示例:轉(zhuǎn)化率、比率型等事實(shí)瑟匆。

  • 事務(wù)事實(shí)表
    事務(wù)事實(shí)表用來(lái)描述業(yè)務(wù)過(guò)程闽坡,跟蹤空間或時(shí)間上某點(diǎn)的度量事件,保存的是最原子的數(shù)據(jù)愁溜,也稱為原子事 實(shí)表疾嗅。
    示例:交易訂單記錄表、廣告投放數(shù)據(jù)表冕象,這類數(shù)據(jù)本身是一個(gè)業(yè)務(wù)過(guò)程代承。

  • 周期快照事實(shí)表
    周期快照事實(shí)表中的每行匯總了發(fā)生在某一標(biāo)準(zhǔn)周期, 如一天渐扮、 一周或一月的多個(gè)度量论悴。 其粒度是周期 性的時(shí)間段掖棉, 而不是單個(gè)事務(wù)。周期快照事實(shí)表通常包含許多數(shù)據(jù)的總計(jì)膀估, 因?yàn)槿魏闻c事實(shí)表時(shí)間范圍一 致的記錄都會(huì)被包含在內(nèi)幔亥。
    示例:
    一個(gè)月|一周的銷售訂單周期快照, 用于按產(chǎn)品統(tǒng)計(jì)每個(gè)月總的銷售訂單金額和產(chǎn)品銷售數(shù)量

  • 累積快照事實(shí)表
    累積快照事實(shí)表用來(lái)表述過(guò)程開(kāi)始和結(jié)束之間的關(guān)鍵步驟事件察纯,覆蓋過(guò)程的整個(gè)生命周期帕棉,通常具有多個(gè)日 期字段來(lái)記錄關(guān)鍵時(shí)間點(diǎn)。當(dāng)累積快照事實(shí)表隨著生命周期不斷變化時(shí)饼记,記錄也會(huì)隨著過(guò)程的變化而被修 改香伴。
    具體實(shí)現(xiàn)方式:拉鏈表

  • DWS匯總層
    DWS是基于DWD數(shù)據(jù),以其中的主題信息為維度具则,以其他主題數(shù)據(jù)為統(tǒng)計(jì)度量的數(shù)據(jù)集合表
    示例:
    主題為【交易主題】下的訂單記錄
    粒度1:【order_id, order_status,payment_money, order_ctime】是訂單業(yè)務(wù)相關(guān)的維度信息
    粒度2:【customer_id】用戶主題相關(guān)即纲,另外與支付主題相關(guān)
    用戶主題的用戶啟動(dòng)日志表【DWD】建表示例:

CREATE external TABLE
IF NOT EXISTS dwd_nshop.dwd_nshop_actlog_launch (
    user_id string COMMENT '用戶id',
    device_num string COMMENT '設(shè)備號(hào)',
    device_type string COMMENT '設(shè)備類型',
    os string COMMENT '手機(jī)系統(tǒng)',
    os_version string COMMENT '手機(jī)系統(tǒng)版本',
    manufacturer string COMMENT '手機(jī)制造商',
    carrier string COMMENT '電信運(yùn)營(yíng)商',
    network_type string COMMENT '網(wǎng)絡(luò)類型',
    area_code string COMMENT '地區(qū)編碼',
    launch_time_segment string COMMENT '啟動(dòng)時(shí)間段',
    ct BIGINT COMMENT '產(chǎn)生時(shí)間'
) partitioned BY (bdp_day string) stored AS parquet location '/data/nshop/dw/user/dwd_nshop_actlog_launch/'

交易主題域的交易訂單明細(xì)流水表【DWD】示例:

CREATE external TABLE
IF NOT EXISTS dwd_nshop.dwd_nshop_orders_details (
    order_id string COMMENT '訂單ID',
    order_status INT COMMENT '訂單狀態(tài):5已收貨(完成)|6投訴 7退貨',
    supplier_code VARCHAR (20) NOT NULL COMMENT '店鋪ID',
    product_code VARCHAR (20) NOT NULL COMMENT '商品ID',
    device_type string COMMENT '設(shè)備類型',
    os string COMMENT '手機(jī)系統(tǒng)',
    os_version string COMMENT '手機(jī)系統(tǒng)版本',
    manufacturer string COMMENT '手機(jī)制造商',
    carrier string COMMENT '電信運(yùn)營(yíng)商',
    user_areacode string COMMENT '用戶所在地區(qū)',
    consignee_zipcode string COMMENT '收貨人地址',
    pay_type string COMMENT '支付類型:線上支付 10 網(wǎng)上銀行 11 微信 12 支付寶 | 線下支 付(貨到付款) 20 ',
    pay_count INT COMMENT '支付次數(shù)',
    product_price DECIMAL (5, 1) NOT NULL COMMENT '購(gòu)買商品單價(jià)',
    weighing_cost DECIMAL (2, 1) NOT NULL COMMENT '商品加權(quán)價(jià)格',
    district_money DECIMAL (4, 1) NOT NULL DEFAULT 0.0 COMMENT '優(yōu)惠金額',
    is_activity NOT NULL DEFAULT 0 COMMENT '1:參加活動(dòng)|0:沒(méi)有參加活動(dòng)',
    order_ctime BIGINT COMMENT '創(chuàng)建時(shí)間'
) partitioned BY (bdp_day string) stored AS parquet location '/data/nshop/dwd/order/dwd_nshop_orders_details/'

營(yíng)銷活動(dòng)主題的廣告投放數(shù)據(jù)表【DWD】示例:

CREATE external TABLE
IF NOT EXISTS dwd_nshop.dwd_nshop_releasedatas (
    customer_id string COMMENT '用戶id',
    device_num string COMMENT '設(shè)備號(hào)',
    device_type string COMMENT '設(shè)備類型',
    os string COMMENT '手機(jī)系統(tǒng)',
    os_version string COMMENT '手機(jī)系統(tǒng)版本',
    manufacturer string COMMENT '手機(jī)制造商',
    area_code string COMMENT '地區(qū)編碼',
    release_sid string COMMENT '投放請(qǐng)求id',
    release_ip string COMMENT '投放方ip',
    release_session string COMMENT '投放會(huì)話id',
    release_sources string COMMENT '投放渠道',
    release_category string COMMENT '投放瀏覽產(chǎn)品分類',
    release_product string COMMENT '投放瀏覽產(chǎn)品',
    release_product_page string COMMENT '投放瀏覽產(chǎn)品頁(yè)',
    ct BIGINT COMMENT '創(chuàng)建時(shí)間'
) partitioned BY (bdp_day string) stored AS parquet location '/data/nshop/dwd/release/dwd_nshop_releasedatas/'
  • DIM維表層
    MySQL業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的Hive表
中文含義 MYSQL表名 HIVE表名
商品分類表 nshop.category dim_nshop.dim_pub_category
店鋪表 nshop.supplier dim_nshop.dim_pub_supplier
商品表 nshop.product dim_nshop.dim_pub_product
頁(yè)面布局表 nshop.page_dim dim_nshop.dim_pub_page
通用字典表 nshop.comm_dim dim_nshop.dim_pub_comm
時(shí)間字典表 nshop.date_dim dim_nshop.dim_pub_date
地區(qū)字典表 nshop.area_dim dim_nshop.dim_pub_area
  • MID中間層
    用戶啟動(dòng)統(tǒng)計(jì)【MID】建表示例:
CREATE external TABLE
IF NOT EXISTS mid_nshop.mid_nshop_actlog_launch_timesegs (
    user_id string COMMENT '用戶id',
    os string COMMENT '手機(jī)系統(tǒng)',
    os_version string COMMENT '手機(jī)系統(tǒng)版本',
    manufacturer string COMMENT '手機(jī)制造商',
    carrier string COMMENT '電信運(yùn)營(yíng)商',
    network_type string COMMENT '網(wǎng)絡(luò)類型',
    area_code string COMMENT '地區(qū)編碼',
    launch_times string COMMENT '24bit表示24小時(shí)啟動(dòng)情況',
    launch_count INT COMMENT '用戶每天啟動(dòng)次數(shù)',
    ct BIGINT COMMENT '產(chǎn)生時(shí)間'
) partitioned BY (bdp_day string) stored AS parquet location '/data/nshop/mid/actlog/mid_nshop_actlog_launch_timesegs/'
  • ADS應(yīng)用數(shù)據(jù)層
    總體運(yùn)營(yíng)統(tǒng)計(jì)的流量類指標(biāo)_平臺(tái)統(tǒng)計(jì)表【ADS】建表示例:
CREATE external TABLE
IF NOT EXISTS ads_nshop.ads_nshop_platform_flow_stat (
    customer_gender TINYINT NOT NULL COMMENT '性別:1男 0女',
    age_range VARCHAR (10) NOT NULL COMMENT '年齡段',
    customer_natives VARCHAR (10) NULL COMMENT '所在地區(qū)',
    visit_avg_duration INT COMMENT '人均頁(yè)面訪問(wèn)時(shí)長(zhǎng)',
    visit_avg_counts INT COMMENT '人均頁(yè)面訪問(wèn)數(shù)'
) partitioned BY (bdp_day string) stored AS parquet location '/data/nshop/ads/operation/ads_nshop_platform_flow_stat/'
5.數(shù)倉(cāng)結(jié)構(gòu)圖

數(shù)倉(cāng)運(yùn)行簡(jiǎn)圖:


數(shù)倉(cāng)具體運(yùn)行流程圖:


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市乡洼,隨后出現(xiàn)的幾起案子崇裁,更是在濱河造成了極大的恐慌,老刑警劉巖束昵,帶你破解...
    沈念sama閱讀 212,383評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件拔稳,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡锹雏,警方通過(guò)查閱死者的電腦和手機(jī)巴比,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,522評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)礁遵,“玉大人轻绞,你說(shuō)我怎么就攤上這事∮赌停” “怎么了政勃?”我有些...
    開(kāi)封第一講書人閱讀 157,852評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)兼砖。 經(jīng)常有香客問(wèn)我奸远,道長(zhǎng),這世上最難降的妖魔是什么讽挟? 我笑而不...
    開(kāi)封第一講書人閱讀 56,621評(píng)論 1 284
  • 正文 為了忘掉前任懒叛,我火速辦了婚禮,結(jié)果婚禮上耽梅,老公的妹妹穿的比我還像新娘薛窥。我一直安慰自己,他們只是感情好眼姐,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,741評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布诅迷。 她就那樣靜靜地躺著佩番,像睡著了一般。 火紅的嫁衣襯著肌膚如雪竟贯。 梳的紋絲不亂的頭發(fā)上答捕,一...
    開(kāi)封第一講書人閱讀 49,929評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音屑那,去河邊找鬼。 笑死艘款,一個(gè)胖子當(dāng)著我的面吹牛持际,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播哗咆,決...
    沈念sama閱讀 39,076評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼蜘欲,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了晌柬?” 一聲冷哼從身側(cè)響起姥份,我...
    開(kāi)封第一講書人閱讀 37,803評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎年碘,沒(méi)想到半個(gè)月后澈歉,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,265評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡屿衅,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,582評(píng)論 2 327
  • 正文 我和宋清朗相戀三年埃难,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片涤久。...
    茶點(diǎn)故事閱讀 38,716評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡涡尘,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出响迂,到底是詐尸還是另有隱情考抄,我是刑警寧澤,帶...
    沈念sama閱讀 34,395評(píng)論 4 333
  • 正文 年R本政府宣布蔗彤,位于F島的核電站川梅,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏幕与。R本人自食惡果不足惜挑势,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,039評(píng)論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望啦鸣。 院中可真熱鬧潮饱,春花似錦、人聲如沸诫给。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,798評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至凫碌,卻和暖如春扑毡,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背盛险。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,027評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工瞄摊, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人苦掘。 一個(gè)月前我還...
    沈念sama閱讀 46,488評(píng)論 2 361
  • 正文 我出身青樓换帜,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親鹤啡。 傳聞我的和親對(duì)象是個(gè)殘疾皇子惯驼,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,612評(píng)論 2 350