一、名詞解釋
1. 基礎(chǔ)層-ODS(操作型數(shù)據(jù)存儲(chǔ)):主要是未經(jīng)過(guò)加工的原始數(shù)據(jù)答捕;//與原數(shù)據(jù)一致逝钥,記錄事實(shí)的數(shù)據(jù);
2. 中間層-CDM\EDW(EDW-企業(yè)級(jí)數(shù)據(jù)庫(kù)拱镐,CDM-公共維度模型層):經(jīng)過(guò)加工整合的數(shù)據(jù)層艘款,包含整合好的明細(xì)數(shù)據(jù)和匯總數(shù)據(jù)
① Dwd-明細(xì)整合層:一般從ODS層進(jìn)來(lái)之后裆蒸,會(huì)在DWD層做一個(gè)簡(jiǎn)單的數(shù)據(jù)清洗加工址遇;
② Dws-高密度匯總層:主題寬表,從DWD層進(jìn)入到DWS層進(jìn)行數(shù)據(jù)匯總猾担;
③ Dim-維度表益眉;
④ Dwb-基礎(chǔ)數(shù)據(jù)層:建立在dwd明細(xì)層之前的晌柬,相當(dāng)于ods層進(jìn)行一些基礎(chǔ)簡(jiǎn)單的加工;
3. 應(yīng)用層-ADM(應(yīng)用數(shù)據(jù)集市):數(shù)據(jù)應(yīng)用或數(shù)據(jù)集市所在的層次
4. 數(shù)據(jù)域/主題域:數(shù)據(jù)管理和數(shù)據(jù)整合的數(shù)據(jù)抽象集合郭脂。數(shù)據(jù)域相對(duì)穩(wěn)定年碘,主要用于中間層建設(shè)。
5. 數(shù)據(jù)倉(cāng)庫(kù)-DW(Data Warehouse)
二展鸡、數(shù)倉(cāng)模型
ODS層:ODS層中存放的還是各個(gè)分散系統(tǒng)中的數(shù)據(jù)屿衅,ODS層會(huì)進(jìn)行ETL之后會(huì)抽取進(jìn)入到DWD層;
DWD層:相當(dāng)于把來(lái)自不同系統(tǒng)的互數(shù)據(jù)進(jìn)行集成娱颊,大白話來(lái)說(shuō)需要把來(lái)自不同系統(tǒng)中的數(shù)據(jù)傲诵,整合到一張數(shù)據(jù)表中,但是還是以明細(xì)的形式存在箱硕;
dim表:維度表拴竹,一般維度用字母或者數(shù)字表示,需要知道這個(gè)數(shù)據(jù)的含義是什么剧罩;
DWS層:?聚合之后的統(tǒng)計(jì)值栓拜,數(shù)倉(cāng)的目的是為了面向分析,不需要看明細(xì)。
ADM層:各業(yè)務(wù)定制化的數(shù)據(jù)幕与,面向應(yīng)用挑势;
三、數(shù)據(jù)(表)多維模型
四啦鸣、傳統(tǒng)數(shù)倉(cāng)架構(gòu)
流數(shù)據(jù):相當(dāng)于一個(gè)實(shí)時(shí)的概念潮饱,例如這一秒發(fā)生的一個(gè)訂單就實(shí)時(shí)的流進(jìn)來(lái)了;
塊數(shù)據(jù):例如诫给,這一秒發(fā)生的訂單先攢起來(lái)香拉,攢一天之后然后把這1天所攢的數(shù)據(jù)一起同步進(jìn)來(lái)。這是一個(gè)離線的過(guò)程中狂,不隨時(shí)間流動(dòng)凫碌,不是實(shí)時(shí)數(shù)據(jù);
ETL:抽取胃榕、轉(zhuǎn)換盛险、加載;
實(shí)時(shí)計(jì)算:又稱實(shí)時(shí)數(shù)倉(cāng)勋又;
調(diào)度:ETL的過(guò)程相當(dāng)于是寫(xiě)一些腳本苦掘,可以理解為寫(xiě)一些SQL,每一個(gè)SQL去加工一部分?jǐn)?shù)據(jù)赐写;加工數(shù)據(jù)會(huì)有一步一步的順序鏈路鸟蜡,這些鏈路會(huì)形成任務(wù)進(jìn)行調(diào)度膜赃。
監(jiān)控:數(shù)據(jù)質(zhì)量監(jiān)控挺邀;
Meta:元數(shù)據(jù),指描述數(shù)據(jù)的數(shù)據(jù)跳座。描述字段的含義就叫做元數(shù)據(jù)端铛。
五、數(shù)據(jù)鏈路及服務(wù)
六疲眷、數(shù)倉(cāng)在數(shù)據(jù)中臺(tái)中的作用
以智能客服為例:
(1)業(yè)務(wù)方提出訴求:客戶通過(guò)在線客服進(jìn)行咨詢時(shí)禾蚕,是否能判斷客戶購(gòu)買(mǎi)意愿強(qiáng)烈的程度;
(2)企業(yè)方:接受到訴求之后狂丝,因自身沒(méi)有數(shù)據(jù)基礎(chǔ)能力换淆,于是去找了中臺(tái);(企業(yè)方首先會(huì)進(jìn)行數(shù)據(jù)采集几颜,采集到的數(shù)據(jù)給到數(shù)據(jù)倉(cāng)庫(kù))
(3)數(shù)據(jù)倉(cāng)庫(kù)結(jié)合自身的算法模型進(jìn)行評(píng)級(jí)倍试,將智能客服中的評(píng)級(jí)包裝成客戶意愿。并根據(jù)意愿強(qiáng)度去匹配不同的話術(shù)蛋哭。
//數(shù)倉(cāng)的作用:通過(guò)業(yè)務(wù)方的數(shù)據(jù)县习,把數(shù)據(jù)采集進(jìn)來(lái),通過(guò)自身的算法模型預(yù)測(cè)評(píng)價(jià)。