【基礎(chǔ)概念】什么是數(shù)據(jù)庫、數(shù)據(jù)倉庫躯喇、數(shù)據(jù)市集

前言:

本文重點理清三個概念:數(shù)據(jù)庫辫封、數(shù)據(jù)倉庫、數(shù)據(jù)市集。

數(shù)據(jù)庫:

1.數(shù)據(jù)庫是什么倦微?

數(shù)據(jù)庫是存儲數(shù)據(jù)的一個庫妻味,庫通常有多種數(shù)據(jù)表,表則是由字段(列名)和記錄(基本信息)組成璃诀。
比如:消費者在淘寶購買商品弧可,會產(chǎn)生訂單號、下單時間劣欢、瀏覽時間棕诵、瀏覽次數(shù)等關(guān)于單純購買商品的信息。
通常這些信息是商家導(dǎo)出到數(shù)據(jù)庫中進(jìn)行收集為一個csv文件或者excel文件凿将,亦或者直接導(dǎo)入數(shù)據(jù)庫如:Mysql校套、hive中。
這種數(shù)據(jù)涉及到買家的實時信息的記錄牧抵,通常叫做事實表笛匙。

image.png

2.數(shù)據(jù)庫有什么用?

用于業(yè)務(wù)分析犀变,了解情況妹孙、調(diào)整策略。
比如:商家收集到了消費者的下單情況获枝,可以進(jìn)行月消費金額的統(tǒng)計蠢正、購買人次的統(tǒng)計等。
一方面了解自身的銷售狀況省店,另一方面也可以進(jìn)行對用戶群體行為跟蹤分析嚣崭。
比如:買家的年齡段、同個買家在商家購買的產(chǎn)品次數(shù)及類型懦傍,來刻畫用戶畫像雹舀,以便調(diào)整推廣方式、銷售活動等粗俱。
通常符合身份標(biāo)簽的说榆,如QQ上的昵稱、年齡源梭、性別等組成的數(shù)據(jù)表娱俺,或者地理位置,國家废麻、省、區(qū)域的表一般叫做維度表模庐。

3.數(shù)據(jù)庫怎么用烛愧?

利用配套工具,進(jìn)行 查、增怜姿、刪慎冤、改 的基本操作,復(fù)雜點 進(jìn)行 分組聚合沧卢,求和蚁堤、計數(shù)、求平均等但狭。
最為廣泛的是excel披诗,一般單張表使用。
Mysql 用于 多張表立磁,一個庫呈队。
python 用于 自動化、標(biāo)準(zhǔn)式輸出的操作唱歧。
hive 用于 跨部門宪摧、互動式 操作。

數(shù)據(jù)倉庫:

1.數(shù)據(jù)倉庫是什么颅崩?

是存儲各種歷史信息的數(shù)據(jù)庫几于,一般存在數(shù)據(jù)量大、雜沿后,以及數(shù)據(jù)表極多的情況沿彭,且不是按天為單位的錄入信息,一般是月得运、年為單位的存儲信息膝蜈。
數(shù)據(jù)倉庫中存儲著不同主題的信息。

一句話概括:“面向分析的存儲系統(tǒng)”熔掺。
當(dāng)然饱搏,日常使用的叫做 操作型數(shù)據(jù)庫,就是“面向業(yè)務(wù)的實時存儲系統(tǒng)”置逻。

2.數(shù)據(jù)倉庫的作用是什么推沸?

數(shù)據(jù)倉庫作用是進(jìn)行歷史數(shù)據(jù)分析,負(fù)責(zé)利用歷史數(shù)據(jù)對公司各主題域進(jìn)行統(tǒng)計分析券坞。

3.操作型數(shù)據(jù)庫和數(shù)據(jù)倉庫有什么區(qū)別鬓催?

面向主題不同
操作型是為支持各種業(yè)務(wù)而建立,數(shù)據(jù)倉庫是為了對各種繁雜業(yè)務(wù)中抽象出來的分析主題進(jìn)行分析而建立恨锚。

歷史性
數(shù)據(jù)倉庫保存的時間通常以幾年宇驾、幾十年存在,前者通常僅保留幾個月猴伶。

范圍性
數(shù)據(jù)倉庫將不同主題的數(shù)據(jù)庫匯總一起课舍,面對的是整個公司塌西,而前者通常是單一主題,面對個體業(yè)務(wù)筝尾。

數(shù)據(jù)市集:

1.數(shù)據(jù)市集是什么捡需?

一句話概括,“面向單個主題分析的存儲系統(tǒng)”筹淫,或者“單一主題的數(shù)據(jù)倉庫”站辉。
它是一種“小型數(shù)據(jù)倉庫”,包含單個主題损姜,關(guān)注范圍并非全局饰剥。

數(shù)據(jù)集市可以分為兩種。
一種是獨立數(shù)據(jù)集市(independent data mart)薛匪,這類數(shù)據(jù)集市有自己的源數(shù)據(jù)庫和ETL架構(gòu)捐川;
另一種是非獨立數(shù)據(jù)集市(dependent data mart),這種數(shù)據(jù)集市沒有自己的源系統(tǒng)逸尖,它的數(shù)據(jù)來自數(shù)據(jù)倉庫古沥。當(dāng)用戶或者應(yīng)用程序不需要/不必要/不允許用到整個數(shù)據(jù)倉庫的數(shù)據(jù)時,非獨立數(shù)據(jù)集市就可以簡單為用戶提供一個數(shù)據(jù)倉庫的"子集"娇跟。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末岩齿,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子苞俘,更是在濱河造成了極大的恐慌盹沈,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吃谣,死亡現(xiàn)場離奇詭異乞封,居然都是意外死亡,警方通過查閱死者的電腦和手機岗憋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門肃晚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人仔戈,你說我怎么就攤上這事关串。” “怎么了监徘?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵晋修,是天一觀的道長。 經(jīng)常有香客問我凰盔,道長墓卦,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任户敬,我火速辦了婚禮趴拧,結(jié)果婚禮上溅漾,老公的妹妹穿的比我還像新娘山叮。我一直安慰自己著榴,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布屁倔。 她就那樣靜靜地躺著脑又,像睡著了一般。 火紅的嫁衣襯著肌膚如雪锐借。 梳的紋絲不亂的頭發(fā)上问麸,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天,我揣著相機與錄音钞翔,去河邊找鬼严卖。 笑死,一個胖子當(dāng)著我的面吹牛布轿,可吹牛的內(nèi)容都是我干的哮笆。 我是一名探鬼主播,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼汰扭,長吁一口氣:“原來是場噩夢啊……” “哼稠肘!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起萝毛,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤项阴,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后笆包,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體环揽,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年庵佣,在試婚紗的時候發(fā)現(xiàn)自己被綠了歉胶。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡秧了,死狀恐怖跨扮,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情验毡,我是刑警寧澤衡创,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站晶通,受9級特大地震影響璃氢,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜狮辽,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一一也、第九天 我趴在偏房一處隱蔽的房頂上張望巢寡。 院中可真熱鬧,春花似錦椰苟、人聲如沸抑月。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽谦絮。三九已至,卻和暖如春洁仗,著一層夾襖步出監(jiān)牢的瞬間层皱,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工赠潦, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留叫胖,地道東北人。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓她奥,卻偏偏與公主長得像瓮增,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子方淤,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 上一篇:098-BigData-26Hive企業(yè)級調(diào)優(yōu) 十钉赁、數(shù)據(jù)倉庫 10.1 什么是數(shù)據(jù)倉庫數(shù)據(jù)倉庫,英文名稱為...
    AncientMing閱讀 864評論 0 2
  • 數(shù)據(jù)倉庫數(shù)據(jù)倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)携茂、集成的Int...
    Albert陳凱閱讀 4,951評論 0 15
  • 第三章 數(shù)據(jù)庫系統(tǒng) 3.1 數(shù)據(jù)庫管理系統(tǒng)的類型 通常有多個分類標(biāo)準(zhǔn)你踩。如按數(shù)據(jù)模型分類、按用戶數(shù)分類讳苦、按數(shù)據(jù)庫分布...
    步積閱讀 2,687評論 0 7
  • 數(shù)據(jù)倉庫簡介 一:什么是數(shù)據(jù)倉庫 數(shù)據(jù)倉庫带膜,英文名稱為Data Warehouse,可簡寫為DW或DWH鸳谜。數(shù)據(jù)倉庫...
    nightwish夜愿閱讀 2,012評論 0 24
  • 引言 數(shù)據(jù)倉庫作為單獨的數(shù)據(jù)存儲創(chuàng)建與組織中膝藕,其主要目的是數(shù)據(jù)分析,專為查詢而設(shè)計咐扭。 將數(shù)據(jù)倉庫的創(chuàng)建轉(zhuǎn)換為單獨的...
    DoggieX閱讀 1,699評論 0 1