(1)DB/Database/數(shù)據(jù)庫——這里一般指的就是OLTP數(shù)據(jù)庫喇勋,在線事物數(shù)據(jù)庫,用來支持生產(chǎn)的偎行,比如超市的買賣系統(tǒng)川背。DB保留的是數(shù)據(jù)信息的最新狀態(tài),只有一個(gè)狀態(tài)蛤袒!比如渗常,每天早上起床洗臉照鏡子,看到的就是當(dāng)時(shí)的狀態(tài)汗盘,至于之前的每天的狀態(tài)皱碘,不會出現(xiàn)的你的眼前,這個(gè)眼前就是db隐孽。
(2)DW/Data Warehouse/數(shù)據(jù)倉庫——這里保存的是DB中的不同時(shí)間點(diǎn)的狀態(tài)癌椿,比如,每天早上洗完照鏡子時(shí)菱阵,都拍一張照片踢俄,天天這樣,這些照片放入到一個(gè)相冊中晴及,之后就可以查看每一天的狀態(tài)了都办,這個(gè)相冊就是數(shù)據(jù)倉庫,他保存的是數(shù)據(jù)在不同時(shí)間點(diǎn)的狀態(tài)虑稼,對同一個(gè)數(shù)據(jù)信息琳钉,保留不同時(shí)間點(diǎn)的狀態(tài),就便于我們做統(tǒng)計(jì)分析了蛛倦。
(3)ETL/Extraction-Transformation-Loading——用于完成DB到DW的數(shù)據(jù)轉(zhuǎn)存歌懒,它將DB中的某一個(gè)時(shí)間點(diǎn)的狀態(tài),“抽取”出來溯壶,根據(jù)DW的存儲模型要求及皂,“轉(zhuǎn)換”一下數(shù)據(jù)格式甫男,然后再“加載”到DW的一個(gè)過程,這里需要強(qiáng)調(diào)的是验烧,DB的模型是ER模型板驳,遵從范式化設(shè)計(jì)原則,而DW的數(shù)據(jù)模型是雪花型結(jié)構(gòu)或者星型結(jié)構(gòu)碍拆,用的是面向主題若治,面向問題的設(shè)計(jì)思路,所以DB和DW的模型結(jié)構(gòu)不同倔监,需要進(jìn)行轉(zhuǎn)換。
(4)OLAP——在線分析系統(tǒng)菌仁,簡單說就是報(bào)表系統(tǒng)浩习,銷售報(bào)表,統(tǒng)計(jì)報(bào)表济丘,等等谱秽,這個(gè)大家都熟悉,當(dāng)然摹迷,OLAP的統(tǒng)計(jì)要更復(fù)雜更豐富一些疟赊,比如切面,鉆取等等峡碉。
(5)DM/Data Mining/數(shù)據(jù)挖掘——這個(gè)挖掘近哟,不是簡單的統(tǒng)計(jì)了,他是根據(jù)概率論的或者其他的統(tǒng)計(jì)學(xué)原理鲫寄,將DW中的大數(shù)據(jù)量進(jìn)行分析吉执,找出我們不能直觀發(fā)現(xiàn)的規(guī)律,比如地来,如果我們每天早上照相戳玫,量身材的時(shí)候,還記錄下頭一天吃的東西未斑,黃瓜咕宿,豬腿,烤鴨蜡秽,以及心情府阀,如果記錄上10年,形成了3650天的相貌和飲食心情的數(shù)據(jù)芽突,我們每個(gè)人都記錄肌似,有20萬人記錄了,那么诉瓦,我們也許通過這些記錄川队,可以分析出力细,身材相貌和飲食的客觀規(guī)律;再說一個(gè)典型的實(shí)例固额,就是英國的超市眠蚂,在積累了大量數(shù)據(jù)之后,對數(shù)據(jù)分析挖掘之后斗躏,得到了一個(gè)規(guī)律:將小孩的尿布和啤酒放在一起逝慧,銷量會更好——業(yè)務(wù)專家在得到該結(jié)論之后,仔細(xì)分析啄糙,知道了原因笛臣,因?yàn)橛腥讼矚g看足球的多,老婆把小孩介紹男人看管隧饼,小孩尿尿需要尿布沈堡,而男人看足球喜歡喝酒,所以兩樣商品有密切的關(guān)系燕雁,放在一起銷售會更好诞丽!
(6)BI/Business Intelligence/商業(yè)智能——領(lǐng)導(dǎo),決策者拐格,在獲取了OLAP的統(tǒng)計(jì)信息僧免,和DM得到的科學(xué)規(guī)律之后,對生產(chǎn)進(jìn)行適當(dāng)?shù)恼{(diào)整捏浊,比如懂衩,命令超市人員將啤酒喝尿布放在一起銷售,這就反作用于DB修改存貨數(shù)據(jù)了——這就是整個(gè)BI的作用金踪!