大師兄的信息化管理學習筆記(六):數(shù)據(jù)庫與商業(yè)智能(二)

大師兄的信息化管理學習筆記(五):數(shù)據(jù)庫與商業(yè)智能(一)
大師兄的信息化管理學習筆記(七):中間件技術

三女仰、聯(lián)系分析處理

  • 聯(lián)機分析處理(OLAP)是使分析人員哟玷、管理人員或執(zhí)行人員能夠從多角度對信息快速橘洞、一致、交互地存取助币,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術跳夭。
  • OLAP的目標是滿足決策支持或者滿足在多維環(huán)境下特定的查詢和報表需求亡笑。
  • OLAP的技術核心是維度概念。
1.OLAP和OLTP
  • 聯(lián)機分析處理(OLAP)聯(lián)機事務處理(OLTP)的區(qū)別在于最仑,OLAP側重數(shù)據(jù)分析,OLTP側重對數(shù)據(jù)庫進行增刪改和日常事務操作炊甲。
- OLTP OLAP
主要應用 數(shù)據(jù)庫 數(shù)據(jù)倉庫
功能 日常操作處理 決策分析
用戶 操作人員泥彤、底層管理人員 決策人員、高級管理人員
模型設計 面向應用 面向主題
時間要求 實時讀寫要求高 實時讀寫要求低
分析要求 低卿啡、簡單 高吟吝、復雜
數(shù)據(jù)處理 當前的、最新的颈娜、細節(jié)的剑逃、二維的、分立的 歷史的官辽、聚集的蛹磺、多維的、集成的同仆、統(tǒng)一的
數(shù)據(jù)規(guī)模 100MB - 1GB 100GB - TB
每次讀取 數(shù)百條數(shù)據(jù) 數(shù)百萬條數(shù)據(jù)
2. OLAP的分類
類別 描述
ROLAP(Relational OLAP) - 基于關系型數(shù)據(jù)庫的OLAP實現(xiàn)萤捆。
- 以關系型數(shù)據(jù)庫為核心,以關系型結構進行多維數(shù)據(jù)的表示和存儲俗批。
MOLAP(Multidimensional OLAP) - 多維數(shù)據(jù)組織的OLAP實現(xiàn)
HOLAP(Hybrid OLAP) - 基于混合數(shù)據(jù)組織的OLAP實現(xiàn)俗或。
- 如底層是關系型,高層是多維矩陣型扶镀。
- 這種方式有更好的靈活性蕴侣。

四、數(shù)據(jù)挖掘與知識發(fā)現(xiàn)

  • 數(shù)據(jù)挖掘(Data Mining)是從存放在數(shù)據(jù)庫臭觉,數(shù)據(jù)倉庫或其它信息庫中的大量數(shù)據(jù)中獲取有效的昆雀、新穎的辱志、潛在有用的、最終可理解的模型的過程狞膘。
  • 知識發(fā)現(xiàn)(Knowledge Discovery in Database)數(shù)據(jù)挖掘的一種更廣泛的說法揩懒,即從各種媒體表示的信息中心,根據(jù)不同的需求獲取知識挽封。
  • 數(shù)據(jù)挖掘的方法如下:
方法 描述
關聯(lián)規(guī)則(Association) 反應一個事件和其他事件之間依賴或關聯(lián)的支持已球,目的是發(fā)現(xiàn)哪些事情總在一起發(fā)生。
序列(Sequence) 關注時間之后的關聯(lián)關系辅愿,更關注關聯(lián)關系中事件發(fā)生的先后順序智亮。
聚類(Clustering) 自動尋找并建立分組規(guī)則的方法,通過判斷樣本之間的相似性点待,把相似樣本劃分在一個簇中阔蛉。
分類(Classification) 首先從已經(jīng)分好類的訓練集上建立一個分類模型,再將該模型用于對沒有分類的數(shù)據(jù)進行分類癞埠。
回歸(Regression) 與分類類似状原,但輸出結果是連續(xù)型的數(shù)值。
時間序列(Time Serise) 通過時間序列型數(shù)據(jù)苗踪,由歷史的和當前的數(shù)據(jù)取預測未來的情況颠区,實際上是一種以時間為關鍵屬性的回歸。

五通铲、實施商業(yè)智能的步驟

  • 需求分析
  • 數(shù)據(jù)倉庫建模
  • 數(shù)據(jù)抽取
  • 建立商業(yè)只能分析報表
  • 用戶培訓和數(shù)據(jù)模擬測試
  • 系統(tǒng)改進和完善

六毕莱、ETL

  • ETL(Extract-Transform-Load)指將數(shù)據(jù)從來源端經(jīng)過至目的端的過程。
  • Extract抽取
  • Transform轉換
  • Load加載

七颅夺、元數(shù)據(jù)

  • 元數(shù)據(jù)(Metadata)是關于數(shù)據(jù)的數(shù)據(jù)央串,主要用來描述數(shù)據(jù)屬性(property)信息,用來支持如指示存儲位置碗啄、歷史數(shù)據(jù)质和、資源查找和文件記錄等。
  • 數(shù)據(jù)倉庫中的元數(shù)據(jù)包括:
  • 數(shù)據(jù)倉庫表的結構
  • 數(shù)據(jù)倉庫標的屬性
  • 數(shù)據(jù)倉庫的源數(shù)據(jù)
  • 從記錄系統(tǒng)到數(shù)據(jù)倉庫的映射
  • 數(shù)據(jù)模型的規(guī)格說明
  • 抽取日志和訪問數(shù)據(jù)的公用例行程序等

八稚字、數(shù)據(jù)預處理

  • 數(shù)據(jù)預處理是指在主要處理前對數(shù)據(jù)進行的處理:
步驟 描述
數(shù)據(jù)清洗 通過填寫缺失的值饲宿、平滑噪聲數(shù)據(jù)、清楚重復數(shù)據(jù)胆描、識別或刪除離群點并解決不一致性來清理數(shù)據(jù)瘫想。
數(shù)據(jù)集成 將多個數(shù)據(jù)源中的數(shù)據(jù)結合起來并統(tǒng)一存儲,建立數(shù)據(jù)倉庫的過程實際上就是數(shù)據(jù)集成昌讲。
數(shù)據(jù)變換 通過平滑聚類国夜,數(shù)據(jù)概化、規(guī)范化等方式將數(shù)據(jù)轉換成適用于數(shù)據(jù)挖掘的形式短绸。
數(shù)據(jù)規(guī)約 縮小數(shù)據(jù)取值范圍车吹,使其更適合于數(shù)據(jù)挖掘算法筹裕,能夠得到和原始數(shù)據(jù)相同的分析結果。盡可能保持數(shù)據(jù)原貌窄驹,最大限度精簡舒居量朝卒。
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市乐埠,隨后出現(xiàn)的幾起案子抗斤,更是在濱河造成了極大的恐慌,老刑警劉巖丈咐,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件瑞眼,死亡現(xiàn)場離奇詭異,居然都是意外死亡棵逊,警方通過查閱死者的電腦和手機负拟,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來歹河,“玉大人,你說我怎么就攤上這事花吟〗掌纾” “怎么了?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵衅澈,是天一觀的道長键菱。 經(jīng)常有香客問我,道長今布,這世上最難降的妖魔是什么经备? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮部默,結果婚禮上侵蒙,老公的妹妹穿的比我還像新娘。我一直安慰自己傅蹂,他們只是感情好纷闺,可當我...
    茶點故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著份蝴,像睡著了一般犁功。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上婚夫,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天浸卦,我揣著相機與錄音,去河邊找鬼案糙。 笑死限嫌,一個胖子當著我的面吹牛靴庆,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播萤皂,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼撒穷,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了裆熙?” 一聲冷哼從身側響起端礼,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎入录,沒想到半個月后蛤奥,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡僚稿,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年凡桥,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蚀同。...
    茶點故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡缅刽,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出蠢络,到底是詐尸還是另有隱情衰猛,我是刑警寧澤,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布刹孔,位于F島的核電站啡省,受9級特大地震影響,放射性物質發(fā)生泄漏髓霞。R本人自食惡果不足惜卦睹,卻給世界環(huán)境...
    茶點故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望方库。 院中可真熱鬧结序,春花似錦、人聲如沸纵潦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽酪穿。三九已至凳干,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間被济,已是汗流浹背救赐。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人经磅。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓泌绣,卻偏偏與公主長得像,于是被迫代替她去往敵國和親预厌。 傳聞我的和親對象是個殘疾皇子阿迈,可洞房花燭夜當晚...
    茶點故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內(nèi)容