3.8.2 數(shù)據(jù)挖掘的功能

《系統(tǒng)架構(gòu) 設(shè)計(jì)師教程(第4版) 》希賽教育 編著

數(shù)據(jù)挖掘通過(guò)預(yù)測(cè)未來(lái)趨勢(shì)及行為挖帘,做出前攝的亥宿、基于知識(shí)的決策姥敛。數(shù)據(jù)挖掘的目標(biāo)是從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)隱含的道逗、有意義的知識(shí)兵罢,主要有以下五類功能。
1.自動(dòng)預(yù)測(cè)趨勢(shì)和行為
數(shù)據(jù)挖掘自動(dòng)在大型數(shù)據(jù)庫(kù)中尋找預(yù)測(cè)性信息滓窍,以往需要進(jìn)行大量手工分析的問(wèn)題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論卖词。一個(gè)典型的例子是市場(chǎng)預(yù)測(cè)問(wèn)題,數(shù)據(jù)挖掘使用過(guò)去有關(guān)促銷的數(shù)據(jù)來(lái)尋找未來(lái)投資中回報(bào)最大的用戶吏夯,其他可預(yù)測(cè)的問(wèn)題包括預(yù)報(bào)破產(chǎn)及認(rèn)定對(duì)指定事件最可能做出反應(yīng)的群體此蜈。
2.關(guān)聯(lián)分析
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性锦亦,就稱為關(guān)聯(lián)舶替。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)杠园、因果關(guān)聯(lián)顾瞪。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)并不知道數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)函數(shù)抛蚁,即使知道也是不確定的陈醒,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。
3.聚類
數(shù)據(jù)庫(kù)中的記錄可被劃分為一系列有意義的子集瞧甩,即聚類钉跷。聚類增強(qiáng)了人們對(duì)客觀現(xiàn)實(shí)的認(rèn)識(shí),是概念描述和偏差分析的先決條件肚逸。聚類技術(shù)主要包括傳統(tǒng)的模式識(shí)別方法和數(shù)學(xué)分類學(xué)爷辙。20世紀(jì)80年代初彬坏,Mchalski提出了概念聚類技術(shù)及其要點(diǎn),即在劃分對(duì)象時(shí)不僅要考慮對(duì)象之間的距離膝晾,還要求劃分出的類具有某種內(nèi)涵描述栓始,從而避免了傳統(tǒng)技術(shù)的某些片面性。
4.概念描述
概念描述就是對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述血当,并概括這類對(duì)象的有關(guān)特征幻赚。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對(duì)象的共同特征臊旭,后者描述不同類對(duì)象之間的區(qū)別落恼。生成一個(gè)類的特征性描述只涉及該類對(duì)象中所有對(duì)象的共性。生成區(qū)別性描述的方法很多离熏,如決策樹方法佳谦、遺傳算法等。
5.偏差檢測(cè)
數(shù)據(jù)庫(kù)中的數(shù)據(jù)常有一些異常記錄撤奸,從數(shù)據(jù)庫(kù)中檢測(cè)這些偏差很有意義吠昭。偏差包括很多潛在的知識(shí),如分類中的反常實(shí)例胧瓜、不滿足規(guī)則的特例矢棚、觀測(cè)結(jié)果與模型預(yù)測(cè)值的偏差、量值隨時(shí)間的變化等府喳。偏差檢測(cè)的基本方法是蒲肋,尋找觀測(cè)結(jié)果與參照值之間有意義的差別。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末钝满,一起剝皮案震驚了整個(gè)濱河市兜粘,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌弯蚜,老刑警劉巖孔轴,帶你破解...
    沈念sama閱讀 218,284評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異碎捺,居然都是意外死亡路鹰,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門收厨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)晋柱,“玉大人,你說(shuō)我怎么就攤上這事诵叁⊙憔海” “怎么了?”我有些...
    開封第一講書人閱讀 164,614評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵拧额,是天一觀的道長(zhǎng)碑诉。 經(jīng)常有香客問(wèn)我彪腔,道長(zhǎng),這世上最難降的妖魔是什么联贩? 我笑而不...
    開封第一講書人閱讀 58,671評(píng)論 1 293
  • 正文 為了忘掉前任漫仆,我火速辦了婚禮,結(jié)果婚禮上泪幌,老公的妹妹穿的比我還像新娘。我一直安慰自己署照,他們只是感情好祸泪,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,699評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著建芙,像睡著了一般没隘。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上禁荸,一...
    開封第一講書人閱讀 51,562評(píng)論 1 305
  • 那天右蒲,我揣著相機(jī)與錄音,去河邊找鬼赶熟。 笑死瑰妄,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的映砖。 我是一名探鬼主播间坐,決...
    沈念sama閱讀 40,309評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼邑退!你這毒婦竟也來(lái)了竹宋?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,223評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤地技,失蹤者是張志新(化名)和其女友劉穎蜈七,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體莫矗,經(jīng)...
    沈念sama閱讀 45,668評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡飒硅,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,859評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了趣苏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片狡相。...
    茶點(diǎn)故事閱讀 39,981評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖食磕,靈堂內(nèi)的尸體忽然破棺而出尽棕,到底是詐尸還是另有隱情,我是刑警寧澤彬伦,帶...
    沈念sama閱讀 35,705評(píng)論 5 347
  • 正文 年R本政府宣布滔悉,位于F島的核電站伊诵,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏回官。R本人自食惡果不足惜曹宴,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,310評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望歉提。 院中可真熱鬧笛坦,春花似錦、人聲如沸苔巨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)侄泽。三九已至礁芦,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間悼尾,已是汗流浹背柿扣。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留闺魏,地道東北人未状。 一個(gè)月前我還...
    沈念sama閱讀 48,146評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像舷胜,于是被迫代替她去往敵國(guó)和親娩践。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,933評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 隨著數(shù)據(jù)庫(kù)技術(shù)的迅速發(fā)展及數(shù)據(jù)庫(kù)管理系統(tǒng)的廣泛應(yīng)用烹骨,人們積累的數(shù)據(jù)越來(lái)越多翻伺。激增的數(shù)據(jù)背后隱藏著許多重要的信息,人...
    deniro閱讀 369評(píng)論 0 1
  • 前言 數(shù)據(jù)挖掘是通過(guò)對(duì)大量數(shù)據(jù)的清理及處理以發(fā)現(xiàn)信息沮焕,并將這原理應(yīng)用于分類吨岭,推薦系統(tǒng),預(yù)測(cè)等方面的過(guò)程峦树。本文基于《...
    算法進(jìn)階閱讀 2,328評(píng)論 0 8
  • 16宿命:用概率思維提高你的勝算 以前的我是風(fēng)險(xiǎn)厭惡者辣辫,不喜歡去冒險(xiǎn),但是人生放棄了冒險(xiǎn)魁巩,也就放棄了無(wú)數(shù)的可能急灭。 ...
    yichen大刀閱讀 6,050評(píng)論 0 4
  • 公元:2019年11月28日19時(shí)42分農(nóng)歷:二零一九年 十一月 初三日 戌時(shí)干支:己亥乙亥己巳甲戌當(dāng)月節(jié)氣:立冬...
    石放閱讀 6,879評(píng)論 0 2
  • 今天上午陪老媽看病,下午健身房跑步谷遂,晚上想想今天還沒有斷舍離葬馋,馬上做,衣架和旁邊的的布衣架,一看亂亂畴嘶,又想想自己是...
    影子3623253閱讀 2,913評(píng)論 1 8