淺談數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)
前言:數(shù)據(jù)挖掘只是數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)中的一小部分內(nèi)容啤咽,數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)是一個(gè)從數(shù)據(jù)集中發(fā)現(xiàn)知識(shí)的過程。針對(duì)不同領(lǐng)域的應(yīng)用,存在多種KDD過程模型桨螺。各種過程模型描述了KDD整個(gè)處理過程的步驟和各個(gè)階段中的目標(biāo)和方法恰梢。
一KDD過程模型
上面是三種不同的只是發(fā)現(xiàn)過程模型佛南,解決不同領(lǐng)域和不同的問題點(diǎn)梗掰。后邊的筆記中會(huì)給出具體的模型解決的問題。
KDD知識(shí)發(fā)現(xiàn)的過程中有哪些參與者呢共虑,它們又分別有什么作用呢愧怜?
首先明確KDD是一個(gè)系統(tǒng)性項(xiàng)目,在整個(gè)KDD過程中妈拌,有三類人員拥坛。
業(yè)務(wù)分析人員:解釋業(yè)務(wù)對(duì)象,根據(jù)業(yè)務(wù)對(duì)象尘分,確定用于數(shù)據(jù)定義和數(shù)據(jù)挖掘算法的業(yè)務(wù)需求猜惋。
數(shù)據(jù)分析人員:將業(yè)務(wù)需求轉(zhuǎn)化為知識(shí)發(fā)現(xiàn),應(yīng)用數(shù)據(jù)分析培愁,數(shù)據(jù)挖掘的各種算法著摔、方法和工具等。
數(shù)據(jù)管理人員:按照KDD目標(biāo)提取數(shù)據(jù)定续。能夠使用數(shù)據(jù)庫技術(shù)構(gòu)造KDD的目標(biāo)數(shù)據(jù)集
二谍咆、KDD過程模型的應(yīng)用
這個(gè)部分的舉例是CRISP-DM過程模型。
以上是數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)最根本的一些概念和模型私股。
2016/9/3