學習使用Microsoft決策樹創(chuàng)建 OLAP 數(shù)據(jù)挖掘模型

微軟決策樹-挖掘模型建立及應用;學習使用Microsoft決策樹創(chuàng)建OLAP數(shù)據(jù)挖掘模型;深入理解決策樹分類的數(shù)據(jù)挖掘意義咆槽。

1.打開程序->Microsoft SQL Server 2008->SQL Server Management Studio速那,啟動SQL Server 2008數(shù)據(jù)庫,用Windows身份登錄培廓,新建一個數(shù)據(jù)庫名為ysy,導入數(shù)據(jù)春叫,選擇示例數(shù)據(jù)用Excel導入肩钠,成功導入界面如圖所示。


2.導入的數(shù)據(jù)的界面暂殖。


3.打開程序->Microsoft SQL Server 2008->SQL Server Business Intelligence Development Studio价匠,啟動SQL Server 2008 BI的開發(fā)環(huán)境。在“文件”菜單上呛每,指向“新建”踩窖,然后選擇“項目”。選中“項目類型”窗格中的“商業(yè)智能項目”晨横。選中“模板”窗格中的“Analysis Services項目”洋腮。在“名稱”框中,將新項目重命名手形,單擊“確定”啥供。在右邊的窗口可以看到有以下幾項:數(shù)據(jù)源;數(shù)據(jù)源視圖库糠;挖掘結構等.......


4.右擊數(shù)據(jù)源->新建數(shù)據(jù)源->點擊新建-填寫服務器名(本機服務器用.即可)->選擇到y(tǒng)sy->測試連接伙狐,如果成功點確定->下一步->使用服務賬戶(這一步很關鍵)->即可完成。


5.右擊數(shù)據(jù)源視圖->新建視圖->下一步->下一步->下一步->選擇我們想要進行分析的表為三國勾選上->完成瞬欧。就會出現(xiàn)這樣的視圖贷屎。


6.右擊挖掘結構->新建->下一步->選擇現(xiàn)有關系數(shù)據(jù)庫->此處會顯示有很多種算法的選擇,我們選擇Microsoft決策樹->點擊下一步->事例選中三國-指定數(shù)據(jù)鍵值為序列號艘虎,可預測為身份唉侄,剩下的輸入項可以通過建議去掉沒什么關聯(lián)的,將屬性自動分為連續(xù)型野建、離散型属划、可連續(xù)化的以及序列的(這一步也可通過自己判斷)->在“創(chuàng)建測試集”頁面中,設置“測試數(shù)據(jù)百分比”(一般測試集百分比為30%)->點擊下一步->名稱贬墩,允許鉆取勾選上



7.完成后榴嗅,即可看到右邊窗口出現(xiàn)這樣的三個文件。


8.右擊挖掘結構下面的三國.dmm文件->處理-運行->關閉

(可能會出現(xiàn)這樣的問題:服務器角色沒有權限陶舞,這時就需要返回到SSMS中查看多贏的角色嗽测,顯示只勾選到了public選項,賦予它sysadmin管理員的職能,再次運行即可)


9.選擇挖掘模型查看器即可看到通過決策樹的算法進行的結果分析唠粥。


10.通過觀察發(fā)現(xiàn)當武力值在60到78.8之間的數(shù)據(jù)分析不是很明顯,所以解決辦法就是:

點擊挖掘模型右擊設置算法參數(shù)->最上面的Microsoft_Decision_Trees->在MINIMUM_SUPPORT項中值得地方填上5晤愧,點擊確定后,完成官份。



11.再次查看決策樹的畫法可以看到在武力值在60到78.8之間的數(shù)據(jù)分析又進行了政治的分析:


12.通過觀察依賴關系網(wǎng)絡,將所有鏈接拉到最強鏈接舅巷,發(fā)現(xiàn)武力值對身份的影響是最大的:


13.通過挖掘模型預測結果的界面羔味,在選擇事例表中選擇三國這張表


14.左上角選擇單獨查詢->輸入要預測人的各項輸入值->輸入完成后赋元,將左邊的身份即預測項拖動放進源里面


15.點擊左上角查看結果切換到即可預測身份;


16.假如說想更換屬性的狀態(tài)飒房,比如當出身不是很影響身份的預測搁凸,我們即可將出身的input選擇為忽略即可。


17.通過提升圖护糖,可以清楚的看到預測值和準確值的差別垃你。


實驗總結:在這次的實驗當中,看似簡單的過程惜颇,中間還是出現(xiàn)了各種問題少辣,比如在挖掘結構處理過程中用戶角色沒有權限,對數(shù)據(jù)屬性是連續(xù)漓帅、離散、可連續(xù)化還是序列的判斷不是很準確器予,判斷是否關聯(lián)性大景城有錯誤捐迫,導致決策樹的不準確。決策樹有時候畫出來分叉很多,有時候發(fā)現(xiàn)當某一屬性在一個區(qū)間之間的數(shù)據(jù)分析不是很明顯萌丈,需要再次構造一個有明顯的區(qū)別的樹等等。而且對該軟件還不是很熟悉辆雾,操作起來還是需要步驟的詳細解釋月劈,有些要注意的步驟還是要更注意,比如如果不選擇可以鉆取數(shù)據(jù)的話到時候就不能對數(shù)據(jù)進行操作猜揪,所以要根據(jù)實際情況進行操作。


最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末诅妹,一起剝皮案震驚了整個濱河市毅人,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌划煮,老刑警劉巖缔俄,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異俐载,居然都是意外死亡蟹略,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進店門遏佣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人意敛,你說我怎么就攤上這事膛虫。” “怎么了稍刀?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長跌榔。 經(jīng)常有香客問我,道長僧须,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任示绊,我火速辦了婚禮暂论,結果婚禮上,老公的妹妹穿的比我還像新娘展哭。我一直安慰自己闻蛀,他們只是感情好,可當我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布役衡。 她就那樣靜靜地躺著薪棒,像睡著了一般。 火紅的嫁衣襯著肌膚如雪俐芯。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天鞍时,我揣著相機與錄音扣蜻,去河邊找鬼及塘。 笑死,一個胖子當著我的面吹牛笙僚,可吹牛的內容都是我干的。 我是一名探鬼主播亿笤,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼汪榔!你這毒婦竟也來了肃拜?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤士聪,失蹤者是張志新(化名)和其女友劉穎猛蔽,沒想到半個月后剥悟,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體曼库,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡凉泄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了胀糜。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蒂誉。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖右锨,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情悄窃,我是刑警寧澤蹂窖,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站横媚,受9級特大地震影響,放射性物質發(fā)生泄漏灯蝴。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一耕肩、第九天 我趴在偏房一處隱蔽的房頂上張望折砸。 院中可真熱鬧,春花似錦睦授、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至逗余,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間录粱,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工菜职, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留旗闽,地道東北人。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓嫡意,卻偏偏與公主長得像捣辆,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子罪帖,可洞房花燭夜當晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內容