sklearn實踐之分類+聚類

使用scikit-learn構建模型實訓(wine數(shù)據(jù)集明吩、wine_quality數(shù)據(jù))

  • 任務:
  • 實訓1 使用 sklearn處理wine和wine_quality數(shù)據(jù)集
  • 實訓2 構建基于wine數(shù)據(jù)集的k- Means聚類模型
  • 實訓3 構建基于wine數(shù)據(jù)集的分類模型
  • 實訓4 構建基于wine_quality數(shù)據(jù)集的回歸模型
  • 說明

  • wine數(shù)據(jù)集包含來自3種不同起源的葡萄酒的共178條記錄沃斤。13個屬性是葡萄酒的13種化學成分。通過化學分析可以來推斷葡萄酒的起源谚鄙。所有屬性變量都是連續(xù)變量。

  • wine_quality數(shù)據(jù)集共有4898個觀測值疚鲤,11個輸入特征和一個標簽啸如。其中,不同類的觀測值數(shù)量不等成翩,所有特征為連續(xù)型數(shù)據(jù)觅捆。通過酒的各種化學成分,預測該葡萄酒的評分麻敌。

實訓1 使用 sklearn處理wine和wine_quality數(shù)據(jù)集

1.訓練要點

  • 掌握 sklearn轉換器的用法栅炒。
  • 掌握訓練集、測試集劃分的方法。
  • 掌握使用sklearn進行PCA降維的方法赢赊。

2.實現(xiàn)思路及步驟

  • 使用pandas庫 winquality數(shù)據(jù)集乙漓,sklearn庫讀取wine數(shù)據(jù)集
  • 將wine數(shù)據(jù)集和winequality數(shù)據(jù)集的數(shù)據(jù)和標簽拆分開(提取)。
  • 將winequality數(shù)據(jù)集劃分為訓練集和測試集释移。
  • 標準化wine數(shù)據(jù)集和 wine quality數(shù)據(jù)集
  • 對wine數(shù)據(jù)集和 winequality數(shù)據(jù)集進行PCA降維叭披。

提示:

  • winequality數(shù)據(jù)集是csv格式文檔,在文件中是以”玩讳;”為間隔的涩蜘,所以要利用pandas.read_csv()讀取,間隔讀入的方式‘sep = ';' 獲取其數(shù)據(jù)熏纯。讀取后數(shù)據(jù)都以DataFrame的類型保留同诫,使用iloc等切片操作提取所需數(shù)據(jù)。
  • wine是庫內置數(shù)據(jù)樟澜,已經區(qū)分數(shù)據(jù)與標簽误窖。
  • from sklearn.model_selection import train_test_split,該train_test_split()函數(shù)將數(shù)據(jù)集劃分為訓練集和測試集兩部分秩贰,參數(shù)test_size=0.2代表著測試集在總數(shù)中的占比贩猎,通過計算wine_data總共178條記錄,wine_data_test有36條萍膛,占0.20224171(20%),參數(shù)random_state=100吭服,表示隨機種子編號,方便測試時得到相同隨機結果蝗罗。
  • from sklearn.preprocessing import StandardScaler并生成標準化規(guī)則(先實例化一個對象)艇棕;對訓練集標準化;用訓練集建立的模型對測試集標準化串塑。transform函數(shù)緊接著將定義好的規(guī)則應用對傳入的特征進行對應轉換沼琉。
  • from sklearn.decomposition import PCA,并設置PCA(n_components=5)的參數(shù)n_components表示將原始數(shù)據(jù)降低到n個維度桩匪。

實訓2 構建基于wine數(shù)據(jù)集的k- Means聚類模型

1.訓練要點

  • 了解sklearn估計器的用法打瘪。
  • 掌握聚類模型的構建方法。
  • 掌握聚類模型的評價方法傻昙。

2.需求說明

wine數(shù)據(jù)集的葡萄酒總共分為3種,通過將wine數(shù)據(jù)集的數(shù)據(jù)進行聚類,聚集為3 個簇,能夠實現(xiàn)葡萄酒的類別劃分闺骚。

3.實現(xiàn)思路及步驟

  • 根據(jù)實訓1的wine數(shù)據(jù)集處理的結果,構建聚類數(shù)目為3的KMeans模型。
  • 在聚類數(shù)目為2~10類時,確定最優(yōu)聚類數(shù)目妆档。
  • 求取 Calinski-Harabaz-score指數(shù),確定最優(yōu)聚類數(shù)目僻爽。

實訓3 構建基于wine數(shù)據(jù)集的SVM分類模型

1.訓練要點

掌握sklearn估計器的用法。
掌握分類模型的構建方法贾惦。
掌握分類模型的評價方法胸梆。

2.需求說明

wine數(shù)據(jù)集中的葡萄酒類別為3種,將wie數(shù)據(jù)集劃分為訓練集和測試集,使用訓練集訓練SVM分類模型,并使用訓練完成的模型預測測試集的葡萄酒類別歸屬敦捧。

3.實現(xiàn)思路及步驟

  • 讀取wine數(shù)據(jù)集,區(qū)分標簽和數(shù)據(jù)。
  • 將wine數(shù)據(jù)集劃分為訓練集和測試集
  • 使用離差標準化方法標準化wine數(shù)據(jù)集碰镜。
  • 構建SVM模型,并預測測試集結果兢卵。
  • 打印出分類報告,評價分類模型性能。

提示:

  • from sklearn.preprocessing import MinMaxScaler 離差標準化方法
  • from sklearn.svm import SVC 支持向量機方法分類
  • from sklearn.metrics import classification_report 查看分類得分

實訓4 構建基于wine_quality數(shù)據(jù)集的回歸模型

1.訓練要點

掌握sklearn估計器的用法绪颖。
掌握回歸模型的構建方法秽荤。
掌握回歸模型的評價方法。

2.需求說明

wine_quality數(shù)據(jù)集中的葡萄酒評分在1-10之間,將wine_quality數(shù)據(jù)集劃分為訓練集和測試集,構建線性回歸模型菠发,
并使用訓練完成的模型預測測試集的葡萄酒評分王滤。

3.實現(xiàn)思路及步驟

  • 讀取wine_quality數(shù)據(jù)集贺嫂。
  • 將wine數(shù)據(jù)集劃分為訓練集和測試集
  • 使用標準化方法標準化wine數(shù)據(jù)集滓鸠。
  • 構建線性回歸模型,并預測測試集結果。
  • 比較其他線性模型

提示:

|模塊名稱| 函數(shù)名稱| 算法名稱|
|:----:|:----:|:----:|
|linear_model| LinearRegession| 線性回歸|
|svm| SVR|支撐向量回歸|
|neighbors| KNeighborRegressor| 最近鄰回歸|
|tree| DecisionTreeRegressor| 決策樹回歸|
|ensemble| RandomForestRegressor| 隨機森林回歸|
|ensemble| GradientBoostingRegressor|梯度提升回歸|

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末第喳,一起剝皮案震驚了整個濱河市糜俗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌曲饱,老刑警劉巖悠抹,帶你破解...
    沈念sama閱讀 223,126評論 6 520
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異扩淀,居然都是意外死亡楔敌,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,421評論 3 400
  • 文/潘曉璐 我一進店門驻谆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來卵凑,“玉大人,你說我怎么就攤上這事胜臊∩茁” “怎么了?”我有些...
    開封第一講書人閱讀 169,941評論 0 366
  • 文/不壞的土叔 我叫張陵象对,是天一觀的道長黑忱。 經常有香客問我,道長勒魔,這世上最難降的妖魔是什么甫煞? 我笑而不...
    開封第一講書人閱讀 60,294評論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮冠绢,結果婚禮上危虱,老公的妹妹穿的比我還像新娘。我一直安慰自己唐全,他們只是感情好埃跷,可當我...
    茶點故事閱讀 69,295評論 6 398
  • 文/花漫 我一把揭開白布蕊玷。 她就那樣靜靜地躺著,像睡著了一般弥雹。 火紅的嫁衣襯著肌膚如雪垃帅。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,874評論 1 314
  • 那天剪勿,我揣著相機與錄音贸诚,去河邊找鬼。 笑死厕吉,一個胖子當著我的面吹牛酱固,可吹牛的內容都是我干的。 我是一名探鬼主播头朱,決...
    沈念sama閱讀 41,285評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼运悲,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了项钮?” 一聲冷哼從身側響起班眯,我...
    開封第一講書人閱讀 40,249評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎烁巫,沒想到半個月后署隘,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 46,760評論 1 321
  • 正文 獨居荒郊野嶺守林人離奇死亡亚隙,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,840評論 3 343
  • 正文 我和宋清朗相戀三年磁餐,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片阿弃。...
    茶點故事閱讀 40,973評論 1 354
  • 序言:一個原本活蹦亂跳的男人離奇死亡诊霹,死狀恐怖,靈堂內的尸體忽然破棺而出恤浪,到底是詐尸還是另有隱情畅哑,我是刑警寧澤,帶...
    沈念sama閱讀 36,631評論 5 351
  • 正文 年R本政府宣布水由,位于F島的核電站荠呐,受9級特大地震影響,放射性物質發(fā)生泄漏砂客。R本人自食惡果不足惜泥张,卻給世界環(huán)境...
    茶點故事閱讀 42,315評論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望鞠值。 院中可真熱鬧媚创,春花似錦、人聲如沸彤恶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,797評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至芒炼,卻和暖如春瘫怜,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背本刽。 一陣腳步聲響...
    開封第一講書人閱讀 33,926評論 1 275
  • 我被黑心中介騙來泰國打工鲸湃, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人子寓。 一個月前我還...
    沈念sama閱讀 49,431評論 3 379
  • 正文 我出身青樓暗挑,卻偏偏與公主長得像,于是被迫代替她去往敵國和親斜友。 傳聞我的和親對象是個殘疾皇子炸裆,可洞房花燭夜當晚...
    茶點故事閱讀 45,982評論 2 361

推薦閱讀更多精彩內容