本節(jié)我們將繼續(xù)基于 Scikit-Learn 庫的相關模塊测暗,向大家介紹 Python 中一些模型驗證及調(diào)優(yōu)的工具。
為了方便后續(xù)的演示褐缠,首先導入示例數(shù)據(jù)集 iris脱货,并對數(shù)據(jù)特征與標記(即模型的自變量與因變量)進行提取劃分:
我們構建一個 KNN 分類模型 model岛都,用于驗證準備:
模型擬合與預測:
導入 metrics 模塊的 accuracy_score 函數(shù),該函數(shù)能夠幫助我們計算模型的準確率:
交叉驗證是機器學習中常用的模型驗證方法振峻,這需要我們將數(shù)據(jù)集劃分為訓練集與驗證集臼疫,cross_validation 模塊中的 train_test_split 函數(shù)能夠幫助我們實現(xiàn)較輕松的劃分:
未完待續(xù):課程內(nèi)容較多,請復制鏈接通過電腦學習扣孟,獲得最佳學習效果烫堤。 http://datacademy.io/lesson/138
更多課程和文章盡在微信號:「datartisan數(shù)據(jù)工匠」