交叉驗證

對于線性回歸：
方法一：以前的cross validation中有一種方法是train/test split，現(xiàn)在挪到model_selection庫中优烧，randomly partition the data into training and test sets, by default, 25 percent of the data is assigned to the test set结澄。這種方法只能得到一次劃分結(jié)果的評估結(jié)果幽污，不準確吁津。

score算的是r-squared系數(shù)凭舶，好像score和cross_val_score默認算的就是r-squared系統(tǒng)

// from sklearn.model_selection import train_test_split
// X_train,X_test,y_train,y_test=train_test_split(X,y)
// model=LinearRegression()
// model.fit(X,y)
// model.score(X_test,y_test)

方法二：用model_selection庫中的cross_val_score
// from sklearn.model_selection import cross_val_score
// model=LinearRegression()
// scores=cross_val_score(model,X,y,cv=5)

cv=5表示cross_val_score采用的是k-fold cross validation的方法咽筋，重復(fù)5次交叉驗證

實際上溶推，cross_val_score可以用的方法有很多，如kFold, leave-one-out, ShuffleSplit等奸攻，舉例而言：

//cv=ShuffleSplit(n_splits=3,test_size=0.3,random_state=0)
//cross_val_score(model, X,y, cv=cv)

對于邏輯回歸：
邏輯回歸用于處理分類問題蒜危，線性回歸求解how far it was from the decision boundary（求距離）的評估方式明顯不適合分類問題。
The most common metrics are accuracy, precision, recall, F1 measure, true negatives, false positives and false negatives
1睹耐、計算confusion matrix
Confusion matrix 由 true positives, true negatives, false positives以及 false negatives組成辐赞。
// confusion_matrix=confusion_matrix(y_test, y_pred)
2、accuracy: measures a fraction of the classifier's predictions that are correct.
// accuracy_score(y_true,y_pred)
LogisticRegression.score() 默認使用accuracy
3硝训、precision: 比如說我們預(yù)測得了cancer中實際確實得病的百分比
// classifier=LogisticRegression()
// classifier.fit(X_train,y_train)
// precisions= cross_val_score(classifier, X_train,y_train,cv=5,scoring='precision')
4响委、recall: 比如說實際得了cancer新思，被我們預(yù)測出來的百分比
// recalls= cross_val_score(classifier,X_train,y_train,cv=5,scoring='recall')
5、precision和recall之間是一個trade-off的關(guān)系赘风，用F1score來表征性能夹囚，F(xiàn)1score越高越好
// fls=cross_val_score(classifier, X_train, y_train, cv=5,scoring='f1')
6、ROC曲線和AUC的值
ROC曲線的橫坐標為false positive rate(FPR),縱坐標為true positive rate(TPR)
AUC數(shù)值=ROC曲線下的面積
// classifier=LogisticRegression()
// classifier.fit(X_train, y_train)
// predictions = classifier.predict_proba(X_test)
// false_positive_rate, recall, thresholds = roc_curve(y_test, predictions[:,1])
// roc_auc=auc(false_positive_rate, recall)

最后編輯于：2017.12.06 04:58:38

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末邀窃，一起剝皮案震驚了整個濱河市崔兴，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌蛔翅，老刑警劉巖敲茄，帶你破解...
沈念sama閱讀 221,198評論 6贊 514
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異山析，居然都是意外死亡堰燎，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,334評論 3贊 398
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門笋轨，熙熙樓的掌柜王于貴愁眉苦臉地迎上來秆剪，“玉大人，你說我怎么就攤上這事爵政〗龇恚” “怎么了？”我有些...
開封第一講書人閱讀 167,643評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵钾挟，是天一觀的道長洁灵。經(jīng)常有香客問我，道長掺出，這世上最難降的妖魔是什么徽千？我笑而不...
開封第一講書人閱讀 59,495評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮汤锨，結(jié)果婚禮上双抽，老公的妹妹穿的比我還像新娘。我一直安慰自己闲礼，他們只是感情好牍汹，可當我...
茶點故事閱讀 68,502評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著柬泽，像睡著了一般慎菲。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上聂抢，一...
開封第一講書人閱讀 52,156評論 1贊 308
城市分裂傳說
那天钧嘶，我揣著相機與錄音棠众，去河邊找鬼琳疏。笑死有决，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的空盼。我是一名探鬼主播书幕，決...
沈念sama閱讀 40,743評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼揽趾！你這毒婦竟也來了台汇？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,659評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤篱瞎，失蹤者是張志新（化名）和其女友劉穎苟呐，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體俐筋，經(jīng)...
沈念sama閱讀 46,200評論 1贊 319
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡牵素，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,282評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了澄者。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片笆呆。...
茶點故事閱讀 40,424評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖粱挡，靈堂內(nèi)的尸體忽然破棺而出赠幕，到底是詐尸還是另有隱情，我是刑警寧澤询筏，帶...
沈念sama閱讀 36,107評論 5贊 349
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布榕堰，位于F島的核電站，受9級特大地震影響嫌套，放射性物質(zhì)發(fā)生泄漏局冰。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,789評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一灌危、第九天我趴在偏房一處隱蔽的房頂上張望康二。院中可真熱鬧，春花似錦勇蝙、人聲如沸沫勿。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,264評論 0贊 23
一樁弒父案味混，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽产雹。三九已至，卻和暖如春翁锡，著一層夾襖步出監(jiān)牢的瞬間蔓挖，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,390評論 1贊 271
情欲美人皮
我被黑心中介騙來泰國打工馆衔，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留瘟判，地道東北人怨绣。一個月前我還...
沈念sama閱讀 48,798評論 3贊 376
代替公主和親
正文我出身青樓，卻偏偏與公主長得像拷获，于是被迫代替她去往敵國和親篮撑。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 45,435評論 2贊 359

交叉驗證

score算的是r-squared系數(shù)凭舶，好像score和cross_val_score默認算的就是r-squared系統(tǒng)

cv=5表示cross_val_score采用的是k-fold cross validation的方法咽筋，重復(fù)5次交叉驗證

實際上溶推，cross_val_score可以用的方法有很多，如kFold, leave-one-out, ShuffleSplit等奸攻，舉例而言：

推薦閱讀更多精彩內(nèi)容