交叉驗證

對于線性回歸:
方法一:以前的cross validation中有一種方法是train/test split,現(xiàn)在挪到model_selection庫中优烧,randomly partition the data into training and test sets, by default, 25 percent of the data is assigned to the test set结澄。這種方法只能得到一次劃分結(jié)果的評估結(jié)果幽污,不準確吁津。

score算的是r-squared系數(shù)凭舶,好像score和cross_val_score默認算的就是r-squared系統(tǒng)

// from sklearn.model_selection import train_test_split
// X_train,X_test,y_train,y_test=train_test_split(X,y)
// model=LinearRegression()
// model.fit(X,y)
// model.score(X_test,y_test)

方法二:用model_selection庫中的cross_val_score
// from sklearn.model_selection import cross_val_score
// model=LinearRegression()
// scores=cross_val_score(model,X,y,cv=5)

cv=5表示cross_val_score采用的是k-fold cross validation的方法咽筋,重復(fù)5次交叉驗證

實際上溶推,cross_val_score可以用的方法有很多,如kFold, leave-one-out, ShuffleSplit等奸攻,舉例而言:

//cv=ShuffleSplit(n_splits=3,test_size=0.3,random_state=0)
//cross_val_score(model, X,y, cv=cv)

對于邏輯回歸:
邏輯回歸用于處理分類問題蒜危,線性回歸求解how far it was from the decision boundary(求距離)的評估方式明顯不適合分類問題。
The most common metrics are accuracy, precision, recall, F1 measure, true negatives, false positives and false negatives
1睹耐、計算confusion matrix
Confusion matrix 由 true positives, true negatives, false positives以及 false negatives組成辐赞。
// confusion_matrix=confusion_matrix(y_test, y_pred)
2、accuracy: measures a fraction of the classifier's predictions that are correct.
// accuracy_score(y_true,y_pred)
LogisticRegression.score() 默認使用accuracy
3硝训、precision: 比如說我們預(yù)測得了cancer中實際確實得病的百分比
// classifier=LogisticRegression()
// classifier.fit(X_train,y_train)
// precisions= cross_val_score(classifier, X_train,y_train,cv=5,scoring='precision')
4响委、recall: 比如說實際得了cancer新思,被我們預(yù)測出來的百分比
// recalls= cross_val_score(classifier,X_train,y_train,cv=5,scoring='recall')
5、precision和recall之間是一個trade-off的關(guān)系赘风,用F1score來表征性能夹囚,F(xiàn)1score越高越好
// fls=cross_val_score(classifier, X_train, y_train, cv=5,scoring='f1')
6、ROC曲線和AUC的值
ROC曲線的橫坐標為false positive rate(FPR),縱坐標為true positive rate(TPR)
AUC數(shù)值=ROC曲線下的面積
// classifier=LogisticRegression()
// classifier.fit(X_train, y_train)
// predictions = classifier.predict_proba(X_test)
// false_positive_rate, recall, thresholds = roc_curve(y_test, predictions[:,1])
// roc_auc=auc(false_positive_rate, recall)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末邀窃,一起剝皮案震驚了整個濱河市崔兴,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌蛔翅,老刑警劉巖敲茄,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異山析,居然都是意外死亡堰燎,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進店門笋轨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來秆剪,“玉大人,你說我怎么就攤上這事爵政〗龇恚” “怎么了?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵钾挟,是天一觀的道長洁灵。 經(jīng)常有香客問我,道長掺出,這世上最難降的妖魔是什么徽千? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮汤锨,結(jié)果婚禮上双抽,老公的妹妹穿的比我還像新娘。我一直安慰自己闲礼,他們只是感情好牍汹,可當我...
    茶點故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著柬泽,像睡著了一般慎菲。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上聂抢,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天钧嘶,我揣著相機與錄音棠众,去河邊找鬼琳疏。 笑死有决,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的空盼。 我是一名探鬼主播书幕,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼揽趾!你這毒婦竟也來了台汇?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤篱瞎,失蹤者是張志新(化名)和其女友劉穎苟呐,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體俐筋,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡牵素,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了澄者。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片笆呆。...
    茶點故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖粱挡,靈堂內(nèi)的尸體忽然破棺而出赠幕,到底是詐尸還是另有隱情,我是刑警寧澤询筏,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布榕堰,位于F島的核電站,受9級特大地震影響嫌套,放射性物質(zhì)發(fā)生泄漏局冰。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一灌危、第九天 我趴在偏房一處隱蔽的房頂上張望康二。 院中可真熱鬧,春花似錦勇蝙、人聲如沸沫勿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽产雹。三九已至,卻和暖如春翁锡,著一層夾襖步出監(jiān)牢的瞬間蔓挖,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工馆衔, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留瘟判,地道東北人怨绣。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像拷获,于是被迫代替她去往敵國和親篮撑。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容