5、sklearn模型建立及評估

前置工作

填充數(shù)據(jù)

#讀取數(shù)據(jù)
data = pd.read_csv('clear_data.csv') 
#對分類變量進行填充膊存,填充值為‘NA’
train['Cabin'] = train['Cabin'].fillna('NA')  
# 對連續(xù)變量進行填充嚼蚀,填充值為該特征的平均值
train['Age'] = train['Age'].fillna(train['Age'].mean())
# 檢查缺失值比例
train.isnull().mean().sort_values(ascending=False)
--------------------------------------------------------------
Embarked       0.0
Cabin          0.0
Fare           0.0
Ticket         0.0
Parch          0.0
SibSp          0.0
Age            0.0
Sex            0.0
Name           0.0
Pclass         0.0
Survived       0.0
PassengerId    0.0
dtype: float64

編碼分類變量

#取出輸入特征
data = train[['Pclass','Sex','Age','SibSp','Parch','Fare', 'Embarked']]
#對分類變量進行one-hot編碼
data = pd.get_dummies(data)

劃分數(shù)據(jù)集

X = data
y = train['Survived']
# 對數(shù)據(jù)集進行切割
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=0)

模型搭建

from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier

#創(chuàng)建默認參數(shù)的邏輯回歸模型
lr = LogisticRegression()  
# 默認參數(shù)的隨機森林分類模型
rfc = RandomForestClassifier()
#使模型擬合數(shù)據(jù)
lr.fit(X_train, y_train)
rfc.fit(X_train, y_train)
# 輸出模型的預測結(jié)果
pred = lr.predict(X_train)
print(pred[:10])
--------------------------------------------------------------
array([0, 1, 1, 1, 0, 0, 1, 0, 1, 1], dtype=int64)
# 預測標簽概率
pred_proba = lr.predict_proba(X_train)
pred_proba[:10]

模型評估

模型評估是為了知道模型的泛化能力,主要指標有:
1禁灼、準確率,樣本被預測正確的比例
2轿曙、精確率(precision)度量的是被預測為正例的樣本中有多少是真正的正例
3弄捕、召回率(recall)度量的是正類樣本中有多少被預測為正類
4、f-分數(shù)是準確率與召回率的調(diào)和平均

用5折交叉驗證來評估邏輯回歸模型的score
交叉驗證(cross-validation)是一種評估泛化性能的統(tǒng)計學方法导帝,它比單次劃分訓練集和測試集的方法更加穩(wěn)定守谓、全面。最常用的交叉驗證是 k 折交叉驗證您单,其中 k 是由用戶指定的數(shù)字斋荞,通常取 5 或 10。

from sklearn.model_selection import cross_val_score

lr = LogisticRegression(C=100)
scores = cross_val_score(lr, X_train, y_train, cv=5)
scores.mean()    

計算精確率虐秦、召回率以及f-分數(shù)

# 訓練模型
lr = LogisticRegression(C=100)
lr.fit(X_train, y_train)
pred = lr.predict(X_train)
# 混淆矩陣
>> confusion_matrix(y_train, pred)  #[TN,FP
                                    #FN,TP]
array([[350,  62],                            
       [ 71, 185]], dtype=int64)
# 精確率平酿、召回率以及f1-score
from sklearn.metrics import classification_report        
print(classification_report(y_train, pred)) 
------------------------------------------------------------
precision    recall  f1-score   support

          0       0.83      0.85      0.84       412
          1       0.75      0.72      0.74       256

avg / total       0.80      0.80      0.80       668
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末凤优,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子蜈彼,更是在濱河造成了極大的恐慌筑辨,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件幸逆,死亡現(xiàn)場離奇詭異棍辕,居然都是意外死亡,警方通過查閱死者的電腦和手機还绘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進店門楚昭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人拍顷,你說我怎么就攤上這事抚太。” “怎么了菇怀?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵凭舶,是天一觀的道長。 經(jīng)常有香客問我爱沟,道長帅霜,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任呼伸,我火速辦了婚禮身冀,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘括享。我一直安慰自己搂根,他們只是感情好,可當我...
    茶點故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布铃辖。 她就那樣靜靜地躺著剩愧,像睡著了一般。 火紅的嫁衣襯著肌膚如雪娇斩。 梳的紋絲不亂的頭發(fā)上仁卷,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天,我揣著相機與錄音犬第,去河邊找鬼锦积。 笑死,一個胖子當著我的面吹牛歉嗓,可吹牛的內(nèi)容都是我干的丰介。 我是一名探鬼主播,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼哮幢!你這毒婦竟也來了带膀?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤橙垢,失蹤者是張志新(化名)和其女友劉穎本砰,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體钢悲,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年舔株,在試婚紗的時候發(fā)現(xiàn)自己被綠了莺琳。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡载慈,死狀恐怖惭等,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情办铡,我是刑警寧澤辞做,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布,位于F島的核電站寡具,受9級特大地震影響秤茅,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜童叠,卻給世界環(huán)境...
    茶點故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一框喳、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧厦坛,春花似錦五垮、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至撬碟,卻和暖如春诞挨,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背小作。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工亭姥, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人顾稀。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓达罗,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子粮揉,可洞房花燭夜當晚...
    茶點故事閱讀 45,440評論 2 359