【邏輯回歸】-案例練習(xí)

本周學(xué)習(xí)了邏輯回歸的原理思路躺翻,利用歷史考期成績(jī)對(duì)學(xué)生本輪考試是否通過(guò)進(jìn)行預(yù)測(cè)丧叽。以下為數(shù)據(jù)涉及字段:
省份,學(xué)生ID公你,考期踊淳,科目,分?jǐn)?shù)陕靠,描述迂尝,是否通過(guò),小組剪芥,班主任垄开,學(xué)院名稱,家族税肪,子訂單id溉躲,預(yù)估分,分?jǐn)?shù)區(qū)間寸认。
以上字段中签财,描述/考期/子訂單id/學(xué)生id/分?jǐn)?shù)區(qū)間經(jīng)業(yè)務(wù)考慮屬于無(wú)效或重復(fù)字段。
數(shù)據(jù)清洗部分省略偏塞,以下進(jìn)行模型的數(shù)據(jù)處理唱蒸。

一. 離散特征的處理

df.loc[df['分?jǐn)?shù)']>=60,'target']=1
df.loc[df['分?jǐn)?shù)']<60,'target']=0
df.head(5)

二. 連續(xù)特征標(biāo)準(zhǔn)化

from sklearn.linear_model import stochastic_gradient
from sklearn.cross_validation import StratifiedKFold

cat_columns=['省份','科目','小組','班主任','學(xué)員名稱','家族']
num_columns=['預(yù)估分']
target_column='target'
encode_df=pd.get_dummies(df,columns=cat_columns)

df_x=encode_df.drop(columns=target_column)
df_y=encode_df[target_column]

df_y=df_y.values

num_mean=df_x[num_columns].mean()
num_std=df_x[num_columns].std()
num_normal=(df_x[num_columns]-num_mean)/num_std

df_x = df_x.drop(columns=num_columns) # 刪除沒(méi)有歸一化的數(shù)值型數(shù)據(jù)

df_x = pd.concat([df_x,num_normal],axis = 1) # concat歸一化數(shù)據(jù)

df_x = df_x.values

三. 訓(xùn)練/測(cè)試:數(shù)據(jù)集劃分

from sklearn.model_selection import StratifiedShuffleSplit
sss = StratifiedShuffleSplit(n_splits=2,train_size=0.7)
for train_index,test_index in sss.split(df_x,df_y):
    trainx,testx = df_x[train_index],df_x[test_index]
    trainy,testy = df_y[train_index],df_y[test_index]

四. 構(gòu)建模型

from sklearn.linear_model import SGDClassifier   #梯度下降
lr = SGDClassifier(loss="log",max_iter = 100)     #最大迭代次數(shù)少 100.
lr.fit(trainx,trainy)  

五.測(cè)試模型效果

from sklearn.metrics import roc_auc_score,precision_recall_curve,classification_report,roc_curve

pred = lr.predict_proba(testx)[:,1]  #預(yù)測(cè)概率
pred_labels = lr.predict(testx)   #預(yù)測(cè)0,1值

# ROC
print(roc_auc_score(testy,pred))  #預(yù)測(cè)roc曲線下的面積:0.907

# 分類(lèi)報(bào)告
print(classification_report(testy,pred_labels))  
precision,recall,_ = precision_recall_curve(testy,pred)  #pre灸叼,recall神汹,閾值。
plt.plot(recall,precision)
image.png
# roc curve
fpr,tpr,_ = roc_curve(testy,pred) #繪制roc曲線 
plt.plot(fpr,tpr)
image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末古今,一起剝皮案震驚了整個(gè)濱河市屁魏,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌捉腥,老刑警劉巖氓拼,帶你破解...
    沈念sama閱讀 211,561評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡桃漾,警方通過(guò)查閱死者的電腦和手機(jī)坏匪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,218評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)撬统,“玉大人适滓,你說(shuō)我怎么就攤上這事×底罚” “怎么了凭迹?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,162評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)苦囱。 經(jīng)常有香客問(wèn)我嗅绸,道長(zhǎng),這世上最難降的妖魔是什么撕彤? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,470評(píng)論 1 283
  • 正文 為了忘掉前任朽砰,我火速辦了婚禮,結(jié)果婚禮上喉刘,老公的妹妹穿的比我還像新娘。我一直安慰自己漆弄,他們只是感情好睦裳,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,550評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著撼唾,像睡著了一般廉邑。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上倒谷,一...
    開(kāi)封第一講書(shū)人閱讀 49,806評(píng)論 1 290
  • 那天蛛蒙,我揣著相機(jī)與錄音,去河邊找鬼渤愁。 笑死牵祟,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的抖格。 我是一名探鬼主播诺苹,決...
    沈念sama閱讀 38,951評(píng)論 3 407
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼雹拄!你這毒婦竟也來(lái)了收奔?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,712評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤滓玖,失蹤者是張志新(化名)和其女友劉穎坪哄,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,166評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡翩肌,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,510評(píng)論 2 327
  • 正文 我和宋清朗相戀三年模暗,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片摧阅。...
    茶點(diǎn)故事閱讀 38,643評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡汰蓉,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出棒卷,到底是詐尸還是另有隱情顾孽,我是刑警寧澤,帶...
    沈念sama閱讀 34,306評(píng)論 4 330
  • 正文 年R本政府宣布比规,位于F島的核電站若厚,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏蜒什。R本人自食惡果不足惜测秸,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,930評(píng)論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望灾常。 院中可真熱鬧霎冯,春花似錦、人聲如沸钞瀑。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,745評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)雕什。三九已至缠俺,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間贷岸,已是汗流浹背壹士。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,983評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留偿警,地道東北人躏救。 一個(gè)月前我還...
    沈念sama閱讀 46,351評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像螟蒸,于是被迫代替她去往敵國(guó)和親落剪。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,509評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • 眾所周知尿庐,在有些領(lǐng)域中國(guó)人只取得很少甚至根本沒(méi)有什么進(jìn)步忠怖。這不僅有自然科學(xué)方面的,也有純粹抽象科學(xué)方面的抄瑟,諸如科學(xué)...
    洸洸_bd31閱讀 234評(píng)論 0 0
  • 947樂(lè)訊 作為中國(guó)文化走出去項(xiàng)目之一凡泣,本月廣東民族樂(lè)團(tuán)將首次出訪美國(guó)枉疼,在舊金山和西雅圖各舉辦一場(chǎng)演出。根據(jù)此前安...
    經(jīng)典947閱讀 311評(píng)論 0 0
  • 執(zhí)筆|三生有狐 天元十一年鞋拟,夏骂维。 那是一個(gè)悶熱潮濕的夜晚,寂靜無(wú)聲贺纲,卻并非寧?kù)o航闺,暴風(fēng)雨就要來(lái)了。 萬(wàn)俟山莊的一間小...
    狐則閱讀 937評(píng)論 3 15
  • 1.看癥狀猴誊。痱子一般是發(fā)白的小尖潦刃,密集成片,界限清晰懈叹,嚴(yán)重時(shí)可能有白色膿點(diǎn)乖杠;濕疹是大小不等的紅色丘疹或皰疹,可融合...
    喻莉閱讀 555評(píng)論 0 0