ML 監(jiān)督學(xué)習(xí) 分類 邏輯回歸

邏輯回歸(logistic regression)又稱“對數(shù)幾率回歸风瘦。雖然它的名字是回歸凹蜈,但卻是一種分類學(xué)習(xí)方法。邏輯回歸也可以從二元分類擴(kuò)展到多分類糕伐,這就是多項(xiàng)式回歸砰琢。

1.構(gòu)造預(yù)測函數(shù)h(x)


Sigmoid Function

對數(shù)幾率函數(shù)是一種“Sigmoid"函數(shù),Sigmoid的函數(shù)輸出是介于(0,1)之間,中間值是0.5陪汽。sig(t)<0.5則說明當(dāng)前數(shù)據(jù)屬于反類/0類训唱;sig(t)>0.5則說明當(dāng)前數(shù)據(jù)屬于正類/1類。所以可以將sigmoid函數(shù)看成樣本數(shù)據(jù)的概率密度函數(shù)挚冤。

2.構(gòu)造損失函數(shù)
用最大似然法估計(jì)參數(shù)况增,優(yōu)點(diǎn):大樣本數(shù)據(jù)中參數(shù)的估計(jì)穩(wěn)定,偏差小你辣,估計(jì)方差小巡通。
概率函數(shù):

因?yàn)闃颖緮?shù)據(jù)(m個)獨(dú)立,取似然函數(shù)為:

取對數(shù)似然函數(shù):

基于最大似然估計(jì)推導(dǎo)得到Cost函數(shù)和J函數(shù):

3.梯度下降求最小值

模型的改進(jìn)

避免過擬合---正則化
讓準(zhǔn)確率最大化---SVM

Kernal Logistics Regression

請參考別人寫的文章https://blog.csdn.net/qq_34993631/article/details/79345889
配視頻
https://www.youtube.com/watch?v=AbaIkcQUQuo

L1,L2正則化比較

L2是收縮舍哄,L2稀疏性
L2比L1要快
建議用邏輯回歸是至少用一個正則化宴凉,特征要標(biāo)準(zhǔn)化。

線性回歸與邏輯回歸的比較
邏輯回歸與樸素貝葉斯的比較

因?yàn)闃闼刎惾~斯對數(shù)據(jù)做出了更強(qiáng)的假設(shè)表悬,但需要更少的示例來估計(jì)參數(shù)

例子
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.metrics import roc_curve,roc_auc_score,accuracy_score,confusion_matrix
from sklearn.linear_model import LogisticRegression

candidates = {'gmat': [780,750,690,710,680,730,690,720,740,690,610,690,710,680,770,610,580,650,540,590,620,600,550,550,570,670,660,580,650,660,640,620,660,660,680,650,670,580,590,690],
              'gpa': [4,3.9,3.3,3.7,3.9,3.7,2.3,3.3,3.3,1.7,2.7,3.7,3.7,3.3,3.3,3,2.7,3.7,2.7,2.3,3.3,2,2.3,2.7,3,3.3,3.7,2.3,3.7,3.3,3,2.7,4,3.3,3.3,2.3,2.7,3.3,1.7,3.7],
              'work_experience': [3,4,3,5,4,6,1,4,5,1,3,5,6,4,3,1,4,6,2,3,2,1,4,1,2,6,4,2,6,5,1,2,4,6,5,1,2,1,4,5],
              'admitted': [1,1,1,1,1,1,0,1,1,0,0,1,1,1,1,0,0,1,0,0,0,0,0,0,0,1,1,0,1,1,0,0,1,1,1,0,0,0,0,1]
              }

df = pd.DataFrame(candidates,columns= ['gmat', 'gpa','work_experience','admitted'])

X = df[['gmat', 'gpa','work_experience']]
y = df['admitted']  

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=0)  #train is based on 75% of the dataset, test is based on 25% of dataset

logistic_regression= LogisticRegression()  #邏輯回歸
logistic_regression.fit(X_train,y_train)   #訓(xùn)練
y_pred=logistic_regression.predict(X_test) #預(yù)測

print (X_test) #test dataset
print (y_pred) #predicted values

print(confusion_matrix(y_test, y_pred))
print("Accuracy:",accuracy_score(y_test, y_pred))

#Plot ROC curve
y_pred_proba = logistic_regression.predict_proba(X_test)[::,1]
fpr, tpr, _ = roc_curve(y_test,  y_pred_proba)
auc = roc_auc_score(y_test, y_pred_proba)
plt.plot(fpr,tpr,label="data 1, auc="+str(auc))
plt.legend(loc=4)
plt.show()
ROC Curve

ROC曲線的縱軸是“真正例率”弥锄,橫軸是“假正例率”。

總結(jié)
Conclusion
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蟆沫,一起剝皮案震驚了整個濱河市籽暇,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌饭庞,老刑警劉巖戒悠,帶你破解...
    沈念sama閱讀 212,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異舟山,居然都是意外死亡绸狐,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,755評論 3 385
  • 文/潘曉璐 我一進(jìn)店門累盗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來寒矿,“玉大人,你說我怎么就攤上這事若债》啵” “怎么了?”我有些...
    開封第一講書人閱讀 158,369評論 0 348
  • 文/不壞的土叔 我叫張陵蠢琳,是天一觀的道長啊终。 經(jīng)常有香客問我,道長挪凑,這世上最難降的妖魔是什么孕索? 我笑而不...
    開封第一講書人閱讀 56,799評論 1 285
  • 正文 為了忘掉前任,我火速辦了婚禮躏碳,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己菇绵,他們只是感情好肄渗,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,910評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著咬最,像睡著了一般翎嫡。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上永乌,一...
    開封第一講書人閱讀 50,096評論 1 291
  • 那天惑申,我揣著相機(jī)與錄音,去河邊找鬼翅雏。 笑死圈驼,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的望几。 我是一名探鬼主播绩脆,決...
    沈念sama閱讀 39,159評論 3 411
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼橄抹!你這毒婦竟也來了靴迫?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,917評論 0 268
  • 序言:老撾萬榮一對情侶失蹤楼誓,失蹤者是張志新(化名)和其女友劉穎玉锌,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體疟羹,經(jīng)...
    沈念sama閱讀 44,360評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡主守,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,673評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了阁猜。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片丸逸。...
    茶點(diǎn)故事閱讀 38,814評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖剃袍,靈堂內(nèi)的尸體忽然破棺而出黄刚,到底是詐尸還是另有隱情,我是刑警寧澤民效,帶...
    沈念sama閱讀 34,509評論 4 334
  • 正文 年R本政府宣布憔维,位于F島的核電站,受9級特大地震影響畏邢,放射性物質(zhì)發(fā)生泄漏业扒。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,156評論 3 317
  • 文/蒙蒙 一舒萎、第九天 我趴在偏房一處隱蔽的房頂上張望程储。 院中可真熱鬧,春花似錦、人聲如沸章鲤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽败徊。三九已至帚呼,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間皱蹦,已是汗流浹背煤杀。 一陣腳步聲響...
    開封第一講書人閱讀 32,123評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留沪哺,地道東北人沈自。 一個月前我還...
    沈念sama閱讀 46,641評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像凤粗,于是被迫代替她去往敵國和親酥泛。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,728評論 2 351

推薦閱讀更多精彩內(nèi)容