一酝豪、什么是邏輯回歸?
邏輯回歸是機(jī)器學(xué)習(xí)中的一個基礎(chǔ)的算法精堕,他與線性回歸類似孵淘,與線性回歸不同的是它預(yù)測的分類問題哪廓。例如根據(jù)疾病影像學(xué)的病理特征來預(yù)測患有某種疾病的概率鼓择,郵件垃圾的分類等涩搓,邏輯回歸廣泛應(yīng)用于醫(yī)學(xué)和社會各領(lǐng)域姿锭。
二杏节、邏輯回歸的原理:
邏輯回歸是監(jiān)督學(xué)習(xí)中的一種凹嘲,它根據(jù)大量帶有分類標(biāo)簽的特征變量來訓(xùn)練優(yōu)化模型癌刽,在根據(jù)模型來預(yù)測只有特征變量的分類標(biāo)簽颖侄。在鳶尾花案例中重窟,我們通過許多帶有分類標(biāo)簽(鳶尾花的三種類別)的特征變量數(shù)據(jù)來訓(xùn)練預(yù)測鳶尾花類別的模型载萌,這些特征變量有:花瓣的長度、花瓣的寬度巡扇、花萼的長度扭仁、花萼的寬度。為實現(xiàn)預(yù)測分類問題的目的我們利用了Logistic函數(shù)(或者成為Sigmoid函數(shù)):
整個函數(shù)的圖象如下:
Sigmoid函數(shù)有一些特點厅翔,比如當(dāng)z=0是logi(z)=0.5,當(dāng)z<0時乖坠,0<logi(z)<0.5;當(dāng)z>0時,0.5<logi(z)<1.所以logi(z)函數(shù)的取值范圍為(0,1)刀闷。
其中回歸的基本方程為:
我們可以把logi(z)的函數(shù)值看成類別為1的概率預(yù)測值熊泵,當(dāng)logi(z)<0.5時,我們預(yù)測的分類為0甸昏;當(dāng)logi(z)>=0.5時顽分,我們預(yù)測的分類為1.
對于多分類,將多個二分類的邏輯回歸組合即可實現(xiàn)施蜜。
三卒蘸、鳶尾花案例
1、機(jī)器學(xué)習(xí)通常有以下幾個步驟:(1)數(shù)據(jù)獲取和預(yù)處理 (2)建立模型 (3)訓(xùn)練優(yōu)化模型(4)利用模型預(yù)測未知問題
所以在這個案例中我們也有相對應(yīng)的幾個步驟:
(1)鳶尾花數(shù)據(jù)集的獲取和預(yù)處理 (2)建立邏輯回歸模型 (3)向模型“喂”鳶尾花數(shù)據(jù)從而達(dá)到訓(xùn)練優(yōu)化模型的目的 (4)預(yù)測
具體的代碼的鏈接如下:
https://static.app.yinxiang.com/embedded-web/profile/#/join?guid=98bda7ef-5a34-44cb-a9f7-011a1a3c9772&channel=copylink&shardId=s22&ownerId=26956767
四、鳶尾花案例涉及到的類缸沃、屬性
python語言是一門強(qiáng)對象的編程語言恰起,所以在使用python編程時弄清楚對象之間的層次關(guān)系就變得尤為重要了。思維導(dǎo)圖就是理解這種層次特別合適的工具趾牧。下面就是我對這個案例中模塊检盼、屬性之間層次關(guān)系的梳理。其中藍(lán)色部分的字體代表的是字段翘单,其余的是模塊或者是方法吨枉。