邏輯回歸Logistic Regression (LR)

LR 的模型函數(shù)記作:h(X) = \frac{1}{1+e^{-\theta^{T}X}}客们,其在二維坐標系中圖像如下:

sigmoid函數(shù)

因為形如S曲線底挫,所以,邏輯函數(shù)sigmoid函數(shù)又稱為S函數(shù)盈厘。
Sigmod 這樣一個奇怪而別扭的形式到底是誰涝缝、因為什么想出來的呢譬重?又怎么想到用它來做分類的呢臀规?

1. sigmoid函數(shù)的由來

最初為了研究人口增長與時間的關系栅隐,人們發(fā)明了邏輯函數(shù)。馬爾薩斯的人口論中“在沒有任何外界阻礙的情況下租悄,人口將以幾何級數(shù)增長”的說法泣棋,正是依據(jù)指數(shù)模型W(t) = ae^{bt}
但是鸯屿,自然界中當一種東西數(shù)量越來越多以后把敢,某種阻力也會越來越明顯地抑制其增長率修赞。因此,數(shù)學家增加了抑制參數(shù)柏副,模型被修正為:
W^{'}(t) = bW(t) - g(W(t))割择,W^{'}(t)表示增長率,g(W(t))表示抑制函數(shù),當達到一定程度后成長率受到抑制换可。
經(jīng)過多次調(diào)整得到了具有此邏輯特性的函數(shù):
h(X) = \frac{1}{1+e^{-\theta^{T}X}}
其增長率二維坐標圖像如下:

sigmoid導數(shù)圖像

可以看出增長率先變高沾鳄,后變低的規(guī)律确憨。
上面講了 LR 函數(shù)的歷史瓤的,一方面可以看出 LR 函數(shù)從最初的指數(shù)函數(shù)形式逐步發(fā)展到今天的歷程吞歼,在追本溯源的過程中由簡入繁掌握函數(shù)的形式和意義篙骡。
另一方面,也是以 LR 函數(shù)的形成作為實際案例尿褪,來學習借助數(shù)學工具解決問題的方法:

首先得湘,將目標問題定義為一個函數(shù)淘正;
之后,選取最簡單的假設作為其具體形式跪帝;
然后伞剑,用事實數(shù)據(jù)驗證該形式,確認有效后沿用恕刘,形成數(shù)學模型抒倚;
一旦當前采用的數(shù)學模型出現(xiàn)問題,則對其進行修正(添加修正項)含蓉,同樣借助事實數(shù)據(jù)來求取修正項的形式项郊,形成新的(升級版)數(shù)學模型着降。

直接、簡單蓄喇、基于現(xiàn)有成果——這也是人類在現(xiàn)實當中解決問題的各種有效方法的共同特征。
雖然隨著新技術的發(fā)展刃鳄,具體的新問題不斷涌現(xiàn)楼眷,但實際上罐柳,技術發(fā)展的過程,整體而言是把問題的“量”擴大化的過程齿梁。
如果抽象層次更高一些肮蛹,我們就不難發(fā)現(xiàn),這些問題其實和以往的問題有許多共性所在省核。其實昆码,新問題不過是舊問題在新情況、新場景下的變形而已旧噪。
既然如此脓匿,那些已經(jīng)在實踐中證明對于舊問題有效的方法陪毡、措施,也必然能夠對解決新問題有所貢獻爱咬。

sigmoid函數(shù)

上圖中,z 是自變量(橫軸)燎斩,最終計算出的因變量 y(縱軸),則是一個 [0,1] 區(qū)間之內(nèi)的實數(shù)值笋鄙。
一般而言师枣,當
y>0.5
時,z 被歸類為真(True)或陽性(Positive)萧落,否則當
y<=0.5
時践美,z 被歸類為假(False)或陰性(Negative)。
所以找岖,在模型輸出預測結果時陨倡,不必輸出 y 的具體取值,而是根據(jù)上述判別標準许布,輸出1(真)或0(假)兴革。
因此,LR 典型的應用是二分類問題上蜜唾,也就是說,把所有的數(shù)據(jù)只分為兩個類袁余。

2.LR 目標函數(shù)

有了模型函數(shù)擎勘,來看看邏輯回歸的目標函數(shù)。
邏輯函數(shù) h(x) 是我們要通過訓練得出來的最終結果颖榜,模型的未知參數(shù)時θ棚饵。訓練過程我們要設置一個目標:我們希望這個最終得出的 θ 達到一個什么樣的效果——我們當然是希望得出來的這個 θ,能夠讓訓練數(shù)據(jù)中被歸為陽性的數(shù)據(jù)預測結果都為陽朱转,本來被分為陰性的預測結果都為陰蟹地。
而從公式本身的角度來看,h(x) 實際上是 x 為陽性的分布概率藤为,所以怪与,才會在h(x)>0.5 時將 x 歸于陽性。也就是說 h(x)=P(y=1)缅疟。反之分别,樣例是陰性的概率 P(y=0)=1?h(x)
當我們把測試數(shù)據(jù)帶入其中的時候存淫,P(y=1) 和 P(y=0) 就都有了先決條件耘斩,它們?yōu)橛柧殧?shù)據(jù)的 x 所限定。因P(y=1|x)=h(x);P(y=0|x)=1?h(x)桅咆。
根據(jù)二項分布公式括授,可得出
P(y|x)=h(x)^{y}(1?h(x))^{(1?y)}

假設訓練集一共有 m 個數(shù)據(jù),那么這 m 個數(shù)據(jù)的聯(lián)合概率就是:
L(\theta) = \prod_{1}^{m}P(y^{(i)}|x^{(i)};\theta)= \prod_{1}^{m}(h_{\theta}(x^{(i)})^{y^{(i)}}(1-h_{\theta}(x^{(i)})^{(1-y^{(i)}\ )} \ )
目標是這個聯(lián)合概率值取最大值的θ求解荚虚,因此可以取log薛夜,化簡為如下形式:
l(\theta)=log(L(\theta)) = \frac{1}{m}\sum_{i=1}^{m}(y_{i}logh_{\theta}(x_{i})+(1-y_{i})log(1-h_{\theta}(x_{i})))
為了統(tǒng)一,需要目標函數(shù)是一個凸函數(shù)版述,具備最小值梯澜。因此我們設定:
J(θ)=?l(θ)

3.優(yōu)化算法

LR 的目標函數(shù) J(θ)渴析,并且優(yōu)化目標是最小化它晚伙。最常見最基礎的梯度下降算法。

基本步驟如下:

  • 通過對 J(θ) 求導獲得下降方向即梯度方向—— J′(θ)俭茧;
  • 根據(jù)預設的步長 α咆疗,更新參數(shù) θ:=θ?αJ′(θ)
  • 重復以上兩步直到逼近最優(yōu)值恢恼,滿足終止條件民傻。

優(yōu)化算法偽代碼為:
Set initial value: θ = 0, α
while (not convergence){
θ_{j}:=θ_{j} - α\sum_{i=1}^{m}(-(y^{(i)}?h_{θ}(x^{(i)}))x_{j}^{(i)})
}

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市场斑,隨后出現(xiàn)的幾起案子漓踢,更是在濱河造成了極大的恐慌,老刑警劉巖漏隐,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件喧半,死亡現(xiàn)場離奇詭異,居然都是意外死亡青责,警方通過查閱死者的電腦和手機挺据,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來脖隶,“玉大人扁耐,你說我怎么就攤上這事〔澹” “怎么了婉称?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長构蹬。 經(jīng)常有香客問我王暗,道長,這世上最難降的妖魔是什么庄敛? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任俗壹,我火速辦了婚禮,結果婚禮上藻烤,老公的妹妹穿的比我還像新娘绷雏。我一直安慰自己头滔,他們只是感情好,可當我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布涎显。 她就那樣靜靜地躺著拙毫,像睡著了一般。 火紅的嫁衣襯著肌膚如雪棺禾。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天峭跳,我揣著相機與錄音膘婶,去河邊找鬼。 笑死蛀醉,一個胖子當著我的面吹牛悬襟,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播拯刁,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼脊岳,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了垛玻?” 一聲冷哼從身側響起割捅,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎帚桩,沒想到半個月后亿驾,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡账嚎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年莫瞬,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片郭蕉。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡疼邀,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出召锈,到底是詐尸還是另有隱情旁振,我是刑警寧澤,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布烟勋,位于F島的核電站规求,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏卵惦。R本人自食惡果不足惜阻肿,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望沮尿。 院中可真熱鬧丛塌,春花似錦较解、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至姥敛,卻和暖如春奸焙,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背彤敛。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工与帆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人墨榄。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓玄糟,卻偏偏與公主長得像,于是被迫代替她去往敵國和親袄秩。 傳聞我的和親對象是個殘疾皇子阵翎,可洞房花燭夜當晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容