Logistic Regression與Logistic Loss簡(jiǎn)介

Logistic Regression

在線性回歸中菇存,我們尋找的連續(xù)型隨機(jī)變量YX的函數(shù)關(guān)系式為:Y=\beta^T X+\epsilon夸研,其中\beta為待估參數(shù)(包含截距項(xiàng)\beta_0,即\beta=(\vec{w},\beta_0)^T依鸥,\beta^TX=w^TX+\beta_0)亥至,\epsilon為隨機(jī)誤差。那么贱迟,如果Y是離散型隨機(jī)變量姐扮,例如服從Bernoulli分布、多項(xiàng)分布等衣吠,又應(yīng)該怎么樣來(lái)描述YX的關(guān)系呢茶敏?

下面我們只討論一般的Logistic Regression,即Y\sim Bernoulli(p)缚俏。直觀的想法是假設(shè)下面關(guān)系成立:

p=\beta^TX\\1-p=1-\beta^TX

其中p=\mathbb{E}Y惊搏。然而,這樣就會(huì)出現(xiàn)一個(gè)問(wèn)題忧换,p1-p應(yīng)該是在[0,1]范圍內(nèi)恬惯。因此,我們可以考慮做以下修正包雀,將其映射到[0,1]范圍內(nèi):

p=\dfrac{e^{\beta^TX}}{e^{\beta^TX}+e^{1-\beta^TX}}\\1-p=\dfrac{e^{1-\beta^TX}}{e^{\beta^TX}+e^{1-\beta^TX}}

即先取指數(shù)宿崭,映射到非負(fù)區(qū)間,再做歸一化才写。對(duì)上式再做簡(jiǎn)單化簡(jiǎn)葡兑,就可以得到Logistics Regression的常見(jiàn)形式:

p=\dfrac{1}{1+e^{-\beta^TX}}\\1-p=\dfrac{e^{-\beta^TX}}{1+e^{-\beta^TX}}

因此,上述變換等價(jià)于對(duì)\beta^TX做了sigmoid變換赞草,對(duì)應(yīng)的sigmoid函數(shù)為\sigma(x)=\dfrac{1}{1+e^{-x}}讹堤;在多分類的情形下,即為softmax變換厨疙;在其他情形下洲守,還有其他對(duì)應(yīng)的函數(shù),感興趣的讀者可以參考以下Generalized Model的Mean Function沾凄。

注1:這里我們只是給出了一個(gè)容易理解的方式梗醇,為什么這個(gè)映射函數(shù)恰好是\sigma(x)而不是其他函數(shù)?其實(shí)是可以從凸優(yōu)化問(wèn)題中利用KKT條件求解出\sigma(x)的撒蟀,詳見(jiàn)論文The equivalence of logistic regression and maximum entropy models叙谨。

\beta的極大似然估計(jì)

在給定樣本\{(X_i,Y_i),i=1,2,\cdots,n\}的情況下,首先我們需要寫出似然函數(shù)保屯。由于Y\sim Bernoulli(p)手负,因此Y的分布函數(shù)為f_Y(y;\beta)=p^y(1-p)^{1-y}涤垫。似然函數(shù)為

\begin{align}L(\beta;X_i,Y_i,i=1,2,\cdots,n)&=\prod\limits_{i=1}^nf_Y(Y_i;\beta)\\&=\prod\limits_{i=1}^np_i^{Y_i}(1-p_i)^{1-Y_i}\\&=p_i^{\sum\limits_{i=1}^nY_i} (1-p_i)^{\sum\limits_{i=1}^n(1-Y_i)}\end{align}\\

取對(duì)數(shù)之后,得到

\begin{align}
l(\beta;X_i,Y_i,i=1,2,\cdots,n)&=\log L(\beta;X_i,Y_i,i=1,2,\cdots,n)\\&= \sum\limits_{i=1}^nY_i\log p_i +  \sum\limits_{i=1}^n(1-Y_i)\log(1- p_i)\end{align}\\

注意到我們?cè)谇耙还?jié)已經(jīng)假定了Logistic模型竟终,即p_i=\sigma(\beta^TX_i)蝠猬,為了保持形式的簡(jiǎn)潔,在上式中仍用p_i代替统捶。注意到

\begin{align}\dfrac{\partial p}{\partial \beta}&=- \dfrac{1}{(1+e^{-\beta^TX})^2}\cdot e^{-\beta^TX}\cdot (-X)\\&=\dfrac{Xe^{-\beta^TX}}{(1+e^{-\beta^TX})^2}\\&=Xp(1-p)\end{align}\\

對(duì)log似然函數(shù)求偏導(dǎo)榆芦,并令其為0:\begin{align}\dfrac{\partial l}{\partial \beta}&=\sum\limits_{i=1}^nY_i \dfrac{1}{p_i}\cdot\dfrac{\partial p_i}{\partial \beta}-\sum\limits_{i=1}^n(1-Y_i) \dfrac{1}{1-p_i}\cdot\dfrac{\partial p_i}{\partial \beta}\\&= \sum\limits_{i=1}^n \dfrac{X_iY_ie^{-\beta^TX_i}}{1+e^{-\beta^TX_i}}-\sum\limits_{i=1}^n \dfrac{X_i(1-Y_i)}{1+e^{-\beta^TX_i}}\\&=\sum\limits_{i=1}^n \dfrac{X_i}{1+e^{-\beta^TX_i}}[-1+(1+e^{-\beta^TX_i})Y_i]\\&=\sum\limits_{\{i|Y_i=1\}} \dfrac{X_i}{1+e^{-\beta^TX_i}}e^{-\beta^TX_i}-\sum\limits_{\{i|Y_i=0\}} \dfrac{X_i}{1+e^{-\beta^TX_i}}\\&=\sum\limits_{\{i|Y_i=1\}} X_i-\sum\limits_{i=1}^n \dfrac{X_i}{1+e^{-\beta^TX_i}}\\&=0\end{align}\\

上述方程沒(méi)有顯式解,一般只能用牛頓迭代法求\beta最大似然估計(jì)的數(shù)值解瘾境。

Logistic Loss

我們重新化簡(jiǎn)一下對(duì)數(shù)似然函數(shù)歧杏,

\begin{align}
l(\beta;X_i,Y_i,i=1,2,\cdots,n)&= \sum\limits_{i=1}^nY_i\log p_i +  \sum\limits_{i=1}^n(1-Y_i)\log(1- p_i)\\&= -\sum\limits_{i=1}^nY_i\log(1+e^{-\beta^TX_i})+  \sum\limits_{i=1}^n(1-Y_i)[-\beta^TX_i-\log(1+e^{-\beta^TX_i})]\\&=\sum\limits_{i=1}^n[(Y_i-1)\beta^TX_i-\log(1+e^{-\beta^TX_i})]\\&=\sum\limits_{i=1}^n\left[(Y_i-1)\beta^TX_i+\log\left(\frac{e^{\beta^TX_i}}{1+e^{\beta^TX_i}}\right)\right]\\&=\sum\limits_{i=1}^n\left[Y_i\beta^TX_i-\log\left(1+e^{\beta^TX_i}\right)\right]\end{align}\\

因此,我們有

\begin{align}\max\limits_{\beta}l(\beta;X_i,Y_i,i=1,2,\cdots,n)&=\max\limits_{\beta}\sum\limits_{i=1}^n\left[Y_i\beta^TX_i-\log\left(1+e^{\beta^TX_i}\right)\right]\\&=\min\limits_{\beta}\sum\limits_{i=1}^n\left[-Y_i\beta^TX_i+\log\left(1+e^{\beta^TX_i}\right)\right]\\LogisticLoss(X_i,Y_i;\beta)&\triangleq -Y_i\beta^TX_i+\log\left(1+e^{\beta^TX_i}\right)\end{align}\\

注2:在實(shí)際計(jì)算中迷守,通常還要除以樣本數(shù)n犬绒,控制梯度大小,因?yàn)橛?jì)算\hat{\beta}的時(shí)候是根據(jù)gradient-based算法兑凿。

注3:我們討論的是Y_i\in\{0,1\}的情況凯力,在Y\in\{-1,1\}時(shí),Logistic Loss有不同的形式(詳見(jiàn)Which loss function is correct for logistic regression?)礼华,

LogisticLoss(X_i,Y_i;\beta)=\log(1+e^{-Y_i\beta^TX_i})\\

而后者的標(biāo)簽與Adaboost推導(dǎo)時(shí)默認(rèn)的標(biāo)簽相同咐鹤,Logistic Loss與Adaboost的Exponential Loss也有一定相似性,在底數(shù)為e的情況下圣絮,\ln(1+x)\leq x,\ x\geq -1祈惶,Logistic Loss的圖像在Exponential Loss下方,甚至還可以將Adaboost修改為優(yōu)化Logistic Loss(詳見(jiàn)Logistic Regression)扮匠。

A plot of the exponential loss, the logistic loss (using both logarithm base 2 and logarithm base?e), and classification loss.
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末捧请,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子棒搜,更是在濱河造成了極大的恐慌疹蛉,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,496評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件力麸,死亡現(xiàn)場(chǎng)離奇詭異可款,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)克蚂,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門闺鲸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人埃叭,你說(shuō)我怎么就攤上這事翠拣。” “怎么了游盲?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,632評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵误墓,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我益缎,道長(zhǎng)谜慌,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,180評(píng)論 1 292
  • 正文 為了忘掉前任莺奔,我火速辦了婚禮欣范,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘令哟。我一直安慰自己恼琼,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,198評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布屏富。 她就那樣靜靜地躺著晴竞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪狠半。 梳的紋絲不亂的頭發(fā)上噩死,一...
    開(kāi)封第一講書(shū)人閱讀 51,165評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音神年,去河邊找鬼已维。 笑死,一個(gè)胖子當(dāng)著我的面吹牛已日,可吹牛的內(nèi)容都是我干的垛耳。 我是一名探鬼主播,決...
    沈念sama閱讀 40,052評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼飘千,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼堂鲜!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起占婉,我...
    開(kāi)封第一講書(shū)人閱讀 38,910評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤泡嘴,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后逆济,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體酌予,經(jīng)...
    沈念sama閱讀 45,324評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,542評(píng)論 2 332
  • 正文 我和宋清朗相戀三年奖慌,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了抛虫。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,711評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡简僧,死狀恐怖建椰,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情岛马,我是刑警寧澤棉姐,帶...
    沈念sama閱讀 35,424評(píng)論 5 343
  • 正文 年R本政府宣布屠列,位于F島的核電站,受9級(jí)特大地震影響伞矩,放射性物質(zhì)發(fā)生泄漏笛洛。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,017評(píng)論 3 326
  • 文/蒙蒙 一乃坤、第九天 我趴在偏房一處隱蔽的房頂上張望苛让。 院中可真熱鬧,春花似錦湿诊、人聲如沸狱杰。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,668評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)仿畸。三九已至,卻和暖如春九杂,著一層夾襖步出監(jiān)牢的瞬間颁湖,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,823評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工例隆, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留甥捺,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,722評(píng)論 2 368
  • 正文 我出身青樓镀层,卻偏偏與公主長(zhǎng)得像镰禾,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子唱逢,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,611評(píng)論 2 353