01 分類算法 - Logistic回歸 - Logit函數(shù)

=== Logit函數(shù) ===

Odds：比值比（優(yōu)勢比）齐遵，用來衡量特征中分類之間關(guān)聯(lián)的一種方式歹鱼。
指的是該事件發(fā)生的概率與該事件不發(fā)生的概率的比值： p/1-p

Logit函數(shù)，logit(p) = log(Odds)

Logit函數(shù)

我們假設(shè)：logit (p) 和 X 之間服從一個線性關(guān)系宁改，因?yàn)楫?dāng)他們之間呈現(xiàn)線性關(guān)系的時候街佑，可以幫助我們做分類似踱。

為什么可以這樣假設(shè)？
其實(shí)就像 h_θ(x) = θ^TX一樣墓臭，我們假設(shè)其呈現(xiàn)線性關(guān)系蘸鲸，然后求出θ值，最后建立模型一個道理窿锉。

搞清楚后以上的思路后酌摇，我們繼續(xù)演繹。對于logit (p)可以做如下的轉(zhuǎn)化：

最后得到的公式嗡载，我們稱為 Logistic/sigmoid函數(shù)：

Logistic/sigmoid函數(shù)

Logistic函數(shù)的圖像：

圖像

重點(diǎn)：
Odds：比值比（優(yōu)勢比）窑多，用來衡量特征中分類之間關(guān)聯(lián)的一種方式。指的是該事件發(fā)生的概率與該事件不發(fā)生的概率的比值： p/1-p

我們最終得到的是一個θ^Tx 和p之間的映射洼滚。
在圖像中的體現(xiàn)是： p(θ^Tx ) + p(-θ^Tx ) = 1

通過把θ^Tx 傳輸?shù)胶瘮?shù)中后埂息，我們可以得到的返回值在0~1之間。
在θ^Tx =0這一點(diǎn)的時候，p=0.5耿芹；
θ^Tx越小崭篡，p趨向于0；
θ^Tx越大吧秕，p趨向于1琉闪；

===Logistic回歸 ===

Logistic函數(shù)的“定義域”和“值域” ：

Logistic回歸的中心目標(biāo)是求解二元分類的問題。
所以值域中砸彬，我們設(shè)y的取值為0或1颠毙。
接下來分析一下p和y的關(guān)系。

y：最終分類的結(jié)果砂碉。y=1 or y=0
p：指的是該事件發(fā)生的概率蛀蜜。即y=1的概率。

我們可以自定義一個事情發(fā)生概率的閾值 h
如果y=1的概率大于h增蹭，我們認(rèn)為預(yù)測的結(jié)果y^是1
如果y=1的概率小于h滴某，我們認(rèn)為預(yù)測的結(jié)果y^是0

但是如果加入了自定義閾值設(shè)定的話，意味著我們?nèi)藶榈慕?jīng)驗(yàn)被納入運(yùn)算的過程中了滋迈，那么會導(dǎo)致最終的預(yù)測結(jié)果產(chǎn)生一定的偏差霎奢，所以不建議使用。
就根據(jù)sigmoid函數(shù)的對稱軸 h=0.5 作為分類的閾值即可饼灿。

Logistic/sigmoid函數(shù)：

令：z = θ^Tx

鏈?zhǔn)椒▌t求導(dǎo)： g'(z) = g(z)*(1-g(z))
這個結(jié)論很重要幕侠，因?yàn)樵谟锰荻认陆捣ㄇ髽O值的時候需要用到原函數(shù)的導(dǎo)數(shù)。

對于y的值不是取1就是去0的情況碍彭，滿足數(shù)學(xué)里的伯努利分布亦稱零一分布晤硕、兩點(diǎn)分布。

p：也就是y=1的概率庇忌。

Logistic回歸滿足的兩個假設(shè)：
1舞箍、某一點(diǎn)觀測值隨機(jī)變量 y|x 服從伯努利分布。
2漆枚、各個觀測值y之間獨(dú)立创译。

1、假設(shè)：

2墙基、似然函數(shù)：

思路：
首先软族，因?yàn)橛^測值是獨(dú)立同分布的，所以可以用聯(lián)合概率密度函數(shù)残制，即連乘所有單個樣本發(fā)生 y=x 情況的概率立砸。

對于所有觀測值x中發(fā)生了y的概率，連乘求出聯(lián)合概率密度函數(shù)：

聯(lián)合密度函數(shù)

似然函數(shù)體現(xiàn)了一種可能性初茶，即當(dāng)前有一組參數(shù)θ颗祝，使得觀測值X達(dá)到上面這種聯(lián)合概率密度函數(shù)值的可能性最大。那么這組θ值就是我想要的。

例子

最后螺戳，求解θ的問題轉(zhuǎn)化為求似然函數(shù)最大值的問題了搁宾。
即θ為何值時，L(θ)最大倔幼。
當(dāng)最大似然函數(shù)最大時盖腿，對應(yīng)的θ值就是最優(yōu)解。

3损同、對數(shù)似然函數(shù)：

求函數(shù)的最大值翩腐，首先要對函數(shù)進(jìn)行求導(dǎo)。然后利用梯度下降的算法求解最小值膏燃。
要對原來的最大似然函數(shù)求導(dǎo)十分困難茂卦，但我們知道函數(shù)對應(yīng)的對數(shù)函數(shù)，其凹凸性组哩、極值點(diǎn)和原函數(shù)是相同的等龙。
而且對數(shù)函數(shù)的求導(dǎo)會比原函數(shù)方便一點(diǎn)，所以我們先取得對數(shù)似然函數(shù)伶贰。

4而咆、對數(shù)似然函數(shù)求導(dǎo)：

上面的公式是基于假設(shè) [p: y=1] [1-p : y=0 ] 形成的。
如果 [p: y=1] [1-p : y=-1 ]時幕袱，對應(yīng)的似然函數(shù)和對數(shù)似然是什么？

5悠瞬、Logistic回歸θ參數(shù)的求解過程為(類似梯度下降法)：

由于我們要求最大似然函數(shù)的隨機(jī)梯度们豌，需要找函數(shù)的極大值。
θ^new = θ^old + α* ?L(θ) / ?θ
因?yàn)槭钦易畲笾登匙保员举|(zhì)上應(yīng)該稱為梯度上升法望迎。
目標(biāo)函數(shù) => 對數(shù)似然函數(shù) L(θ)的極大值

最大似然函數(shù)的隨機(jī)梯度

上述公式是Logistic回歸θ參數(shù)的求解本質(zhì)，需要重點(diǎn)理解凌外。

6辩尊、Logistic回歸的損失函數(shù))：

機(jī)器學(xué)習(xí)中都需要構(gòu)造一個損失函數(shù)，來衡量系統(tǒng)好壞的函數(shù)康辑。損失函數(shù)越小摄欲，系統(tǒng)越優(yōu)秀。
但現(xiàn)在我們的目標(biāo)函數(shù)是一個越大越優(yōu)秀的函數(shù)疮薇，我們做一個什么操作才能使其成為Logistic回歸的損失函數(shù)呢胸墙？
顯然加上一個負(fù)號即可。

損失函數(shù)

最后編輯于：2018.10.26 08:33:56

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末按咒，一起剝皮案震驚了整個濱河市迟隅，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖智袭，帶你破解...
沈念sama閱讀 221,430評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件奔缠，死亡現(xiàn)場離奇詭異，居然都是意外死亡吼野，警方通過查閱死者的電腦和手機(jī)校哎，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,406評論 3贊 398
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來箫锤，“玉大人贬蛙，你說我怎么就攤上這事⊙柙埽” “怎么了阳准？”我有些...
開封第一講書人閱讀 167,834評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長馏臭。經(jīng)常有香客問我野蝇，道長，這世上最難降的妖魔是什么括儒？我笑而不...
開封第一講書人閱讀 59,543評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任绕沈，我火速辦了婚禮，結(jié)果婚禮上帮寻，老公的妹妹穿的比我還像新娘乍狐。我一直安慰自己，他們只是感情好固逗，可當(dāng)我...
茶點(diǎn)故事閱讀 68,547評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布浅蚪。她就那樣靜靜地躺著，像睡著了一般烫罩。火紅的嫁衣襯著肌膚如雪惜傲。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,196評論 1贊 308
城市分裂傳說
那天贝攒，我揣著相機(jī)與錄音盗誊，去河邊找鬼。笑死隘弊，一個胖子當(dāng)著我的面吹牛哈踱，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播长捧，決...
沈念sama閱讀 40,776評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼嚣鄙，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了串结？” 一聲冷哼從身側(cè)響起哑子，我...
開封第一講書人閱讀 39,671評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤舅列，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后卧蜓，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體帐要，經(jīng)...
沈念sama閱讀 46,221評論 1贊 320
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,303評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年弥奸，在試婚紗的時候發(fā)現(xiàn)自己被綠了榨惠。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,444評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡盛霎，死狀恐怖赠橙，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情愤炸，我是刑警寧澤期揪，帶...
沈念sama閱讀 36,134評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站规个，受9級特大地震影響凤薛，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜诞仓，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,810評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一缤苫、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧墅拭，春花似錦活玲、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,285評論 0贊 24
一樁弒父案翼虫，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至屡萤，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間掸宛，已是汗流浹背死陆。一陣腳步聲響...
開封第一講書人閱讀 33,399評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留唧瘾，地道東北人措译。一個月前我還...
沈念sama閱讀 48,837評論 3贊 376
代替公主和親
正文我出身青樓，卻偏偏與公主長得像饰序，于是被迫代替她去往敵國和親领虹。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,455評論 2贊 359