吳恩達機器學習筆記(3)——Logistic?回歸

放假這么久摊崭,天天摸魚讼油,已經(jīng)好久沒更新了,希望后面的更新速度能達到日更吧呢簸,這次給大家介紹的是Logistic 回歸矮台,雖然是名字帶有回歸,其實是一個分類算法阔墩。廢話不多說嘿架,我們先從例題來引入我們今天的算法瓶珊。

引論

我們這次不討論房價的問題了啸箫,這次我們來討論腫瘤大小判斷腫瘤是否是良性的腫瘤。這是一個兩項分布問題伞芹,輸出的結(jié)果只可能是兩個一個是是另一個是否忘苛。我們可以用0,1來表示輸出的結(jié)果。那么我們?nèi)绾蝸韰^(qū)分良性還是惡性腫瘤呢唱较,這就是一個典型的分類問題扎唾,我們也將通過本問題來學習Logistic 回歸算法(雖然這個算法的名字含有回歸,但是這不是一個回歸問題而是分類)

假設(shè)陳述

在Logistic 回歸中我們希望函數(shù)的輸出是在[0,1]這個范圍南缓。上一章我們提到我們的函數(shù)表達式表示成:

但是我們在這里要把這個函數(shù)稍加修改變成h(x) = g((θ^T )*x)胸遇,而這個g(z) = 1/1+e^-z,這個就是大名鼎鼎的sigmoid函數(shù),作用是使函數(shù)的輸出在[0,1]這個范圍汉形。(在以后我們講解神經(jīng)網(wǎng)絡(luò)部分中還會提到它)纸镊,sigmoid函數(shù)的圖像是這樣的:


這樣我們就可以讓函數(shù)的輸出大于0.5的,表示為1概疆,小于0.5的表示為0(反過來也可以)逗威,這樣我們就可以不斷的擬合參數(shù)θ,使函數(shù)的輸出能達到這種分類的效果岔冀。

決策界限

假設(shè)我們現(xiàn)在有個訓練集凯旭,就像上圖所示。我們的假設(shè)函數(shù)是h(x)=g(θ0 + θ1x1+θ2x2),假設(shè)我們已經(jīng)擬合好了參數(shù)罐呼,參數(shù)的最終結(jié)果是[-3,1,1]鞠柄。在sigmoid函數(shù)的圖像中我們可以看出,當x>0時y>0.5,當x<0時y<0.5弄贿。所以當(θ^T )x>=0時y=1,當(θ^T )x<0時y=0春锋。也就是-3+x1+x2>=0,化簡我們可以得到x1+x2>3差凹。
這在圖像上是什么意思呢:


我們可以看出我們擬合出來的函數(shù)已經(jīng)把訓練集劃分開來了期奔,x1+x2>3的區(qū)域就是函數(shù)的上半部分。到這里我們就明白了Logistic 回歸的工作原理危尿,就用擬合的函數(shù)來把不同標簽的訓練集分開來達到分類的效果呐萌。
對于不同的數(shù)據(jù)集分布,我們可以選擇相應(yīng)的函數(shù)圖像來進行分割谊娇,比如這樣的數(shù)據(jù)集分布肺孤,我們可以用圓形的函數(shù)來分割:

代價函數(shù)

既然我們已經(jīng)得到了算法的運作原理,那么我們又到了機器學習中最重要的環(huán)節(jié)济欢,我們?nèi)绾尾拍軘M合赠堵。這里這個函數(shù)的代價函數(shù)又是什么?也就是優(yōu)化的目標是什么法褥?
在我們以前在線性回歸中用到的代價函數(shù)是

我們可不可以用這個函數(shù)來進行梯度下降呢茫叭,答案當然是不行的。因為我們在函數(shù)中使用了sigmoid函數(shù)半等,這會使我們代價函數(shù)的圖像呈現(xiàn)這樣的狀態(tài):

這樣就會有很多個局部最小值揍愁,而達不到真正的代價的最小值。這里我們就引入了新的代價函數(shù)來對函數(shù)進行目標優(yōu)化

把代價函數(shù)分為兩種情況杀饵,一種是y=0一種是y=1的時候莽囤,這樣我們可以分開來計算。這兩個對數(shù)函數(shù)的圖像切距,會使輸出如果偏離1或者0的時候朽缎,代價值會爆增。

y=1

但代價函數(shù)這樣表示太麻煩了谜悟,于是我們可以把代價函數(shù)簡化到一個公式里:

這樣我們就不需要分情況來進行計算了

梯度下降

我們既然得到了代價函數(shù)话肖,我們的目標就是讓代價函數(shù)最小化,我們就需要用梯度下降來得到這個目標赌躺。這里就和回歸函數(shù)的梯度下降方法一樣了狼牺,這里我就不多做介紹,直接給出梯度下降的公式:

多元分類

上面我們提到的都是一分為二的情況礼患,只需要分兩種類別是钥,但是在現(xiàn)實情況中我們可能需要處理的是分更多的類別掠归,所以這個時候我們要怎么做呢。其實很簡單悄泥,我們只需要把一個類別單獨劃分出來虏冻,與剩下的類別劃分。這樣一個一類別的劃分弹囚,找到不用的函數(shù)厨相,用多個函數(shù)來把各種類別區(qū)分出來,就可以了鸥鹉。

image.png

后記

終于恢復更新了蛮穿,希望能達到日更吧,不能繼續(xù)摸魚了毁渗。践磅。。灸异。府适。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市肺樟,隨后出現(xiàn)的幾起案子檐春,更是在濱河造成了極大的恐慌,老刑警劉巖么伯,帶你破解...
    沈念sama閱讀 217,826評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件疟暖,死亡現(xiàn)場離奇詭異,居然都是意外死亡蹦狂,警方通過查閱死者的電腦和手機誓篱,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評論 3 395
  • 文/潘曉璐 我一進店門朋贬,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凯楔,“玉大人,你說我怎么就攤上這事锦募“谕停” “怎么了?”我有些...
    開封第一講書人閱讀 164,234評論 0 354
  • 文/不壞的土叔 我叫張陵糠亩,是天一觀的道長虐骑。 經(jīng)常有香客問我,道長赎线,這世上最難降的妖魔是什么廷没? 我笑而不...
    開封第一講書人閱讀 58,562評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮垂寥,結(jié)果婚禮上颠黎,老公的妹妹穿的比我還像新娘另锋。我一直安慰自己,他們只是感情好狭归,可當我...
    茶點故事閱讀 67,611評論 6 392
  • 文/花漫 我一把揭開白布夭坪。 她就那樣靜靜地躺著,像睡著了一般过椎。 火紅的嫁衣襯著肌膚如雪室梅。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,482評論 1 302
  • 那天疚宇,我揣著相機與錄音亡鼠,去河邊找鬼。 笑死敷待,一個胖子當著我的面吹牛拆宛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播讼撒,決...
    沈念sama閱讀 40,271評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼浑厚,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了根盒?” 一聲冷哼從身側(cè)響起钳幅,我...
    開封第一講書人閱讀 39,166評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎炎滞,沒想到半個月后敢艰,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,608評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡册赛,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,814評論 3 336
  • 正文 我和宋清朗相戀三年钠导,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片森瘪。...
    茶點故事閱讀 39,926評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡牡属,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出扼睬,到底是詐尸還是另有隱情逮栅,我是刑警寧澤,帶...
    沈念sama閱讀 35,644評論 5 346
  • 正文 年R本政府宣布窗宇,位于F島的核電站措伐,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏军俊。R本人自食惡果不足惜侥加,卻給世界環(huán)境...
    茶點故事閱讀 41,249評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望粪躬。 院中可真熱鬧担败,春花似錦矗蕊、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,866評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至岖研,卻和暖如春卿操,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背孙援。 一陣腳步聲響...
    開封第一講書人閱讀 32,991評論 1 269
  • 我被黑心中介騙來泰國打工害淤, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人拓售。 一個月前我還...
    沈念sama閱讀 48,063評論 3 370
  • 正文 我出身青樓窥摄,卻偏偏與公主長得像,于是被迫代替她去往敵國和親础淤。 傳聞我的和親對象是個殘疾皇子崭放,可洞房花燭夜當晚...
    茶點故事閱讀 44,871評論 2 354

推薦閱讀更多精彩內(nèi)容