邏輯回歸與正則化

1窖梁、邏輯回歸

其實邏輯回歸是從線性回歸演化而來的(邏輯回歸雖然有回歸兩字,但其實是做分類任務)夹囚。就舉吳恩達的腫瘤預測為例纵刘,假如腫瘤是這樣分布的,橫軸為腫瘤大小荸哟,縱軸為是否是腫瘤(0或1)假哎,那么將樣本點畫在圖上


h_\theta(x) >= 0.5時,預測y = 1鞍历。
h_\theta(x) >= 0.5時舵抹,預測y = 1
這里有一點我要講明白劣砍,根據(jù)函數(shù)圖像惧蛹,為1的點幾乎都在函數(shù)圖形上方,為0的點幾乎都在線下方刑枝。h_\theta(x) >= 0.5時香嗓,預測y = 1指的是點向x軸做垂線與圖像相交的地方大于0.5為1,其他的一樣装畅。
上面這種看上去不錯靠娱,但如果有一個異常點的腫瘤大小特別大(所以建模時去除異常點多重要),那么影響函數(shù)圖像變?yōu)樗{色的直線:

可以看出大于0.5為1的話掠兄,那么就有兩個為1的歸為不是腫瘤像云,導致分類錯誤锌雀。
所以引入sigmoid函數(shù):g(z) = \frac{1}{1 + e^{-z}},而z = h_\theta(x)迅诬,得g(z) = \frac{1}{1 + e^{- h_\theta(x)}}腋逆。損失函數(shù)也可以用平方差損失函數(shù),但是J(\theta)的圖像是一個非凸函數(shù)侈贷,影響梯度下降尋找最小值惩歉。
我們重新定義邏輯回歸的損失函數(shù)為:J(\theta) = \frac{1}{m}\sum_{i=1}^m Cost(h_\theta(x^{(i)}, y^{(i)})),其中

h_\theta(x)Cost(h_\theta(x), y)之間的關系如圖铐维,橫軸是h_\theta(x)柬泽,縱軸是Cost(h_\theta(x), y)慎菲,每個圖像都有一個定值1或0(重要<奚摺!):

這樣構建的Cost(h_\theta(x), y)函數(shù)的特點是:當實際上y = 1h_\theta(x) = 1時露该,誤差為0睬棚,當y = 1h_\theta(x) \neq 1時,誤差隨著h_\theta(x)的變小而變大解幼;當y = 0時類似抑党。
將構建的Cost(h_\theta(x), y)簡化如下:
Cost(h_\theta(x), y) = -y \times log(h_\theta(x)) - (1-y) \times (1 - h_\theta(x))
代入J(\theta)得到:
J(\theta) =\frac{1}{m}\sum_{i=1}^m[-y \times log(h_\theta(x)) - (1-y) \times log(1 - h_\theta(x))]
即:J(\theta) =-\frac{1}{m}\sum_{i=1}^m[y^{(i)} \times log(h_\theta(x^(i))) + (1-y^{(i)}) \times log(1 - h_\theta(x^{(i)}))]
然后,我們使用梯度下降來求\theta:

求導如下:


2撵摆、正則化

正則化的思想是底靠,\theta前面的參數(shù)會使得函數(shù)變得很大,如果想要最小化整個函數(shù)的話特铝,那么正則化部分的\theta必須要小才能滿足要求(可以將\theta壓縮到接近0)暑中。一般正則化不對\theta增加懲罰項,只對1到n鲫剿,只是約定俗成的鳄逾,就算對0懲罰也沒有什么影響。一般我們不知道是哪個參數(shù)導致過擬合灵莲,所以我們懲罰所有的參數(shù)雕凹。那么,加了懲罰項的損失函數(shù)為(一邏輯回歸為例):
J(\theta) =\frac{1}{m}\sum_{i=1}^m[-y^{(i)} \times log(h_\theta(x^{(i)})) - (1-y^{(i)}) \times log(1 - h_\theta(x^{(i)})) + \lambda\sum_{j=1}^n\theta_j^2]
上述模型加的是L2正則化政冻,當然也可以用L1正則化枚抵。

經(jīng)過正則化后,線性回歸的代價函數(shù)變?yōu)椋?br> J(\theta) = \frac{1}{2m}\sum_{i=1}^m [(h_\theta(x^{(i)}) - y^{(i)})^2 + \lambda\sum_{j=1}^n\theta_j^2]
線性回歸的梯度下降算法變?yōu)椋?br>

而邏輯回歸的代價函數(shù)變?yōu)椋?br> J(\theta) =\frac{1}{m}\sum_{i=1}^m[-y^{(i)} \times log(h_\theta(x^{(i)})) - (1-y^{(i)}) \times log(1 - h_\theta(x^{(i)})) + \lambda\sum_{j=1}^n\theta_j^2]
梯度下降算法變?yōu)椋?br>

兩種算法的h_\theta(x)是不一樣的明场,雖然看上去形式一樣俄精。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市榕堰,隨后出現(xiàn)的幾起案子竖慧,更是在濱河造成了極大的恐慌嫌套,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,590評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件圾旨,死亡現(xiàn)場離奇詭異踱讨,居然都是意外死亡,警方通過查閱死者的電腦和手機砍的,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,157評論 3 399
  • 文/潘曉璐 我一進店門痹筛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人廓鞠,你說我怎么就攤上這事帚稠。” “怎么了床佳?”我有些...
    開封第一講書人閱讀 169,301評論 0 362
  • 文/不壞的土叔 我叫張陵滋早,是天一觀的道長。 經(jīng)常有香客問我砌们,道長杆麸,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,078評論 1 300
  • 正文 為了忘掉前任浪感,我火速辦了婚禮昔头,結果婚禮上,老公的妹妹穿的比我還像新娘影兽。我一直安慰自己揭斧,他們只是感情好,可當我...
    茶點故事閱讀 69,082評論 6 398
  • 文/花漫 我一把揭開白布峻堰。 她就那樣靜靜地躺著讹开,像睡著了一般。 火紅的嫁衣襯著肌膚如雪茧妒。 梳的紋絲不亂的頭發(fā)上萧吠,一...
    開封第一講書人閱讀 52,682評論 1 312
  • 那天,我揣著相機與錄音桐筏,去河邊找鬼纸型。 笑死,一個胖子當著我的面吹牛梅忌,可吹牛的內(nèi)容都是我干的狰腌。 我是一名探鬼主播,決...
    沈念sama閱讀 41,155評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼牧氮,長吁一口氣:“原來是場噩夢啊……” “哼琼腔!你這毒婦竟也來了?” 一聲冷哼從身側響起踱葛,我...
    開封第一講書人閱讀 40,098評論 0 277
  • 序言:老撾萬榮一對情侶失蹤丹莲,失蹤者是張志新(化名)和其女友劉穎光坝,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體甥材,經(jīng)...
    沈念sama閱讀 46,638評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡盯另,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,701評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了洲赵。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鸳惯。...
    茶點故事閱讀 40,852評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖叠萍,靈堂內(nèi)的尸體忽然破棺而出芝发,到底是詐尸還是另有隱情,我是刑警寧澤苛谷,帶...
    沈念sama閱讀 36,520評論 5 351
  • 正文 年R本政府宣布辅鲸,位于F島的核電站,受9級特大地震影響抄腔,放射性物質(zhì)發(fā)生泄漏瓢湃。R本人自食惡果不足惜理张,卻給世界環(huán)境...
    茶點故事閱讀 42,181評論 3 335
  • 文/蒙蒙 一赫蛇、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧雾叭,春花似錦悟耘、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,674評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至移迫,卻和暖如春旺嬉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背厨埋。 一陣腳步聲響...
    開封第一講書人閱讀 33,788評論 1 274
  • 我被黑心中介騙來泰國打工邪媳, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人荡陷。 一個月前我還...
    沈念sama閱讀 49,279評論 3 379
  • 正文 我出身青樓雨效,卻偏偏與公主長得像,于是被迫代替她去往敵國和親废赞。 傳聞我的和親對象是個殘疾皇子徽龟,可洞房花燭夜當晚...
    茶點故事閱讀 45,851評論 2 361

推薦閱讀更多精彩內(nèi)容