機(jī)器學(xué)習(xí)面試之LR與SVM的異同

一封救、邏輯回歸LR

(1)模型表達(dá)式:

與單個(gè)神經(jīng)元加Sigmoid激活函數(shù)的表達(dá)與效果相同

(2)損失函數(shù):

二分類(lèi)交叉熵?fù)p失

(3)參數(shù)估計(jì):

損失函數(shù)的求導(dǎo)


梯度下降

(4)關(guān)于LR的一些提問(wèn):

? (a)邏輯回歸為什么使用極大似然函數(shù)作為損失函數(shù)送朱?

極大似然函數(shù)與對(duì)數(shù)損失等價(jià)捺典,使得最終的梯度更新與Sigmoid函數(shù)無(wú)關(guān)娇斩,更新速度穩(wěn)定茅主。而平方損失會(huì)導(dǎo)致梯度更新的速度很慢。

? (b)如果特征高度相關(guān)或者一個(gè)特征重復(fù)多遍會(huì)有什么影響弃酌?

如果在損失函數(shù)最終收斂的情況下氨菇,不會(huì)影響最終的效果。但是對(duì)于特征本身矢腻,假設(shè)只有一個(gè)特征门驾,不重復(fù)與重復(fù)多遍,訓(xùn)練結(jié)束后多柑,后者這些特征的權(quán)重和將會(huì)等于前者。

? (c)為什么我們還是要將高度相關(guān)的特征去掉楣责?

首先可以讓模型的可解釋性更好竣灌。其次可以提高訓(xùn)練速度,因?yàn)槿绻刑卣鞲叨认嚓P(guān)秆麸,就算損失函數(shù)本身收斂初嘹,但實(shí)際參數(shù)并沒(méi)有收斂,會(huì)拉低訓(xùn)練速度沮趣。并且特征多了屯烦,訓(xùn)練時(shí)間自然會(huì)提高。

二房铭、LR與SVM的異同

(1)相同點(diǎn):LR與SVM都是監(jiān)督學(xué)習(xí)模型中的線(xiàn)性分類(lèi)算法驻龟。

(2)不同點(diǎn):

? (a)本質(zhì)上是損失函數(shù)不同

合頁(yè)損失和對(duì)數(shù)損失
兩種損失的比較

總而言之,SVM只考慮邊界上的點(diǎn)(支持向量)帶來(lái)的影響缸匪,而LR考慮了數(shù)據(jù)集中所有點(diǎn)的影響翁狐。然而他們的目的卻相同,因?yàn)長(zhǎng)R通過(guò)非線(xiàn)性映射凌蔬,降低離分類(lèi)面遠(yuǎn)的點(diǎn)的權(quán)重露懒。

(b)對(duì)數(shù)據(jù)分布的依賴(lài)

SVM增加新的點(diǎn)
LR增加新的點(diǎn)

SVM不直接依賴(lài)數(shù)據(jù)的分布,分類(lèi)平面受一類(lèi)點(diǎn)的影響砂心;LR受所有數(shù)據(jù)點(diǎn)的影響懈词,數(shù)據(jù)需要balance。

? (c)解決非線(xiàn)性問(wèn)題

SVM解決非線(xiàn)性問(wèn)題一般采用核函數(shù)辩诞,因?yàn)橹挥猩贁?shù)幾個(gè)點(diǎn)參與計(jì)算坎弯。而LR通常不使用核函數(shù),因?yàn)樗悬c(diǎn)都需要計(jì)算,計(jì)算復(fù)雜度很高荞怒。

? (d)SVM依賴(lài)數(shù)據(jù)表達(dá)的測(cè)度

(參考:https://www.zhihu.com/question/26768865/answer/34078149)

Linear SVM比較依賴(lài)penalty的系數(shù)(故實(shí)驗(yàn)中需要validation)和數(shù)據(jù)表達(dá)空間的測(cè)度洒琢,而(帶正則化)LR比較依賴(lài)對(duì)參數(shù)做L1正則化的系數(shù)。由于他們都是線(xiàn)性分類(lèi)器褐桌,在低維空間overfitting的能力都比較有限衰抑,在高維空間中LR會(huì)更加穩(wěn)定,因?yàn)長(zhǎng)inear SVM在計(jì)算margin有多寬時(shí)依賴(lài)距離測(cè)度(如果測(cè)度不好荧嵌,那么最大化邊界將沒(méi)有意義呛踊;這種現(xiàn)象在高維空間更明顯)。所以使用Linear SVM之前需要對(duì)數(shù)據(jù)做normalization啦撮,而LR不需要或者不敏感谭网。

注:不帶正則的LR,對(duì)其做normalization的目的是為了方便選擇優(yōu)化的起始值赃春,不代表最后的效果與normalization有關(guān)愉择。如果用最大熵模型解釋?zhuān)╤ttp://www.win-vector.com/dfiles/LogisticRegressionMaxEnt.pdf),實(shí)際優(yōu)化目標(biāo)與距離測(cè)度無(wú)關(guān)织中,其線(xiàn)性約束是可以被放縮的锥涕。

注2:Linear SVM在小數(shù)據(jù)集上表現(xiàn)好于LR,而在大規(guī)模數(shù)據(jù)上狭吼,LR應(yīng)用更廣泛层坠。

? (e)SVM損失函數(shù)自帶正則

SVM是結(jié)構(gòu)風(fēng)險(xiǎn)最小化,而不帶正則的LR是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化刁笙。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末破花,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子疲吸,更是在濱河造成了極大的恐慌座每,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,185評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件磅氨,死亡現(xiàn)場(chǎng)離奇詭異尺栖,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)烦租,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,445評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)延赌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人叉橱,你說(shuō)我怎么就攤上這事挫以。” “怎么了窃祝?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,684評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵掐松,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng)大磺,這世上最難降的妖魔是什么抡句? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,564評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮杠愧,結(jié)果婚禮上待榔,老公的妹妹穿的比我還像新娘。我一直安慰自己流济,他們只是感情好锐锣,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,681評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著绳瘟,像睡著了一般雕憔。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上糖声,一...
    開(kāi)封第一講書(shū)人閱讀 49,874評(píng)論 1 290
  • 那天斤彼,我揣著相機(jī)與錄音,去河邊找鬼蘸泻。 笑死畅卓,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的蟋恬。 我是一名探鬼主播,決...
    沈念sama閱讀 39,025評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼趁冈,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼歼争!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起渗勘,我...
    開(kāi)封第一講書(shū)人閱讀 37,761評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤沐绒,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后旺坠,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體乔遮,經(jīng)...
    沈念sama閱讀 44,217評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,545評(píng)論 2 327
  • 正文 我和宋清朗相戀三年取刃,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蹋肮。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,694評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡璧疗,死狀恐怖坯辩,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情崩侠,我是刑警寧澤漆魔,帶...
    沈念sama閱讀 34,351評(píng)論 4 332
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響改抡,放射性物質(zhì)發(fā)生泄漏矢炼。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,988評(píng)論 3 315
  • 文/蒙蒙 一阿纤、第九天 我趴在偏房一處隱蔽的房頂上張望句灌。 院中可真熱鬧,春花似錦阵赠、人聲如沸涯塔。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,778評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)匕荸。三九已至,卻和暖如春枷邪,著一層夾襖步出監(jiān)牢的瞬間榛搔,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,007評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工东揣, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留践惑,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,427評(píng)論 2 360
  • 正文 我出身青樓嘶卧,卻偏偏與公主長(zhǎng)得像尔觉,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子芥吟,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,580評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容

  • 機(jī)器學(xué)習(xí)是做NLP和計(jì)算機(jī)視覺(jué)這類(lèi)應(yīng)用算法的基礎(chǔ)侦铜,雖然現(xiàn)在深度學(xué)習(xí)模型大行其道,但是懂一些傳統(tǒng)算法的原理和它們之間...
    在河之簡(jiǎn)閱讀 20,489評(píng)論 4 65
  • 原文:http://blog.sina.com.cn/s/blog_818f5fde0102vvpy.html 在...
    MapleLeaff閱讀 3,527評(píng)論 1 30
  • 設(shè)計(jì)組的任務(wù): 早安晚安(貓語(yǔ)錄) 日表彰海報(bào) 主題營(yíng)各類(lèi)海報(bào) 周表彰海報(bào) 學(xué)員及大咖分享海報(bào) 大當(dāng)家海報(bào) 大當(dāng)家...
    小小郁閱讀 273評(píng)論 0 0
  • 浙江工業(yè)職業(yè)技術(shù)學(xué)院財(cái)經(jīng)學(xué)院2018年暑期社會(huì)實(shí)踐 一:主題:“踐行新思想,奉獻(xiàn)新時(shí)代” 二棺耍、活動(dòng)地點(diǎn):儒岙鎮(zhèn) 三...
    蘿卜葉閱讀 584評(píng)論 0 0
  • 著了他的道贡未,我依然開(kāi)心。 他說(shuō)在穩(wěn)定之前蒙袍,不想工作的事俊卤。給最基本的生活費(fèi),錢(qián)幫他存起來(lái)左敌,年底一起給他瘾蛋。 他說(shuō)因?yàn)橄?..
    行一館閱讀 592評(píng)論 0 0