樸素貝葉斯VS邏輯回歸

觀點1:

http://blog.csdn.net/cjneo/article/details/45167223
1:樸素貝葉斯是生成模型,利用先驗概率饼灿,條件概率,最有得到后驗概率分布蒸其。
LR是判別模型敏释,通過在訓(xùn)練數(shù)據(jù)集上最大化P(y|x)判斷,不需要知道先驗概率和條件概率
2:樸素貝葉斯 基于特征相互獨立的假設(shè)摸袁,而LR則沒有此假設(shè)钥顽,如果數(shù)據(jù)獨立LR可以獲得較好的模型,如果數(shù)據(jù)不滿足條件獨立假設(shè)靠汁,則可以調(diào)整參數(shù)耳鸯,獲得較好的模型。
3:數(shù)據(jù)量較少的時候膀曾,可以使用樸素貝葉斯法县爬,因為先驗概率和條件概率都是通過統(tǒng)計得到的,可以在O(log(n))個樣本得到添谊。對于LR财喳,需要在整個參數(shù)空間進行線性搜索,需要O(n)個樣本斩狱。

觀點二:

相同點
Logistic regression和Naive bayes都是對特征的線性表達 # 耳高,只是區(qū)別在于兩者所fit的參數(shù)不同。

Logistic regression和Naive bayes建模的都是條件概率
所踊,對所最終求得的不同類的結(jié)果有很好的解釋性泌枪。而不像SVM,神經(jīng)網(wǎng)絡(luò)這樣解釋性不高秕岛。

不同點
Logistic regression在有相關(guān)性feature上面學(xué)習(xí)得到的模型在測試數(shù)據(jù)的performance更好碌燕。也就是說,logistic regression在訓(xùn)練時继薛,不管特征之間有沒有相關(guān)性修壕,它都能找到最優(yōu)的參數(shù)。而在Naive bayes中遏考,由于我們給定特征直接相互獨立的嚴格設(shè)定慈鸠,在有相關(guān)性的feature上面學(xué)習(xí)到的權(quán)重同時變大或變小,它們之間的權(quán)重不會相互影響灌具。從這方面來說青团,如果能夠在對參數(shù)較好地控制,在損失項方面處理的很好的話咖楣,Logistic regression相對Naive bayes在應(yīng)用時更不會限制在特征工程(feature engineering)上面督笆。
Naive bayes的好處是我沒有優(yōu)化參數(shù)這一步,通過訓(xùn)練數(shù)據(jù)我直接得到一個counting table截歉,這些有助于并行化胖腾。
Andrew Ng和Michael Jordan在2001年發(fā)了一篇NIPS短文《 On Discriminative vs. Generative classifiers: A comparison of logistic regression and naive Bayes 》烟零,他們把這兩個模型用在各種數(shù)據(jù)集上面進行測試瘪松,最后得到在小數(shù)據(jù)上面Naive bayes可以取得更好的效果咸作,隨著數(shù)據(jù)的增多、特征維度的增大宵睦,Logistic regression的效果更好记罚。這也是因為Naive bayes是生成模型,在有prior的情況下模型能夠把數(shù)據(jù)fit的更好壳嚎,而Logistic regression屬于生成模型桐智,目標驅(qū)動化,不去建模聯(lián)合概率烟馅,通過訓(xùn)練數(shù)據(jù)直接預(yù)測輸出说庭,因此在數(shù)據(jù)足夠多的情況下能夠得到更好一些的效果。

作者: Yong Jiang
文章出處: http://sunshiningjiang.github.io/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末郑趁,一起剝皮案震驚了整個濱河市刊驴,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌寡润,老刑警劉巖捆憎,帶你破解...
    沈念sama閱讀 211,743評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異梭纹,居然都是意外死亡躲惰,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,296評論 3 385
  • 文/潘曉璐 我一進店門变抽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來础拨,“玉大人,你說我怎么就攤上這事绍载√粒” “怎么了?”我有些...
    開封第一講書人閱讀 157,285評論 0 348
  • 文/不壞的土叔 我叫張陵逛钻,是天一觀的道長僚焦。 經(jīng)常有香客問我,道長曙痘,這世上最難降的妖魔是什么芳悲? 我笑而不...
    開封第一講書人閱讀 56,485評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮边坤,結(jié)果婚禮上名扛,老公的妹妹穿的比我還像新娘。我一直安慰自己茧痒,他們只是感情好肮韧,可當(dāng)我...
    茶點故事閱讀 65,581評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般弄企。 火紅的嫁衣襯著肌膚如雪超燃。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,821評論 1 290
  • 那天拘领,我揣著相機與錄音意乓,去河邊找鬼。 笑死约素,一個胖子當(dāng)著我的面吹牛届良,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播圣猎,決...
    沈念sama閱讀 38,960評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼士葫,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了送悔?” 一聲冷哼從身側(cè)響起为障,我...
    開封第一講書人閱讀 37,719評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎放祟,沒想到半個月后鳍怨,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,186評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡跪妥,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,516評論 2 327
  • 正文 我和宋清朗相戀三年鞋喇,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片眉撵。...
    茶點故事閱讀 38,650評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡侦香,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出纽疟,到底是詐尸還是另有隱情罐韩,我是刑警寧澤,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布污朽,位于F島的核電站散吵,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蟆肆。R本人自食惡果不足惜矾睦,卻給世界環(huán)境...
    茶點故事閱讀 39,936評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望炎功。 院中可真熱鬧枚冗,春花似錦、人聲如沸蛇损。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,757評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至股囊,卻和暖如春袜匿,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背毁涉。 一陣腳步聲響...
    開封第一講書人閱讀 31,991評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留锈死,地道東北人贫堰。 一個月前我還...
    沈念sama閱讀 46,370評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像待牵,于是被迫代替她去往敵國和親其屏。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,527評論 2 349

推薦閱讀更多精彩內(nèi)容