機(jī)器學(xué)習(xí)模型比較

判別模型與生成模型

  • 生成模型
    學(xué)習(xí)聯(lián)合概率分布事甜,求出條件概率分布P(Y|X)=P(X,Y)/P(X)兔沃。
    • 樸素貝葉斯法玛迄、馬爾科夫模型狡逢、高斯混合模型
    • 收斂速度更快宁舰,能學(xué)習(xí)隱變量
  • 判別模型
    由數(shù)據(jù)直接學(xué)習(xí)決策函數(shù)f(X)或者條件概率分布P(Y|X)作為預(yù)測(cè)的模型。
    • 邏輯回歸, KNN, SVM
    • 準(zhǔn)確率高

各模型總結(jié)

  • 邏輯回歸
    • 優(yōu)點(diǎn)
      • 實(shí)現(xiàn)簡(jiǎn)單奢浑,應(yīng)用成熟蛮艰,基本所有的機(jī)器學(xué)習(xí)庫(kù)都有
      • 支持增量學(xué)習(xí),可以在線更新
      • 可以輸出概率雀彼,結(jié)果易于解釋
    • 缺點(diǎn)
      • 全局最優(yōu)印荔、容易欠擬合
      • 當(dāng)特征空間太大時(shí)表現(xiàn)較弱
      • 難以捕捉非線性特征
        • 特征離散化
    • 優(yōu)化方法
      • 細(xì)分場(chǎng)景解決,用決策樹決定初始場(chǎng)景
      • 特征篩選详羡、降維仍律,加入L1、L2正則項(xiàng)
      • 特征離散化实柠,特征相乘
        • 普通線性模型無法描述特征間的相關(guān)性水泉,將特征相乘(多項(xiàng)式線性模型)可以引入變量相關(guān)性(e.g 女性與化妝品類,男性與球類裝備)
多項(xiàng)式模型.png

- 數(shù)據(jù)稀疏情況下很難求解wij窒盐,使用FM模型(類比推薦)

  • 樸素貝葉斯

    • 優(yōu)點(diǎn)
      • 算法簡(jiǎn)單草则,收斂速度快
      • 支持增量學(xué)習(xí)
      • 在小數(shù)據(jù)集上表現(xiàn)較好,多用于文本分類
    • 缺點(diǎn)
      • 條件獨(dú)立假設(shè)蟹漓,分類準(zhǔn)確性較低
  • KNN

    • 優(yōu)點(diǎn)
      • 思想簡(jiǎn)單炕横,可用以分類也可回歸
      • 可以用以非線性分類
    • 缺點(diǎn)
      • 計(jì)算、存儲(chǔ)量大
  • 決策樹

    • 優(yōu)點(diǎn)
      • 計(jì)算簡(jiǎn)單葡粒,易于理解份殿,容易解釋
      • 對(duì)數(shù)據(jù)預(yù)處理要求不高
      • 可以進(jìn)行變量選擇
    • 缺點(diǎn)
      • 講究局部最優(yōu),容易過擬合
      • 容易忽略數(shù)據(jù)之間的相關(guān)性
  • SVM

    • 優(yōu)點(diǎn)
      • 可以解決高緯數(shù)據(jù)集嗽交,適合文本/圖像分類
      • 能處理非線性可分?jǐn)?shù)據(jù)
      • 高泛化能力
    • 缺點(diǎn)
      • 計(jì)算量大
      • 需要調(diào)參數(shù)卿嘲、尋找核函數(shù)
      • 對(duì)缺失數(shù)據(jù)敏感
  • 隨機(jī)森林

  • Adaboost

    • 優(yōu)點(diǎn)
      • 精度高,不容易過擬合
      • 不用做特征選擇
    • 缺點(diǎn)
      • 對(duì)異常點(diǎn)敏感
  • K-means

    • 優(yōu)點(diǎn)
      • 原理簡(jiǎn)單夫壁,容易實(shí)現(xiàn)
      • 當(dāng)簇之間區(qū)分效果明顯時(shí)聚類效果較好
    • 缺點(diǎn)
      • 對(duì)初始質(zhì)心及K的選擇較敏感
      • 對(duì)異常點(diǎn)敏感
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末拾枣,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌梅肤,老刑警劉巖司蔬,帶你破解...
    沈念sama閱讀 206,214評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異姨蝴,居然都是意外死亡葱她,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門似扔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人搓谆,你說我怎么就攤上這事炒辉。” “怎么了泉手?”我有些...
    開封第一講書人閱讀 152,543評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵黔寇,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我斩萌,道長(zhǎng)缝裤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,221評(píng)論 1 279
  • 正文 為了忘掉前任颊郎,我火速辦了婚禮憋飞,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘姆吭。我一直安慰自己榛做,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,224評(píng)論 5 371
  • 文/花漫 我一把揭開白布内狸。 她就那樣靜靜地躺著检眯,像睡著了一般。 火紅的嫁衣襯著肌膚如雪昆淡。 梳的紋絲不亂的頭發(fā)上锰瘸,一...
    開封第一講書人閱讀 49,007評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音昂灵,去河邊找鬼避凝。 笑死,一個(gè)胖子當(dāng)著我的面吹牛眨补,可吹牛的內(nèi)容都是我干的恕曲。 我是一名探鬼主播,決...
    沈念sama閱讀 38,313評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼渤涌,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼佩谣!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起实蓬,我...
    開封第一講書人閱讀 36,956評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤茸俭,失蹤者是張志新(化名)和其女友劉穎吊履,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體调鬓,經(jīng)...
    沈念sama閱讀 43,441評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡艇炎,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,925評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了腾窝。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片缀踪。...
    茶點(diǎn)故事閱讀 38,018評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖虹脯,靈堂內(nèi)的尸體忽然破棺而出驴娃,到底是詐尸還是另有隱情,我是刑警寧澤循集,帶...
    沈念sama閱讀 33,685評(píng)論 4 322
  • 正文 年R本政府宣布唇敞,位于F島的核電站,受9級(jí)特大地震影響咒彤,放射性物質(zhì)發(fā)生泄漏疆柔。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,234評(píng)論 3 307
  • 文/蒙蒙 一镶柱、第九天 我趴在偏房一處隱蔽的房頂上張望旷档。 院中可真熱鬧,春花似錦歇拆、人聲如沸彬犯。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)谐区。三九已至,卻和暖如春逻卖,著一層夾襖步出監(jiān)牢的瞬間宋列,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評(píng)論 1 261
  • 我被黑心中介騙來泰國(guó)打工评也, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留炼杖,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,467評(píng)論 2 352
  • 正文 我出身青樓盗迟,卻偏偏與公主長(zhǎng)得像坤邪,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子罚缕,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,762評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容