知識(shí)篇——監(jiān)督學(xué)習(xí)算法優(yōu)缺點(diǎn)及應(yīng)用場景概覽

記錄一波監(jiān)督學(xué)習(xí)算法的應(yīng)用場景和優(yōu)缺點(diǎn)。

  • 高斯樸素貝葉斯

    • 場景:該模型常用于性別分類,即通過一些測量的特征郑口,包括身高遥椿、體重、腳的尺寸知牌,判定一個(gè)人是男性還是女性。
    • 優(yōu)點(diǎn):這個(gè)模型的優(yōu)勢是處理連續(xù)數(shù)據(jù),特別當(dāng)數(shù)據(jù)是高斯分布時(shí)凡傅,有一個(gè)很好的表現(xiàn)。處理連續(xù)數(shù)據(jù)數(shù)值問題的另一種常用技術(shù)是通過離散化連續(xù)數(shù)值的方法肠缔。通常夏跷,當(dāng)訓(xùn)練樣本數(shù)量較少或者是精確的分布已知時(shí),通過概率分布的方法是一種更好的選擇明未。在大量樣本的情形下離散化的方法表現(xiàn)最優(yōu)槽华,因?yàn)榇罅康臉颖究梢詫W(xué)習(xí)到數(shù)據(jù)的分布。
    • 缺點(diǎn):由于高斯樸素貝葉斯使用的是概率分布估計(jì)的方法趟妥,不合適在大數(shù)據(jù)集上應(yīng)用猫态,因?yàn)槿菀壮霈F(xiàn)欠擬合,在數(shù)據(jù)分布不準(zhǔn)確時(shí)或數(shù)據(jù)樣本很大時(shí)披摄,表現(xiàn)很差亲雪。
  • 決策樹

    • 場景:百度到一個(gè)相親用決策樹的應(yīng)用,每個(gè)節(jié)點(diǎn)是一個(gè)評判標(biāo)準(zhǔn)疚膊,最后決定是否要嫁/娶义辕。
    • 優(yōu)點(diǎn):決策過程接近人的思維習(xí)慣,模型容易理解寓盗。
    • **缺點(diǎn):決策樹學(xué)習(xí)方法的準(zhǔn)確率不如其他模型灌砖,不支持在線學(xué)習(xí)璧函,有新樣本來的時(shí)候需要重建決策樹,容易產(chǎn)生過擬合現(xiàn)象基显。(http://m.blog.csdn.net/article/details?id=47616255) **
  • KNN

    • 場景:KNN的應(yīng)用有分類未知案例的項(xiàng)目(摘自百度百科)蘸吓。
    • 優(yōu)點(diǎn):無需估計(jì)參數(shù),簡單续镇,易于理解美澳。特別適合于多分類問題(multi-modal,對象具有多個(gè)類別標(biāo)簽), KNN比SVM的表現(xiàn)要好(svm更適合二分類)摸航。
    • 缺點(diǎn):當(dāng)有偏斜類的情況下制跟,由于算法只計(jì)算最近的k個(gè)樣本,假設(shè)小樣本總數(shù)小于k/2酱虎,即使都很近雨膨,也會(huì)分錯(cuò)。該方法的另一個(gè)不足之處是計(jì)算量較大读串,因?yàn)閷γ恳粋€(gè)待分類的文本都要計(jì)算它到全體已知樣本的距離聊记,才能求得它的K個(gè)最近鄰點(diǎn)。
  • 集成學(xué)習(xí)之AdaBoost

    • 場景:人臉檢測恢暖,AdaBoost以弱學(xué)習(xí)器作為基分類器排监,并且輸入數(shù)據(jù),使其通過權(quán)重向量進(jìn)行加權(quán)杰捂,第一次迭代時(shí)所有數(shù)據(jù)等權(quán)重舆床,在后續(xù)迭代中,前次迭代分錯(cuò)的數(shù)據(jù)權(quán)重會(huì)增大嫁佳。
    • 優(yōu)點(diǎn):它有錯(cuò)誤調(diào)節(jié)能力挨队,分類精度高;在Adaboost的框架下可以使用各種回歸分類模型來構(gòu)建弱學(xué)習(xí)器蒿往,非常靈活盛垦;作為簡單的二元分類器時(shí),構(gòu)造簡單瓤漏,結(jié)果可理解腾夯;不容易發(fā)生過擬合。
    • 缺點(diǎn):對異常樣本敏感蔬充,異常樣本在迭代中可能會(huì)獲得較高的權(quán)重俯在,影響最終的強(qiáng)學(xué)習(xí)器的預(yù)測準(zhǔn)確性。
  • SVM

    • 場景:進(jìn)行文本的分類
    • 優(yōu)點(diǎn):在解決小樣本娃惯、非線性以及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢,對于非線性的分類問題肥败,可以通過核函數(shù)把原來低維的空間中線性不可分的問題映射到高維趾浅,變成線性可分的問題進(jìn)而得以解決愕提。同樣,也可以采用SMO的方式皿哨,將分解的思維推向極致浅侨,用SVM來處理多分類的問題。
    • 缺點(diǎn):在處理數(shù)據(jù)上面的時(shí)間較慢证膨,復(fù)雜度較高如输,在處理多分類的問題上面存在著不足,還需要在二分類的基礎(chǔ)上自己構(gòu)造多分類相關(guān)的算法央勒,代價(jià)比較大不见。
  • 隨機(jī)梯度下降分類器 (SGDC)

    • 場景:圖片分類。
    • 優(yōu)點(diǎn):普通的梯度下降算法在更新回歸系數(shù)時(shí)要遍歷整個(gè)數(shù)據(jù)集崔步,是一種批處理方法稳吮,這樣訓(xùn)練數(shù)據(jù)特別忙龐大時(shí),可能出現(xiàn)收斂過程可能非常慢井濒、不能保證找到全局最小值這樣的問題灶似。而隨機(jī)梯度下降分類器能夠更好地處理上述問題,更能避免進(jìn)入局部極小值中瑞你。SGDC處理大規(guī)模問題表現(xiàn)比較好酪惭。
    • 缺點(diǎn):不太適合用于高精度問題,當(dāng)處理高精度問題時(shí)它的表現(xiàn)很差者甲。
  • Logistic回歸

    • 場景:主要用于危險(xiǎn)因素探索(摘自百度百科)
    • 優(yōu)點(diǎn):分類時(shí)計(jì)算量非常小春感,速度很快,易于理解和實(shí)現(xiàn)过牙。他是一個(gè)單調(diào)上升的函數(shù)甥厦,具有良好的連續(xù)性,不存在不連續(xù)點(diǎn)
    • 缺點(diǎn):當(dāng)特征空間很大時(shí)寇钉,邏輯回歸的性能不是很好刀疙;容易欠擬合,一般準(zhǔn)確度不太高扫倡;不能很好地處理大量多類特征或變量谦秧;對于非線性特征,需要進(jìn)行轉(zhuǎn)換撵溃;只能處理兩分類問題(在此基礎(chǔ)上衍生出來的softmax可以用于多分類)疚鲤,且必須線性可分;

以上內(nèi)容來自822實(shí)驗(yàn)室2017年5月21日19:30第四次知識(shí)分享活動(dòng):捐贈(zèng)者尋找
我們的822缘挑,我們的青春
歡迎所有熱愛知識(shí)熱愛生活的朋友和822實(shí)驗(yàn)室一起成長集歇,吃喝玩樂,享受知識(shí)语淘。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末诲宇,一起剝皮案震驚了整個(gè)濱河市际歼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌姑蓝,老刑警劉巖鹅心,帶你破解...
    沈念sama閱讀 211,743評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異纺荧,居然都是意外死亡旭愧,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,296評論 3 385
  • 文/潘曉璐 我一進(jìn)店門宙暇,熙熙樓的掌柜王于貴愁眉苦臉地迎上來输枯,“玉大人,你說我怎么就攤上這事客给∮醚海” “怎么了?”我有些...
    開封第一講書人閱讀 157,285評論 0 348
  • 文/不壞的土叔 我叫張陵靶剑,是天一觀的道長蜻拨。 經(jīng)常有香客問我,道長桩引,這世上最難降的妖魔是什么缎讼? 我笑而不...
    開封第一講書人閱讀 56,485評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮坑匠,結(jié)果婚禮上血崭,老公的妹妹穿的比我還像新娘。我一直安慰自己厘灼,他們只是感情好夹纫,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,581評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著设凹,像睡著了一般舰讹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上闪朱,一...
    開封第一講書人閱讀 49,821評論 1 290
  • 那天月匣,我揣著相機(jī)與錄音,去河邊找鬼奋姿。 笑死锄开,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的称诗。 我是一名探鬼主播萍悴,決...
    沈念sama閱讀 38,960評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了癣诱?” 一聲冷哼從身側(cè)響起任岸,我...
    開封第一講書人閱讀 37,719評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎狡刘,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體困鸥,經(jīng)...
    沈念sama閱讀 44,186評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡嗅蔬,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,516評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了疾就。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片澜术。...
    茶點(diǎn)故事閱讀 38,650評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖猬腰,靈堂內(nèi)的尸體忽然破棺而出鸟废,到底是詐尸還是另有隱情,我是刑警寧澤姑荷,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布盒延,位于F島的核電站,受9級特大地震影響鼠冕,放射性物質(zhì)發(fā)生泄漏添寺。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,936評論 3 313
  • 文/蒙蒙 一懈费、第九天 我趴在偏房一處隱蔽的房頂上張望计露。 院中可真熱鬧,春花似錦憎乙、人聲如沸票罐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,757評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽该押。三九已至,卻和暖如春繁堡,著一層夾襖步出監(jiān)牢的瞬間沈善,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,991評論 1 266
  • 我被黑心中介騙來泰國打工椭蹄, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留闻牡,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,370評論 2 360
  • 正文 我出身青樓绳矩,卻偏偏與公主長得像罩润,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子翼馆,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,527評論 2 349

推薦閱讀更多精彩內(nèi)容