百面機(jī)器學(xué)習(xí)|第十二章集成學(xué)習(xí)知識(shí)點(diǎn)(二)

前言

如果你能找到這里,真是我的幸運(yùn)~這里是藍(lán)白絳的學(xué)習(xí)筆記,本集合主要針對(duì)《百面機(jī)器學(xué)習(xí)——算法工程師帶你去面試》這本書试躏。主要記錄我認(rèn)為重要的知識(shí)點(diǎn),希望對(duì)大家有幫助设褐。

第十二章 集成學(xué)習(xí)

5冗酿、梯度提升決策樹的基本原理

  1. 梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)是Boosting算法中非常流行的模型络断。Gradient Boosting是Boosting中的一大類算法裁替,基本思想是根據(jù)當(dāng)前模型損失函數(shù)的負(fù)梯度信息來訓(xùn)練新加入的弱分類器,然后將訓(xùn)練好的弱分類器以累加的形式結(jié)合到現(xiàn)有模型中。采用決策樹為弱分類器的Gradient Boosting算法被稱為GBDT,有時(shí)也稱MART(Multiple Additive Regression Tree)盆顾。GBDT中使用的決策樹通常為CART樹
  2. 梯度提升和梯度下降的區(qū)別和聯(lián)系:
  • 聯(lián)系:兩者均是在每一輪迭代中昌腰,利用損失函數(shù)相對(duì)于模型的負(fù)梯度方向的信息來對(duì)當(dāng)前模型進(jìn)行更新。
  • 區(qū)別:在梯度下降中膀跌,模型是以參數(shù)化形式表示遭商,從而模型的更新等價(jià)于參數(shù)的更新;在梯度提升中捅伤,模型并不需要進(jìn)行參數(shù)化表示劫流,而是直接定義在函數(shù)空間中,從而大大擴(kuò)展了可以使用的模型種類丛忆。
提升算法 目標(biāo) 迭代公式 損失
梯度提升 函數(shù)空間F F=F_{t-1}-\rho_t\nabla_FL|_{F=F_{t-1}} L=\sum_il(y_i,F(x_i))
梯度下降 參數(shù)空間W w_t=w_{t-1}-\rho_t\nabla_wL|_{w=w_{t-1}} L=\sum_il(y_i,f_w(w_i))
  1. GBDT的優(yōu)點(diǎn)和局限性:
  • 優(yōu)點(diǎn):
    (1) 預(yù)測(cè)階段的計(jì)算速度快祠汇,樹與樹之間可并行計(jì)算
    (2) 在分布稠密的數(shù)據(jù)集上熄诡,泛化能力和表達(dá)能力都很好可很。
    (3) 采用決策樹作為弱分類器使得GBDT模型具有較好的解釋性魯棒性,能夠自動(dòng)發(fā)現(xiàn)特征間的高階關(guān)系凰浮,也不需要對(duì)數(shù)據(jù)進(jìn)行特殊的預(yù)處理如歸一化等我抠。
  • 局限:
    (1) GBDT在高維稀疏的數(shù)據(jù)集上苇本,表現(xiàn)不如支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)。
    (2) GBDT在處理文本分類特征問題上菜拓,相對(duì)于其他模型優(yōu)勢(shì)不如在處理數(shù)值特征時(shí)明顯瓣窄。
    (3) 訓(xùn)練過程需要串行訓(xùn)練,只能在決策樹內(nèi)部采用一些局部并行的手段提升訓(xùn)練速度尘惧。

6、XGBoost與GBDT的聯(lián)系和區(qū)別

  1. XGBoost與GBDT的聯(lián)系和區(qū)別可以總結(jié)成以下幾個(gè)方面:
  • GBDT是機(jī)器學(xué)習(xí)算法递递,XGBoost是該算法的工程實(shí)現(xiàn)喷橙。
  • 在使用CART作為基分類器時(shí),XGBoost就顯式地加入了正則項(xiàng)來控制模型的復(fù)雜度登舞,有利于防止過擬合贰逾,提高模型的泛化能力。
  • GBDT在模型訓(xùn)練時(shí)只使用了代價(jià)函數(shù)的一階導(dǎo)數(shù)信息菠秒,XGBoost對(duì)代價(jià)函數(shù)進(jìn)行二階泰勒展開疙剑,可以同時(shí)使用一階和二階導(dǎo)數(shù)。
  • 傳統(tǒng)的GBDT使用CART作為基分類器践叠,XGBoost支持多種類型的基分類器言缤,比如線性分類器。
  • 傳統(tǒng)的GBDT在每輪迭代時(shí)使用全部的數(shù)據(jù)禁灼,XGBoost則采用了與隨機(jī)森林相似的策略管挟,支持對(duì)數(shù)據(jù)進(jìn)行采樣
  • 傳統(tǒng)的GBDT沒有設(shè)計(jì)對(duì)缺失值進(jìn)行處理弄捕,XGBoost能夠自動(dòng)學(xué)習(xí)出缺失值的處理策略僻孝。

小結(jié)

這是本章的第二部分,主要講了梯度提升和梯度下降的區(qū)別守谓、GBDT的優(yōu)缺點(diǎn)穿铆、XGBoost與GBDT的聯(lián)系與區(qū)別。

結(jié)尾

如果您發(fā)現(xiàn)我的文章有任何錯(cuò)誤斋荞,或?qū)ξ业奈恼掠惺裁春玫慕ㄗh荞雏,請(qǐng)聯(lián)系我!如果您喜歡我的文章平酿,請(qǐng)點(diǎn)喜歡~*我是藍(lán)白絳讯檐,感謝你的閱讀!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末染服,一起剝皮案震驚了整個(gè)濱河市别洪,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌柳刮,老刑警劉巖挖垛,帶你破解...
    沈念sama閱讀 218,640評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件痒钝,死亡現(xiàn)場離奇詭異,居然都是意外死亡痢毒,警方通過查閱死者的電腦和手機(jī)送矩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,254評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來哪替,“玉大人栋荸,你說我怎么就攤上這事∑静埃” “怎么了晌块?”我有些...
    開封第一講書人閱讀 165,011評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長帅霜。 經(jīng)常有香客問我匆背,道長,這世上最難降的妖魔是什么身冀? 我笑而不...
    開封第一講書人閱讀 58,755評(píng)論 1 294
  • 正文 為了忘掉前任钝尸,我火速辦了婚禮,結(jié)果婚禮上搂根,老公的妹妹穿的比我還像新娘珍促。我一直安慰自己,他們只是感情好剩愧,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,774評(píng)論 6 392
  • 文/花漫 我一把揭開白布踢星。 她就那樣靜靜地躺著,像睡著了一般隙咸。 火紅的嫁衣襯著肌膚如雪沐悦。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,610評(píng)論 1 305
  • 那天五督,我揣著相機(jī)與錄音藏否,去河邊找鬼。 笑死充包,一個(gè)胖子當(dāng)著我的面吹牛副签,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播基矮,決...
    沈念sama閱讀 40,352評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼淆储,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼!你這毒婦竟也來了家浇?” 一聲冷哼從身側(cè)響起本砰,我...
    開封第一講書人閱讀 39,257評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎钢悲,沒想到半個(gè)月后点额,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體舔株,經(jīng)...
    沈念sama閱讀 45,717評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,894評(píng)論 3 336
  • 正文 我和宋清朗相戀三年还棱,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了载慈。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,021評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡珍手,死狀恐怖办铡,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情琳要,我是刑警寧澤寡具,帶...
    沈念sama閱讀 35,735評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站焙蹭,受9級(jí)特大地震影響晒杈,放射性物質(zhì)發(fā)生泄漏嫂伞。R本人自食惡果不足惜孔厉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,354評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望帖努。 院中可真熱鬧撰豺,春花似錦、人聲如沸拼余。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,936評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽匙监。三九已至凡橱,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間亭姥,已是汗流浹背稼钩。 一陣腳步聲響...
    開封第一講書人閱讀 33,054評(píng)論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留达罗,地道東北人坝撑。 一個(gè)月前我還...
    沈念sama閱讀 48,224評(píng)論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像粮揉,于是被迫代替她去往敵國和親巡李。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,974評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容