GBDT模型

模型的基本原理不在贅述,僅結(jié)合scikit-learn中g(shù)bdt的實(shí)現(xiàn)璃弄,理清思路。

1 流程圖

gbdt實(shí)現(xiàn)流程圖.png

1.1 總體迭代過程

_fit_stage.png

2 損失函數(shù)

2.1 GradientBoostingRegressor的損失函數(shù)

sklearn中實(shí)現(xiàn)了四種目標(biāo)函數(shù):LeastSquaresError袍嬉,LeastAbsoluteError淫奔,HuberLossFunctionQuantileLossFunction振定。本人只使用過LeastSquaresError必怜,LeastAbsoluteError這兩種,因此僅對這兩種目標(biāo)函數(shù)展開理解后频。

  • LeastSquaresError
    最小均方誤差函數(shù)梳庆,形式為:
    均方誤差損失函數(shù).png

    其對應(yīng)的負(fù)梯度為:
    均方誤差損失函數(shù)-負(fù)梯度.png

    代碼中的體現(xiàn)為:
image.png
  • LeastAbsoluteError
    最小絕對值誤差函數(shù):形式為:
最小絕對值誤差損失函數(shù).png
image.png

2.2 GradientBoostingClassifier的損失函數(shù)

sklearn中實(shí)現(xiàn)了兩種目標(biāo)函數(shù):Deviance(二分類問題BinomialDeviance和多分類問題MultinomialDeviance)ExponentialLoss卑惜。

  • BinomialDeviance損失函數(shù)為:
image.png

負(fù)梯度

image.png

代碼中的體現(xiàn)

binomialDeviance.png
  • ExponentialLoss 損失函數(shù)為:
ExponentialLoss 損失函數(shù).png

負(fù)梯度

image.png

代碼中的體現(xiàn)

image.png

實(shí)際上以上兩種損失函數(shù)都是偏差最小化損失函數(shù)膏执,其一般化公式為:

image.png

值得注意的是,在Friedman的論文Greedy Function Approximation A Gradient Boosting Machine 中露久,描述的目標(biāo)函數(shù)為

negative binomial log-likelihood-Friedman損失函數(shù).png

該目標(biāo)函數(shù)對應(yīng)的標(biāo)簽為y = {-1,1} 更米,而sklearn中對應(yīng)的標(biāo)簽為y = {0,1}, 兩者是等價的:

image.png

2.3 單棵回歸樹

在總體迭代過程一節(jié)我們已經(jīng)看到,每次迭代都會建立一個回歸樹去擬合負(fù)梯度向量毫痕,與建樹相關(guān)的點(diǎn)有:

  • 損失函數(shù)
    均方差損失函數(shù)
  • 節(jié)點(diǎn)分裂原則:


    節(jié)點(diǎn)分裂原則.png

    通常使用的是friedman_mse原則壳快,公式為Greedy Function Approximation: A Gradient Boosting Machine論文中的(35)式:


    friedman_mse.png
  • 葉子節(jié)點(diǎn)的值
    葉子節(jié)點(diǎn)的值為分到該葉子節(jié)點(diǎn)的所有樣本對應(yīng)的輸出yi的平均值。

Refs

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末镇草,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子瘤旨,更是在濱河造成了極大的恐慌梯啤,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件存哲,死亡現(xiàn)場離奇詭異因宇,居然都是意外死亡七婴,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進(jìn)店門察滑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來打厘,“玉大人,你說我怎么就攤上這事贺辰』Фⅲ” “怎么了?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵饲化,是天一觀的道長莽鸭。 經(jīng)常有香客問我,道長吃靠,這世上最難降的妖魔是什么硫眨? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮巢块,結(jié)果婚禮上礁阁,老公的妹妹穿的比我還像新娘。我一直安慰自己族奢,他們只是感情好姥闭,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著歹鱼,像睡著了一般泣栈。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上弥姻,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天南片,我揣著相機(jī)與錄音,去河邊找鬼庭敦。 笑死疼进,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的秧廉。 我是一名探鬼主播伞广,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼疼电!你這毒婦竟也來了嚼锄?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤蔽豺,失蹤者是張志新(化名)和其女友劉穎区丑,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡沧侥,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年可霎,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片宴杀。...
    茶點(diǎn)故事閱讀 39,711評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡癣朗,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出旺罢,到底是詐尸還是另有隱情旷余,我是刑警寧澤,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布主经,位于F島的核電站荣暮,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏罩驻。R本人自食惡果不足惜穗酥,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望惠遏。 院中可真熱鬧砾跃,春花似錦、人聲如沸节吮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽透绩。三九已至翘骂,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間帚豪,已是汗流浹背碳竟。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留狸臣,地道東北人莹桅。 一個月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像烛亦,于是被迫代替她去往敵國和親诈泼。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,611評論 2 353

推薦閱讀更多精彩內(nèi)容