xgboost參數(shù)調(diào)優(yōu)

一. 確定最佳決策樹數(shù)量
選擇較高的學習速率(learning rate)蕴坪。一般情況下,學習速率的值為0.1敬锐。但是背传,對于不同的問題,理想的學習速率有時候會在0.05到0.3之間波動台夺。選擇對應(yīng)于此學習速率的理想決策樹數(shù)量续室。XGBoost有一個很有用的函數(shù)“cv”,這個函數(shù)可以在每一次迭代中使用交叉驗證谒养,并返回理想的決策樹數(shù)量。

先給定boosting主要參數(shù)一個初始值明郭,后續(xù)再進行調(diào)優(yōu)买窟。
1、max_depth = 5 :這個參數(shù)的取值最好在3-10之間薯定。我選的起始值為5始绍,但是你也可以選擇其它的值。起始值在4-6之間都是不錯的選擇话侄。
2亏推、min_child_weight = 1:在這里選了一個比較小的值学赛,因為這是一個極不平衡的分類問題。因此吞杭,某些葉子節(jié)點下的值會比較小盏浇。
3、gamma = 0: 起始值也可以選其它比較小的值芽狗,在0.1到0.2之間就可以绢掰。這個參數(shù)后繼也是要調(diào)整的。
4童擎、subsample,colsample_bytree = 0.8: 這個是最常見的初始值了滴劲。典型值的范圍在0.5-0.9之間。
5顾复、scale_pos_weight = 1: 這個值是因為類別十分不平衡班挖。

二. 主要參數(shù)調(diào)優(yōu)
對于給定的學習速率和決策樹數(shù)量,進行決策樹特定參數(shù)調(diào)優(yōu)(max_depth, min_child_weight, gamma, subsample, colsample_bytree)芯砸。
這里通常使用GridSearch萧芙。可先尋找max_depth乙嘀、min_child_weight末购,確定后,再對gamma虎谢、subsample等調(diào)優(yōu)盟榴。

三. xgboost的正則化參數(shù)的調(diào)優(yōu)。(lambda, alpha)婴噩。這些參數(shù)可以降低模型的復(fù)雜度擎场,從而提高模型的表現(xiàn)。

四. 降低學習速率几莽,確定理想?yún)?shù)迅办。

參數(shù)

xgboost 中,objective 是模型學習任務(wù)參數(shù)(learning task parameters)中的目標參數(shù)章蚣,它指定訓練任務(wù)的目標站欺。

objective 參數(shù)詳解

objective 參數(shù)默認值為 reg:squarederror

  • reg:squarederror:以均方差(即 MSE)損失函數(shù)為最小化的回歸問題任務(wù)纤垂。
  • reg:squaredlogerror:以均方根對數(shù)誤差為最小化的回歸問題任務(wù)矾策。
  • reg:logistic:邏輯回歸的二分類,評估默認使用均方根誤差(rmse)峭沦。
  • reg:pseudohubererror:以 Pseudo-Huber 損失函數(shù)的回歸問題贾虽。
  • reg:gamma:使用對數(shù)鏈接(log-link)進行伽馬回歸。輸出是伽馬分布的平均值吼鱼。例如蓬豁,對于建模保險索賠嚴重性或?qū)赡苁琴ゑR分布的任何結(jié)果绰咽,它可能很有用。
  • reg:tweedie:使用對數(shù)鏈接(log-link)進行 Tweedie 回歸地粪。常用于建模保險的總損失取募,或用于可能是 Tweedie-distributed 的任何結(jié)果。
  • binary:logistic:邏輯回歸的二分類驶忌,輸出的也是分類的概率矛辕,和 reg:logistic 一樣,不同的是默認采用錯誤率評估指標付魔。
  • binary:logitraw:邏輯回歸的二分類聊品,但在進行邏輯回歸轉(zhuǎn)換之前直接輸出分類得分。
  • binary:hinge:基于 Hinge 損失函數(shù)的二分類几苍,預(yù)測輸出不是 0 就是 1翻屈,而不是分類的概率值。
  • count:poisson:基于泊松回歸的計數(shù)任務(wù)妻坝,輸出泊松分布的平均值伸眶。
    • max_delta_step:可以設(shè)置該值,默認為 0.7刽宪。
  • survival:cox:基于 Cox 風險比例回歸模型的生存分析任務(wù)厘贼,如癌癥患者生存概率等。
  • survival:aft:基于加速失效模型(aft)的生存分析任務(wù)圣拄。
  • aft_loss_distribution:概率密度函數(shù)嘴秸,基于 survival:aft 和 aft-nloglik 作為評價指標。
  • multi:softmax:使用 softmax 多分類器的多分類任務(wù)庇谆,返回預(yù)測的類別岳掐,同時也要設(shè)置分類的個數(shù)。
  • multi:softprob:和 softmax 一樣饭耳,但是輸出的一個形式為 ndata * nclass 的向量串述,可以進一步將矩陣 reshape 成 ndata * nclass 的指標,輸出的是每個類別的概率值寞肖。
  • rank:pairwise:使用 LambdaMART 進行文檔對方法排名(pairwise)纲酗,并使成對損失最小化。
  • rank:ndcg:使用 LambdaMART 進行文檔列表方法排名(listwise)新蟆,并使標準化折讓累積收益(NDCG)最大化耕姊。
  • rank:map:使用 LambdaMART 進行文檔列表方法排名(listwise),并使平均準確率(MAP)最大化栅葡。

https://zhuanlan.zhihu.com/p/29649128

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市尤泽,隨后出現(xiàn)的幾起案子欣簇,更是在濱河造成了極大的恐慌规脸,老刑警劉巖,帶你破解...
    沈念sama閱讀 207,248評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件熊咽,死亡現(xiàn)場離奇詭異莫鸭,居然都是意外死亡,警方通過查閱死者的電腦和手機横殴,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評論 2 381
  • 文/潘曉璐 我一進店門被因,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人衫仑,你說我怎么就攤上這事梨与。” “怎么了文狱?”我有些...
    開封第一講書人閱讀 153,443評論 0 344
  • 文/不壞的土叔 我叫張陵粥鞋,是天一觀的道長。 經(jīng)常有香客問我瞄崇,道長呻粹,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,475評論 1 279
  • 正文 為了忘掉前任苏研,我火速辦了婚禮等浊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘摹蘑。我一直安慰自己筹燕,他們只是感情好纹蝴,可當我...
    茶點故事閱讀 64,458評論 5 374
  • 文/花漫 我一把揭開白布庄萎。 她就那樣靜靜地躺著,像睡著了一般塘安。 火紅的嫁衣襯著肌膚如雪切黔。 梳的紋絲不亂的頭發(fā)上凌埂,一...
    開封第一講書人閱讀 49,185評論 1 284
  • 那天栓霜,我揣著相機與錄音,去河邊找鬼茂洒。 笑死,一個胖子當著我的面吹牛智哀,可吹牛的內(nèi)容都是我干的摹菠。 我是一名探鬼主播幸撕,決...
    沈念sama閱讀 38,451評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起下梢,我...
    開封第一講書人閱讀 37,112評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎塞蹭,沒想到半個月后孽江,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,609評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡番电,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,083評論 2 325
  • 正文 我和宋清朗相戀三年岗屏,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片漱办。...
    茶點故事閱讀 38,163評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡这刷,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出娩井,到底是詐尸還是另有隱情暇屋,我是刑警寧澤,帶...
    沈念sama閱讀 33,803評論 4 323
  • 正文 年R本政府宣布撞牢,位于F島的核電站率碾,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏屋彪。R本人自食惡果不足惜所宰,卻給世界環(huán)境...
    茶點故事閱讀 39,357評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望畜挥。 院中可真熱鬧仔粥,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,357評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至麦向,卻和暖如春瘟裸,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背诵竭。 一陣腳步聲響...
    開封第一講書人閱讀 31,590評論 1 261
  • 我被黑心中介騙來泰國打工话告, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人卵慰。 一個月前我還...
    沈念sama閱讀 45,636評論 2 355
  • 正文 我出身青樓沙郭,卻偏偏與公主長得像,于是被迫代替她去往敵國和親裳朋。 傳聞我的和親對象是個殘疾皇子病线,可洞房花燭夜當晚...
    茶點故事閱讀 42,925評論 2 344

推薦閱讀更多精彩內(nèi)容