LightGBM簡(jiǎn)介

LightGBM

LightGBM(Light Gradient Boosting Machine)是一款基于決策樹算法的分布式梯度提升框架。為了滿足工業(yè)界縮短模型計(jì)算時(shí)間的需求番枚,LightGBM的設(shè)計(jì)思路主要是兩點(diǎn):

  1. 減小數(shù)據(jù)對(duì)內(nèi)存的使用,保證單個(gè)機(jī)器在不犧牲速度的情況下葫笼,盡可能地用上更多的數(shù)據(jù);
  2. 減小通信的代價(jià)路星,提升多機(jī)并行時(shí)的效率,實(shí)現(xiàn)在計(jì)算上的線性加速洋丐。由此可見挥等,LightGBM的設(shè)計(jì)初衷就是提供一個(gè)快速高效、低內(nèi)存占用肝劲、高準(zhǔn)確度、支持并行和大規(guī)模數(shù)據(jù)處理的數(shù)據(jù)科學(xué)工具涡相。

LightGBM是微軟旗下的Distributed Machine Learning Toolkit (DMKT)的一個(gè)項(xiàng)目,由2014年首屆阿里巴巴大數(shù)據(jù)競(jìng)賽獲勝者之一柯國霖主持開發(fā)催蝗。雖然其開源時(shí)間才僅僅2個(gè)月,但是其快速高效的特點(diǎn)已經(jīng)在數(shù)據(jù)科學(xué)競(jìng)賽中嶄露頭角先朦。Allstate Claims Severity競(jìng)賽中的冠軍解決方案里就使用了LightGBM缰冤,并對(duì)其大嘉贊賞喳魏。

特性

  1. 優(yōu)化速度與內(nèi)存使用棉浸。
  2. 稀疏優(yōu)化刺彩。
  3. 優(yōu)化準(zhǔn)確率。使用leaf-wise生長方式创倔,可以處理分類變量。
  4. 優(yōu)化網(wǎng)絡(luò)通訊畦攘。
  5. 支持三種模式并行。
    (1)特征并行:
    a. Workers find local best split point {feature, threshold} on the local feature set.
    b. Communicate local best splits with each other and get the best one.
    c. Perform the best split.
    (2)數(shù)據(jù)并行:
    a. Instead of “Merge global histograms from all local histograms”, LightGBM use “Reduce Scatter” to merge histograms of different (non-overlapping) features for different workers. Then workers find the local best split on local merged histograms and sync up the global best split.
    b. As aforementioned, LightGBM uses histogram subtraction to speed up training. Based on this, we can communicate histograms only for one leaf, and get its neighbor’s histograms by subtraction as well.
    (3)投票并行:
    Voting parallel further reduces the communication cost in data-parallel to constant cost. It uses two-stage voting to reduce the communication cost of feature histograms.

常見問題

  1. LightGBM和XGBoost有什么區(qū)別叹螟?他們的loss一樣么台盯? 算法層面有什么區(qū)別?
    答:LightGBM:基于Histogram的決策樹算法爷恳;Leaf-wise的葉子生長策略;Cache命中率優(yōu)化温亲;直接支持類別特征(categorical Feature);XGBoost:預(yù)排序栈虚;Level-wise的層級(jí)生長策略;特征對(duì)梯度的訪問是一種隨機(jī)訪問魂务。

  2. LightGBM有哪些實(shí)現(xiàn),各有什么區(qū)別粘姜?
    答:gbdt:梯度提升決策樹,串行速度慢孤紧,容易過擬合;rf:隨機(jī)森林臭猜,并行速度快躺酒;dart:訓(xùn)練較慢蔑歌;goss:容易過擬合。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末园匹,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子偎肃,更是在濱河造成了極大的恐慌浑此,老刑警劉巖滞详,帶你破解...
    沈念sama閱讀 218,204評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異蒲犬,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)原叮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門巡蘸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人悦荒,你說我怎么就攤上這事“嵛叮” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵萍聊,是天一觀的道長。 經(jīng)常有香客問我寿桨,道長,這世上最難降的妖魔是什么牛隅? 我笑而不...
    開封第一講書人閱讀 58,657評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮媒佣,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘默伍。我一直安慰自己,他們只是感情好也糊,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著狸剃,像睡著了一般。 火紅的嫁衣襯著肌膚如雪钞馁。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,554評(píng)論 1 305
  • 那天探颈,我揣著相機(jī)與錄音,去河邊找鬼伪节。 笑死,一個(gè)胖子當(dāng)著我的面吹牛怀大,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播全闷,決...
    沈念sama閱讀 40,302評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼屏鳍!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起钓瞭,我...
    開封第一講書人閱讀 39,216評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤淫奔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體鸭丛,經(jīng)...
    沈念sama閱讀 45,661評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評(píng)論 3 336
  • 正文 我和宋清朗相戀三年瘾带,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了熟菲。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,977評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡抄罕,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出呆贿,到底是詐尸還是另有隱情,我是刑警寧澤做入,帶...
    沈念sama閱讀 35,697評(píng)論 5 347
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響乳怎,放射性物質(zhì)發(fā)生泄漏彩郊。R本人自食惡果不足惜秫逝,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望违帆。 院中可真熱鬧,春花似錦刷后、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽含衔。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間缓呛,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評(píng)論 1 270
  • 我被黑心中介騙來泰國打工哟绊, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留寺渗,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,138評(píng)論 3 370
  • 正文 我出身青樓信殊,卻偏偏與公主長得像,于是被迫代替她去往敵國和親涡拘。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi閱讀 7,332評(píng)論 0 10
  • 想必初上大學(xué)的小鮮肉們水援,向往這外面燈紅酒綠的花花世界,猶如脫韁的野馬蜗元,希望在這在此之前都想實(shí)現(xiàn)經(jīng)濟(jì)獨(dú)立,不...
    淚逝念成殤閱讀 213評(píng)論 0 0
  • 道仙茂名滅瘟疫奕扣, 懸壺濟(jì)世史留名。 今來茂名尋仙蹤惯豆, 潘坡丹灶石船空。 彎舟霧嶺龍虎山楷兽, 半月奇觀西江泉框仔, 美不勝...
    筍溪水閱讀 211評(píng)論 0 0
  • 今天在朋友圈看到一段話离斩,特別感觸-------對(duì)于天分與勤奮的關(guān)系银舱,我自己從小一直有個(gè)“雙倍定律”~~~把對(duì)手的練...
    Ten_Young閱讀 164評(píng)論 0 0
  • man饅頭tou閱讀 4,954評(píng)論 0 1