智慧海洋建設(shè)-Task4模型建立

模型建立

bagging方法--隨機森林:太耗時間了骤公。

boosting方法:

lightGBM模型:

https://blog.csdn.net/wuzhongqiang/article/details/105350579

Xgboost模型:

https://blog.csdn.net/wuzhongqiang/article/details/104854890

?集成模型集成方法(ensemble method):通過組合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù)绣溜,通過集成方法,可以將多個弱學(xué)習(xí)器組合成一個強分類器柱搜,因此集成學(xué)習(xí)的泛化能力一般比單一分類器要好跪帝。集成方法主要包括Bagging和Boosting活逆,Bagging和Boosting都是將已有的分類或回歸算法通過一定方式組合起來审编,形成一個更加強大的分類猜煮。兩種方法都是把若干個分類器整合為一個分類器的方法次员,只是整合的方式不一樣,最終得到不一樣的效果王带。常見的基于Baggin思想的集成模型有:隨機森林淑蔚、基于Boosting思想的集成模型有:Adaboost、GBDT愕撰、XgBoost刹衫、LightGBM等慰枕。

Baggin和Boosting的區(qū)別總結(jié)如下:

樣本選擇上?Bagging方法的訓(xùn)練集是從原始集中有放回的選取讨便,所以從原始集中選出的各輪訓(xùn)練集之間是獨立的;而Boosting方法需要每一輪的訓(xùn)練集不變景描,只是訓(xùn)練集中每個樣本在分類器中的權(quán)重發(fā)生變化囱桨。而權(quán)值是根據(jù)上一輪的分類結(jié)果進行調(diào)整

樣例權(quán)重上:?Bagging方法使用均勻取樣仓犬,所以每個樣本的權(quán)重相等;而Boosting方法根據(jù)錯誤率不斷調(diào)整樣本的權(quán)值舍肠,錯誤率越大則權(quán)重越大

預(yù)測函數(shù)上:?Bagging方法中所有預(yù)測函數(shù)的權(quán)重相等婶肩;而Boosting方法中每個弱分類器都有相應(yīng)的權(quán)重,對于分類誤差小的分類器會有更大的權(quán)重

并行計算上:?Bagging方法中各個預(yù)測函數(shù)可以并行生成貌夕;而Boosting方法各個預(yù)測函數(shù)只能順序生成律歼,因為后一個模型參數(shù)需要前一輪模型的結(jié)果。

摘自:https://github.com/datawhalechina/team-learning-data-mining/blob/master/HeartbeatClassification/Task4%20%E6%A8%A1%E5%9E%8B%E8%B0%83%E5%8F%82.md

模型調(diào)參:太耗時間了啡专,效果還不一定好

網(wǎng)格調(diào)參

sklearn 提供GridSearchCV用于進行網(wǎng)格搜索险毁,只需要把模型的參數(shù)輸進去,就能給出最優(yōu)化的結(jié)果和參數(shù)们童。相比起貪心調(diào)參畔况,網(wǎng)格搜索的結(jié)果會更優(yōu),但是網(wǎng)格搜索只適合于小數(shù)據(jù)集慧库,一旦數(shù)據(jù)的量級上去了跷跪,很難得出結(jié)果。

貪心調(diào)參

先使用當前對模型影響最大的參數(shù)進行調(diào)優(yōu)齐板,達到當前參數(shù)下的模型最優(yōu)化吵瞻,再使用對模型影響次之的參數(shù)進行調(diào)優(yōu)葛菇,如此下去,直到所有的參數(shù)調(diào)整完畢橡羞。這個方法的缺點就是可能會調(diào)到局部最優(yōu)而不是全局最優(yōu)眯停,但是只需要一步一步的進行參數(shù)最優(yōu)化調(diào)試即可,容易理解卿泽。需要按步驟進行調(diào)試

貝葉斯調(diào)參

貝葉斯調(diào)參的主要思想是:給定優(yōu)化的目標函數(shù)(廣義的函數(shù)莺债,只需指定輸入和輸出即可,無需知道內(nèi)部結(jié)構(gòu)以及數(shù)學(xué)性質(zhì))签夭,通過不斷地添加樣本點來更新目標函數(shù)的后驗分布(高斯過程,直到后驗分布基本貼合于真實分布)齐邦。簡單的說,就是考慮了上一次參數(shù)的信息第租,從而更好的調(diào)整當前的參數(shù)措拇。

貝葉斯調(diào)參的步驟如下:

定義優(yōu)化函數(shù)(rf_cv)

建立模型

定義待優(yōu)化的參數(shù)

得到優(yōu)化結(jié)果,并返回要優(yōu)化的分數(shù)指標

frombayes_optimportBayesianOptimization

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末煌妈,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子宣羊,更是在濱河造成了極大的恐慌璧诵,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,548評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件仇冯,死亡現(xiàn)場離奇詭異之宿,居然都是意外死亡,警方通過查閱死者的電腦和手機苛坚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評論 3 399
  • 文/潘曉璐 我一進店門比被,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人泼舱,你說我怎么就攤上這事等缀。” “怎么了娇昙?”我有些...
    開封第一講書人閱讀 167,990評論 0 360
  • 文/不壞的土叔 我叫張陵尺迂,是天一觀的道長。 經(jīng)常有香客問我冒掌,道長噪裕,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,618評論 1 296
  • 正文 為了忘掉前任股毫,我火速辦了婚禮膳音,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘铃诬。我一直安慰自己祭陷,他們只是感情好苍凛,可當我...
    茶點故事閱讀 68,618評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著颗胡,像睡著了一般毫深。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上毒姨,一...
    開封第一講書人閱讀 52,246評論 1 308
  • 那天哑蔫,我揣著相機與錄音,去河邊找鬼弧呐。 笑死闸迷,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的俘枫。 我是一名探鬼主播腥沽,決...
    沈念sama閱讀 40,819評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼鸠蚪!你這毒婦竟也來了今阳?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,725評論 0 276
  • 序言:老撾萬榮一對情侶失蹤茅信,失蹤者是張志新(化名)和其女友劉穎盾舌,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蘸鲸,經(jīng)...
    沈念sama閱讀 46,268評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡妖谴,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,356評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了酌摇。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片膝舅。...
    茶點故事閱讀 40,488評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖窑多,靈堂內(nèi)的尸體忽然破棺而出仍稀,到底是詐尸還是另有隱情,我是刑警寧澤埂息,帶...
    沈念sama閱讀 36,181評論 5 350
  • 正文 年R本政府宣布琳轿,位于F島的核電站,受9級特大地震影響耿芹,放射性物質(zhì)發(fā)生泄漏崭篡。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,862評論 3 333
  • 文/蒙蒙 一吧秕、第九天 我趴在偏房一處隱蔽的房頂上張望琉闪。 院中可真熱鬧,春花似錦砸彬、人聲如沸颠毙。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蛀蜜。三九已至刻两,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間滴某,已是汗流浹背磅摹。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留霎奢,地道東北人户誓。 一個月前我還...
    沈念sama閱讀 48,897評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像幕侠,于是被迫代替她去往敵國和親帝美。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,500評論 2 359

推薦閱讀更多精彩內(nèi)容