智慧海洋建設(shè)-Task4模型建立

模型建立：

bagging方法--隨機森林：太耗時間了骤公。

boosting方法：

lightGBM模型：

https://blog.csdn.net/wuzhongqiang/article/details/105350579

Xgboost模型：

https://blog.csdn.net/wuzhongqiang/article/details/104854890

?集成模型集成方法（ensemble method）：通過組合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù)绣溜，通過集成方法，可以將多個弱學(xué)習(xí)器組合成一個強分類器柱搜，因此集成學(xué)習(xí)的泛化能力一般比單一分類器要好跪帝。集成方法主要包括Bagging和Boosting活逆，Bagging和Boosting都是將已有的分類或回歸算法通過一定方式組合起來审编，形成一個更加強大的分類猜煮。兩種方法都是把若干個分類器整合為一個分類器的方法次员，只是整合的方式不一樣，最終得到不一樣的效果王带。常見的基于Baggin思想的集成模型有：隨機森林淑蔚、基于Boosting思想的集成模型有：Adaboost、GBDT愕撰、XgBoost刹衫、LightGBM等慰枕。

Baggin和Boosting的區(qū)別總結(jié)如下：

樣本選擇上：?Bagging方法的訓(xùn)練集是從原始集中有放回的選取讨便，所以從原始集中選出的各輪訓(xùn)練集之間是獨立的；而Boosting方法需要每一輪的訓(xùn)練集不變景描，只是訓(xùn)練集中每個樣本在分類器中的權(quán)重發(fā)生變化囱桨。而權(quán)值是根據(jù)上一輪的分類結(jié)果進行調(diào)整

樣例權(quán)重上：?Bagging方法使用均勻取樣仓犬，所以每個樣本的權(quán)重相等；而Boosting方法根據(jù)錯誤率不斷調(diào)整樣本的權(quán)值舍肠，錯誤率越大則權(quán)重越大

預(yù)測函數(shù)上：?Bagging方法中所有預(yù)測函數(shù)的權(quán)重相等婶肩；而Boosting方法中每個弱分類器都有相應(yīng)的權(quán)重，對于分類誤差小的分類器會有更大的權(quán)重

并行計算上：?Bagging方法中各個預(yù)測函數(shù)可以并行生成貌夕；而Boosting方法各個預(yù)測函數(shù)只能順序生成律歼，因為后一個模型參數(shù)需要前一輪模型的結(jié)果。

摘自：https://github.com/datawhalechina/team-learning-data-mining/blob/master/HeartbeatClassification/Task4%20%E6%A8%A1%E5%9E%8B%E8%B0%83%E5%8F%82.md

模型調(diào)參：太耗時間了啡专，效果還不一定好

網(wǎng)格調(diào)參

sklearn 提供GridSearchCV用于進行網(wǎng)格搜索险毁，只需要把模型的參數(shù)輸進去，就能給出最優(yōu)化的結(jié)果和參數(shù)们童。相比起貪心調(diào)參畔况，網(wǎng)格搜索的結(jié)果會更優(yōu)，但是網(wǎng)格搜索只適合于小數(shù)據(jù)集慧库，一旦數(shù)據(jù)的量級上去了跷跪，很難得出結(jié)果。

貪心調(diào)參

先使用當前對模型影響最大的參數(shù)進行調(diào)優(yōu)齐板，達到當前參數(shù)下的模型最優(yōu)化吵瞻，再使用對模型影響次之的參數(shù)進行調(diào)優(yōu)葛菇，如此下去，直到所有的參數(shù)調(diào)整完畢橡羞。這個方法的缺點就是可能會調(diào)到局部最優(yōu)而不是全局最優(yōu)眯停，但是只需要一步一步的進行參數(shù)最優(yōu)化調(diào)試即可，容易理解卿泽。需要按步驟進行調(diào)試

貝葉斯調(diào)參

貝葉斯調(diào)參的主要思想是：給定優(yōu)化的目標函數(shù)(廣義的函數(shù)莺债，只需指定輸入和輸出即可，無需知道內(nèi)部結(jié)構(gòu)以及數(shù)學(xué)性質(zhì))签夭，通過不斷地添加樣本點來更新目標函數(shù)的后驗分布(高斯過程,直到后驗分布基本貼合于真實分布）齐邦。簡單的說，就是考慮了上一次參數(shù)的信息第租，從而更好的調(diào)整當前的參數(shù)措拇。

貝葉斯調(diào)參的步驟如下：

定義優(yōu)化函數(shù)(rf_cv）

建立模型

定義待優(yōu)化的參數(shù)

得到優(yōu)化結(jié)果，并返回要優(yōu)化的分數(shù)指標

frombayes_optimportBayesianOptimization

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末煌妈，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子宣羊，更是在濱河造成了極大的恐慌璧诵，老刑警劉巖，帶你破解...
沈念sama閱讀 221,548評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件仇冯，死亡現(xiàn)場離奇詭異之宿，居然都是意外死亡，警方通過查閱死者的電腦和手機苛坚，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,497評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門比被，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人泼舱，你說我怎么就攤上這事等缀。” “怎么了娇昙？”我有些...
開封第一講書人閱讀 167,990評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵尺迂，是天一觀的道長。經(jīng)常有香客問我冒掌，道長噪裕，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 59,618評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任股毫，我火速辦了婚禮膳音，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘铃诬。我一直安慰自己祭陷，他們只是感情好苍凛，可當我...
茶點故事閱讀 68,618評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著颗胡，像睡著了一般毫深。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上毒姨，一...
開封第一講書人閱讀 52,246評論 1贊 308
城市分裂傳說
那天哑蔫，我揣著相機與錄音，去河邊找鬼弧呐。笑死闸迷，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的俘枫。我是一名探鬼主播腥沽，決...
沈念sama閱讀 40,819評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼鸠蚪！你這毒婦竟也來了今阳？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,725評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤茅信，失蹤者是張志新（化名）和其女友劉穎盾舌，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蘸鲸，經(jīng)...
沈念sama閱讀 46,268評論 1贊 320
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡妖谴，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,356評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了酌摇。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片膝舅。...
茶點故事閱讀 40,488評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖窑多，靈堂內(nèi)的尸體忽然破棺而出仍稀，到底是詐尸還是另有隱情，我是刑警寧澤埂息，帶...
沈念sama閱讀 36,181評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布琳轿，位于F島的核電站，受9級特大地震影響耿芹，放射性物質(zhì)發(fā)生泄漏崭篡。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,862評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一吧秕、第九天我趴在偏房一處隱蔽的房頂上張望琉闪。院中可真熱鬧，春花似錦砸彬、人聲如沸颠毙。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,331評論 0贊 24
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽蛀蜜。三九已至刻两，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間滴某，已是汗流浹背磅摹。一陣腳步聲響...
開封第一講書人閱讀 33,445評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留霎奢，地道東北人户誓。一個月前我還...
沈念sama閱讀 48,897評論 3贊 376
代替公主和親
正文我出身青樓，卻偏偏與公主長得像幕侠，于是被迫代替她去往敵國和親帝美。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 45,500評論 2贊 359

智慧海洋建設(shè)-Task4模型建立

推薦閱讀更多精彩內(nèi)容