一: 主成分分析,
1找出主factor? 下降維度
2特征工程,特征工程2,3增加緯度
二: 分情況:
例一:房價預(yù)測;2啃匿;進階版預(yù)測
(1)先聚類(無監(jiān)督),
(2)再擬合
1各種映射最小二乘
2增加條目0 1午衰,對此進行線性回歸 回到原函數(shù)映射季節(jié)性+趨勢
3各種映射放縮組合boosting:boosting 算法 CatBoost立宜、Light GBM 和 XGBoost 進行了對比;雖然本文結(jié)論依據(jù)于特定的數(shù)據(jù)集臊岸,但通常情況下橙数,XGBoost 都比另外兩個算法慢。GBDT(也屬于boosting)
例二:泰坦尼克號是否成活1帅戒,2
? 西瓜是否熟了
? 是否患有糖尿病
文本分類cnn rnn實現(xiàn)
分類(有監(jiān)督)
即基于一組預(yù)測變量預(yù)測一個分類結(jié)果(二分類)灯帮。有監(jiān)督機器學(xué)習(xí)領(lǐng)域中包含可用于分類的方法:邏輯回歸、KNN(k臨近)逻住、決策樹钟哥、隨機森林、支持向量機(svm)瞎访、神經(jīng)網(wǎng)絡(luò)等腻贰。
例三 GBDT+LR CTR預(yù)估-Kaggle實例[有數(shù)據(jù)集]
三,正則化(防止過擬合)
最后:預(yù)測結(jié)果常用評分標準
If you are interesting in this topic.
You can get in touch with me.
18234056952(Tel? wechat? qq)