模型建立: bagging方法--隨機森林:太耗時間了壳快。 boosting方法: lightGBM模型: https://blog.csdn.n...
關(guān)于本次智慧海洋特征構(gòu)建分為時間類特征稍计、分箱特征(x、y娇钱、v)除破、DataFrame特征(計數(shù)特征和偏移量特征)虐呻、統(tǒng)計特征(聚合)年缎、embeddi...
查看缺失值:print(f'There are {data_train.isnull().any().sum()} columns in tra...
學習目標: 1.了解和學習shapely和geopandas的基本功能,掌握用python中的這兩個庫實現(xiàn)幾何對象之間的空間操作方法铃慷。 2.掌握...
三種融合方式: 1.簡單加權(quán) 2.stacking/blending:多層模型-前一層訓練結(jié)果作為訓練集 3.bagging/boosting:...
使用Lightgbm单芜、XGBoost模型、CatBoost模型 進行建模: 模型調(diào)參: 貪心調(diào)參方法犁柜;采用for循環(huán) 網(wǎng)格調(diào)參方法洲鸠;GridSe...
1. 采用tsfresh工具包提取時間序列特征 導入工具包: 提取特征: 融合之前單變量特征之后,預測變差......哭
對數(shù)據(jù)標簽進行統(tǒng)計馋缅,發(fā)現(xiàn)樣本不均衡問題扒腕。可能采取降采樣或者過采樣方式來解決該問題萤悴。 進行了特征相關(guān)性分析瘾腰,取與標簽相關(guān)性大于0.5的特征做熱力圖...
hi~