隨機(jī)森林算法是我們經(jīng)常使用到的一種集成式的機(jī)器學(xué)習(xí)算法堤舒,由多棵決策樹組合而成踢京。那么怎么使用隨機(jī)森林判定特征的重要性呢誉碴?代碼如下:
from sklearn.ensemble import RandomForestClassifier
feat_labels = X.columns[0:]
forest = RandomForestClassifier(n_estimators=10000,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? random_state=0,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? n_jobs=-1)
forest.fit(X_train,y_train)
importances = forest.feature_importances_
indices = np.argsort(importances)[::-1]
for f in range(X_train.shape[1]):
? ? print(feat_labels[f],importances[indices[f]])
我是一只不會(huì)南飛的燕!