保留列數(shù)與樣本量直方圖
該圖呈現(xiàn)的是數(shù)據(jù)中存在缺失值時掉弛,保留不同的列數(shù),能夠得到的最大樣本量。
刪除列數(shù)與樣本量直方圖
該圖呈現(xiàn)的是數(shù)據(jù)中存在缺失值時,刪除不同的列數(shù)收厨,能夠得到的最大樣本量羹呵。
特征重要性直方圖
數(shù)據(jù)經(jīng)過特征篩選后,得到特征的重要性百分比瓷们,該數(shù)據(jù)所有特征的重要性百分比之和為1业栅。
ROC曲線
受試者工作特征曲線(Receiver Operating Characteristic Curve),簡稱ROC谬晕,能反映模型在選取不同閾值時其特異性(FPR)和敏感性(TPR)的趨勢走向碘裕。
ROC曲線圖選擇最佳的5個模型進行作圖,通常以曲線下的面積(AUC)評價模型的優(yōu)劣攒钳。
P-R曲線
橫坐標為召回率(查全率, Recall)帮孔,縱坐標為精確率(查準率, Pricision),兩者之間的平衡點為曲線與圖中虛線的交點不撑。
樣本量驗證
該方法用于驗證數(shù)據(jù)的樣本量是否足夠文兢,如果曲線呈上升趨勢,則說明樣本量不足焕檬。
其中姆坚,橫坐標表示使用的訓練集樣本比例,縱坐標表示在測試集上得到的AUC值实愚。