參考【1】https://zhuanlan.zhihu.com/p/106320452
? ? ? ?【2】https://zhuanlan.zhihu.com/p/364919024
? ? ? ?【3】https://zhuanlan.zhihu.com/p/85791430??
? ? ? ?【4】https://zhuanlan.zhihu.com/p/186204351
1.概括圖关噪,即 summary plot,該圖是對(duì)全部樣本全部特征的shaple值進(jìn)行求和,可以反映出特征重要性及每個(gè)特征對(duì)樣本正負(fù)預(yù)測(cè)的貢獻(xiàn)。
shap.summary_plot(shap_values, data[use_cols])
2.summary_plot圖吃度,是把所有的樣本點(diǎn)都呈現(xiàn)在圖中,顏色代表特征值的大小家夺,而橫坐標(biāo)為shap值的大小猫态,從圖中可以看到 days_credit這一特征,值越小兆解,shap值越大馆铁,換句話(huà)來(lái)說(shuō)就是days_credit越大,風(fēng)險(xiǎn)越高锅睛。
3.特征影響圖
X - 橫軸是樣本數(shù)量埠巨,
Y - 縱軸是shap值加總(每個(gè)特征值 * 每個(gè)特征的shap值)
這里橫軸的排列是非常有講究的,因?yàn)椴皇前错樞蚺帕械南志埽搱D會(huì)把受相同特征影響大的放一起,
比如觀察最左邊辣垒,藍(lán)色扎堆是負(fù)向shap增益區(qū),劃過(guò)可以看到基本是0/4/5/12這幾個(gè)特征對(duì)大多數(shù)樣本都有負(fù)向增益; 當(dāng)然同樣,右邊具练,紅色扎堆乍构,12/5/10對(duì)一些樣本是正向增益的
整體來(lái)說(shuō),該圖是一個(gè)宏觀的了解扛点,諸多樣本不同的特征對(duì)其的影響