一般來說,PCA分析2個(gè)圖夠了很澄,以iris數(shù)據(jù)為例,在經(jīng)過PCA分析后,我們可以得到第一章碎石圖甩苛,表示PC1蹂楣,2,3讯蒲,4的特征向量值痊土,可以據(jù)此選擇保留的主成分(通常選擇特征向量值超過2的變量),此圖顯示出1個(gè)主成分可以保留墨林。
此外赁酝,可以有另外2個(gè)基于特征向量值選擇主成分的標(biāo)準(zhǔn),即 Kaiser-Guttman 標(biāo)準(zhǔn)和 Broken Stick 標(biāo)準(zhǔn)旭等,這些標(biāo)準(zhǔn)可以反應(yīng)主成分對于解釋原始數(shù)據(jù)的貢獻(xiàn)程度
依據(jù)Kaiser-Guttman 標(biāo)準(zhǔn)酌呆,僅應(yīng)該保留主成分1,上圖中僅PC1超過了平均值搔耕,下圖中僅PC1超過了紅色柱形圖隙袁。
在選擇了PC后,需要考慮變量對于PC的貢獻(xiàn)弃榨,下圖中菩收,Petal Length,Width鲸睛, Sepal Length對于PC1的貢獻(xiàn)大娜饵,即方向偏向x軸方向;而Sepal width對PC2的貢獻(xiàn)大官辈,方向偏向y軸划咐。長度越長,相對影響越大钧萍。