主成分分析是一種濃縮數據信息的方法谨敛,可將很多個指標濃縮成綜合指標(主成分)媳荒,并保證這些綜合指標彼此之間互不相關抗悍【越龋可用于簡化數據信息濃縮、計算權重缴渊、競爭力評價等赏壹。
一、研究背景
某研究想要了解各地區(qū)高等教育發(fā)展水平的綜合排名衔沼。從中選取30個地區(qū)10個評價指標蝌借,使用主成分分析進行降維,并計算綜合得分指蚁。
二菩佑、操作步驟
(1)點擊【進階方法】--【主成分】。
(2)將分析項拖拽至右側凝化,勾選[成分得分]稍坯、[綜合得分]。點擊開始分析搓劫。
也可以根據自己的分析需要瞧哟,主動設置主成分個數。
三糟把、分析思路
Step1:判斷是否適合進行主成分分析
上表展示KMO檢驗和Bartlett 的檢驗結果绢涡,用來看此數據適不適合進行主成分分析牲剃。
通常KMO值的判斷標準為0.6遣疯。大于0.6說明適合進行分析,反之凿傅,說明不適合進行分析缠犀。同時Bartlett檢驗對應P值小于0.05也說明適合分析。
SPSSAU輸出的結果中會給出智能解讀結果聪舒,直接查看智能分析:
Step2:確定主成分個數辨液,及判斷主成分與分析項對應關系
確定可以使用主成分分析后,下一步重點確定主成分個數箱残。
方差解釋率表格主要用于判斷提取多少個主成分合適滔迈。以及每個主成分的方差解釋率和累計方差解釋率情況。方差解釋率越大說明主成分包含原數據信息的越多被辑。
從上表可知:本次共提取了2個主成分燎悍。這2個主成分的方差解釋率分別是75.024%,15.767%盼理,累積方差解釋率為,90.791%谈山。說明兩個主成分能夠表達10個分析項90.791%的信息量,主成分分析效果很好宏怔。
同時可結合碎石圖輔助判斷主成分提取個數奏路。
當折線由陡峭突然變得平穩(wěn)時畴椰,陡峭到平穩(wěn)對應的主成分個數即為參考提取主成分個數。實際研究中更多以專業(yè)知識鸽粉,結合主成分與研究項對應關系情況斜脂,綜合權衡判斷得出主成分個數。
載荷系數表格触机,主要展示主成分對于研究項的信息提取情況秽褒,以及主成分和研究項對應關系。
藍色數值代表載荷系數絕對值大于0.4威兜,如高等院校數對應的載荷系數(0.958销斟,-0.247)說明這個分析項更適合歸于主成分1下。
共同度代表某題項可被提取的信息量椒舵,共同度越高說明指標能被主成分解釋的程度越高蚂踊,被提取的信息量越多。一般以0.4作為標準笔宿。
從結果中可以看出犁钟,主成分1中反映高等院校數X1、畢業(yè)生數X2泼橘、招生人數X3涝动、在校生數X4、教職工數X5炬灭、專職教師數X6醋粟、教育經費占國內生產總值比重X9、生均教育經費X10重归,共八個指標的信息米愿。
主成分2反映高級職稱占專職教師的比例X7、院校平均在校生數X8兩個指標的信息鼻吮。共同度均超過0.4育苟,說明各指標均能被2個主成分較好地解釋。
Step3:利用主成分得到綜合得分
根據之前勾選的[綜合得分]椎木,即可自動得到綜合得分結果违柏。
SPSSAU默認命名為CompScore_XXXX。使用【數據處理】→【標題處理】功能可以對題目重命名香椎。
在頁面右上角【我的數據】中可以具體查看具體的綜合得分漱竖。綜合得分值越大表示越有競爭力,也就說明該地區(qū)高等教育發(fā)展水平越發(fā)達士鸥。
Step4:得到綜合排名情況
【數據處理】→【生成變量】里的排名功能闲孤。點擊“綜合得分”,再選擇“排名(Rank)”,點擊確認處理讼积。
下載后可使用EXCEL對數據進行整理肥照,最終結果如下:
四、疑問解答
問題1:綜合得分具體如何計算勤众?
SPSSAU提供一鍵生成綜合得分非常方便舆绎,但也會有人有疑問:綜合得分是怎么計算得到?如果想描述計算過程應該怎么說们颜?
綜合得分實際就等于每個主成分得分乘以各自權重求和所得的結果吕朵。
(綜合得分=主成分1得分*主成分1權重+主成分2得分*主成分2權重+.....)
“主成分得分”可以通過勾選[成分得分],由SPSSAU自動輸出窥突。
本次共提取2個主成分努溃,因此分別生成2個主成分得分。
有了主成分得分阻问,下面要解決權重問題梧税。如何計算得到每個主成分的權重?
權重是以各主成分對應的方差貢獻率除以累計方差貢獻率称近。
以本例來說第队,2個主成分的方差解釋率分別是75.024%,15.767%刨秆,累積方差解釋率為,90.791%凳谦。
主成分1的權重:75.024%/90.791%=82.63%
主成分2的權重:15.767%/90.791%=17.37%
權重結果在智能分析中也有提供,可以直接使用衡未。
成分得分和權重都得到即可計算綜合得分尸执。
F=82.63%*主成分1得分+17.37%*主成分2得分
問題2:分析之前是否需要對數據進行標準化處理?
SPSSAU默認就已經進行過標準化處理眠屎,因此不需要再對數據處理剔交。當然標準化后的數據再次標準化依舊還是自身沒有任何變化肆饶,結果均一致改衩。
問題3:相關性矩陣在哪里計算?
可使用【通用方法】--【相關】得到相關矩陣驯镊。
通過相關矩陣可以看出哪些指標之間相關性較強葫督,哪些指標之間相關性不大。
五板惑、其他說明
主成分分析的作用更多側重于計算權重橄镜、計算綜合競爭力。不會過多關注主成分與分析項對應關系冯乘,不要求每個主成分有明確的含義洽胶。如果研究目的側重于濃縮題項信息,更建議采用因子分析裆馒。
更多干貨內容可登錄SPSSAU官網查看姊氓。