系統(tǒng)聚類分析可以對變量進(jìn)行分類籍胯,但是難以判斷變量分類結(jié)果的合理性雕蔽。另外诅岩,如果要衡量每個(gè)變量對類別的貢獻(xiàn)讳苦,也難以通過聚類分析來實(shí)現(xiàn)。這個(gè)時(shí)候就要采用因子分析來實(shí)現(xiàn)了吩谦。因子分析就是找出隱藏在變量背后具有共性的因子鸳谜。
因子分析
因子分析是通過研究變量間的相關(guān)系數(shù)矩陣,把這些變量間錯(cuò)綜復(fù)雜的關(guān)系歸結(jié)成少數(shù)幾個(gè)綜合因子式廷,并據(jù)此對變量進(jìn)行分類的一種統(tǒng)計(jì)分析方法咐扭。由于歸結(jié)出的因子個(gè)數(shù)少于原始變量的個(gè)數(shù),但是它們又包含原始變量的信息,所以蝗肪,這一分析過程也稱為降維袜爪。
因子分析的主要目的有以下三個(gè):
(1)探索結(jié)構(gòu):在變量之間存在高度相關(guān)性的時(shí)候我們希望用較少的因子來概括其信息;
(2)簡化數(shù)據(jù):把原始變量轉(zhuǎn)化為因子得分后薛闪,使用因子得分進(jìn)行其他分析辛馆,比如聚類分析、回歸分析等豁延;
(3)綜合評(píng)價(jià):通過每個(gè)因子得分計(jì)算出綜合得分昙篙,對分析對象進(jìn)行綜合評(píng)價(jià)。
因子分析就是將原始變量轉(zhuǎn)變?yōu)樾碌囊蜃佑沼剑@些因子之間的相關(guān)性較低苔可,而因子內(nèi)部的變量相關(guān)程度較高。
為了更好的了解因子分析袋狞,需要了解以下:
幾個(gè)概念
(1)因子載荷
因子載荷就是每個(gè)原始變量和每個(gè)因子之間的相關(guān)系數(shù)焚辅,它反映了變量對因子的重要性。通過因子載荷值的高低苟鸯,我們能知道變量在對應(yīng)因子中的重要性大小同蜻,這樣能夠幫助我們發(fā)現(xiàn)因子的實(shí)際含義,有利于因子的命名倔毙。當(dāng)有多個(gè)因子的時(shí)候埃仪,因子載荷將構(gòu)成一個(gè)矩陣,稱為因子載荷矩陣陕赃。
(2)變量共同度
變量共同度就是每個(gè)變量所包含的信息能夠被因子所解釋的程度卵蛉,其取值范圍介于0和1之間,取值越大么库,說明該變量能被因子解釋的程度越高傻丝。
(3)因子旋轉(zhuǎn)
因子分析的結(jié)果需要每個(gè)因子都要有實(shí)際意義,有時(shí)诉儒,原始變量和因子之間的相關(guān)系數(shù)可能無法明顯地表達(dá)出因子的含義葡缰,為了使這些相關(guān)系數(shù)更加顯著,可以對因子載荷矩陣進(jìn)行旋轉(zhuǎn)忱反,使原始變量和因子之間的關(guān)系更為突出泛释,從而對因子的解釋更加容易。
旋轉(zhuǎn)方法一般采用最大方差法温算,該方法能夠使每個(gè)變量盡可能在一個(gè)因子上有較高載荷怜校,在其余的因子上載荷較小,從而方便對因子進(jìn)行解釋注竿。
(4)因子得分
因子得分可以用來評(píng)價(jià)每個(gè)個(gè)案在每個(gè)因子上的分值茄茁,該分值包含了原始變量的信息魂贬,可以用于代替原始變量進(jìn)行其他統(tǒng)計(jì)分析,比如回歸分析裙顽,可以考慮將因子得分作為自變量付燥,與對應(yīng)的因變量進(jìn)行回歸。
原始變量的數(shù)值是可以直接觀測到的愈犹,而因子得分只能通過原始變量和因子之間的關(guān)系計(jì)算得到键科,并且因子得分是經(jīng)過標(biāo)準(zhǔn)化之后的數(shù)值,各個(gè)因子得分之間不受量綱的影響漩怎。
因子分析步驟
(1)判斷數(shù)據(jù)是否適合因子分析萝嘁;
???????? 因子分析的變量要求是連續(xù)變量,分類變量不適合直接進(jìn)行因子分析扬卷;建議個(gè)案個(gè)數(shù)是變量個(gè)數(shù)的5倍以上,這只是一個(gè)參考依據(jù)酸钦,并不是絕對的標(biāo)準(zhǔn)怪得;KMO檢驗(yàn)統(tǒng)計(jì)量在0.5以下,不適合因子分析卑硫,在0.7以上時(shí)徒恋,數(shù)據(jù)較適合因子分析,在0.8以上時(shí)欢伏,說明數(shù)據(jù)極其適合因子分析入挣。
(2)構(gòu)造因子變量;
(3)利用因子旋轉(zhuǎn)方法使得因子更具有實(shí)際意義硝拧;
(4)計(jì)算每個(gè)個(gè)案因子得分径筏;
確定提取因子個(gè)數(shù)的標(biāo)準(zhǔn)
(1)初始特征值大于1的因子個(gè)數(shù);
(2)累積方差貢獻(xiàn)率達(dá)到一定水平(60%)的因子個(gè)數(shù)障陶;
(3)碎石圖中處于較陡峭曲線上所對應(yīng)的因子個(gè)數(shù)滋恬;
(4)依據(jù)對研究事物的理解而指定因子個(gè)數(shù);