【R語(yǔ)言 第3篇】用R進(jìn)行主成分分析

主成分分析和探索性因子分析是兩種用來(lái)探索和簡(jiǎn)化多變量復(fù)雜關(guān)系的常用方法。
主成分分析(PCA)是一種將數(shù)據(jù)降維技巧科盛,它將大量相關(guān)變量轉(zhuǎn)化成一組很少的不相關(guān)變量兄世,這些無(wú)相關(guān)變量稱為主成分甜孤。
探索性因子分析(EFA)是一系列用來(lái)發(fā)現(xiàn)一組變量的潛在結(jié)構(gòu)的方法老速。

R基礎(chǔ)安裝包提供了PCA和EFA的函數(shù)粥喜,分別是princomp()和factanal()。本章重點(diǎn)介紹psych包中提供的函數(shù)橘券,該包提供了比基礎(chǔ)函數(shù)更豐富和有用的選項(xiàng)额湘。

  • principal() 含多種可選的方差旋轉(zhuǎn)方法的主成分分析卿吐;
  • fa() 可用主軸、最小殘差锋华、加權(quán)最小平方或最大似然法估計(jì)的因子分析嗡官;
  • fa.parallel() 含平行分析的碎石圖;
  • factor.polt() 繪制因子分析或主成分分析的結(jié)果供置;
  • fa.diagram() 繪制因子分析或主成分的載荷矩陣谨湘;
  • scree() 因子分析和主成分分析的碎石圖

最常見(jiàn)步驟
1、數(shù)據(jù)預(yù)處理芥丧,在計(jì)算前請(qǐng)確保數(shù)據(jù)沒(méi)有缺失值;
2坊罢、選擇因子模型续担,是選擇PCA還是EFA,如果選擇EFA活孩,需要選擇一種估計(jì)因子模型物遇,如最大似然法估計(jì);
3憾儒、判斷要選擇的主成分/因子數(shù)目询兴;
4、選擇主成分/因子起趾;
5诗舰、旋轉(zhuǎn)主成分/因子;
6训裆、解釋結(jié)果眶根;
7、計(jì)算主成分或因子得分边琉。

主成分分析

  • 例1主成分分析属百,USJudgeRatings數(shù)據(jù)集包含了律師對(duì)美國(guó)高等法院法官的評(píng)分。

加載psych包
library(ggplot2)
library(psych)
展示基于觀測(cè)特征值的碎石檢驗(yàn)变姨、根據(jù)100個(gè)隨機(jī)數(shù)據(jù)矩陣推導(dǎo)出來(lái)的特征值均值族扰、以及大于1的特征值準(zhǔn)則(Y=1的水平線)
fa.parallel(USJudgeRatings[, -1], fa = "pc", n.iter = 100, show.legend = FALSE, main = 'Scree plot with parallel analysis')
對(duì)數(shù)據(jù)USJudgeRatings進(jìn)行主成分分析
pc<-principal(USJudgeRatings[, -1],nfactors=1)
pc

  • 例2主成分分析,Harman23.cor數(shù)據(jù)集包含了305個(gè)女孩的8個(gè)身體指標(biāo)

加載psych包
library(ggplot2)
library(psych)
展示基于觀測(cè)特征值的碎石檢驗(yàn)定欧、根據(jù)100個(gè)隨機(jī)數(shù)據(jù)矩陣推導(dǎo)出來(lái)的特征值均值渔呵、以及大于1的特征值準(zhǔn)則(Y=1的水平線)
fa.parallel(Harman23.cor$cov, n.obs=305,fa = "pc", n.iter = 100, show.legend = FALSE, main = 'Scree plot with parallel analysis')
對(duì)數(shù)據(jù)Harman23.cor進(jìn)行主成分分析
pc2<-principal(Harman23.cor$cov,nfactors=2,rotate = 'none')
pc2

  • 例3主成分旋轉(zhuǎn),Harman23.cor數(shù)據(jù)集包含了305個(gè)女孩的8個(gè)身體指標(biāo)
    旋轉(zhuǎn)是一系列將成分載荷變得更容易解釋的數(shù)學(xué)方法忧额,它們盡可能地對(duì)成分去噪厘肮。

rc2<-principal(Harman23.cor$cov,nfactors = 2,rotate='varimax')
rc2
獲得主成分得分,USJudgeRatings數(shù)據(jù)集包含了律師對(duì)美國(guó)高等法院法官的評(píng)分睦番。
library(ggplot2)
library(psych)
pc3<-principal(USJudgeRatings[, -1],nfactors=1,scores=TRUE)
pc3
head(pc3$scores)
獲得律師與法官的接觸頻數(shù)與法官評(píng)分間的相關(guān)系數(shù),執(zhí)行結(jié)果看到兩者關(guān)聯(lián)非常小类茂。
cor(USJudgeRatings$CONT,pc3$scores)
獲取主成分得分的系數(shù)耍属,Harman23.cor數(shù)據(jù)集包含了305個(gè)女孩的8個(gè)身體指標(biāo)
當(dāng)主成分分析基于相關(guān)系數(shù)矩陣(如Harman23.cor$cov)時(shí),原始數(shù)據(jù)便不可用了巩检,也不可能獲取每個(gè)觀測(cè)的主成分得分厚骗,但是可以得到用來(lái)計(jì)算主成分得分的系數(shù)。
在身體測(cè)量數(shù)據(jù)中兢哭,有各個(gè)身體測(cè)量指標(biāo)間的相關(guān)系數(shù)领舰,但是沒(méi)有305個(gè)女孩的個(gè)體測(cè)量值。
library(ggplot2)
library(psych)
rc3<-principal(Harman23.cor$cov,nfactors = 2,rotate='varimax')
round(unclass(rc3$weights),2)
利用如下公式可以得到主成分得分
pc1=0.28height+0.30arm.span+0.30forearm+0.28lower.leg-0.06weight-0.08bitro.diamete-0.10chest.girth-0.04chest.width
pc2=-0.05height-0.08arm.span-0.09forearm-0.06lower.leg+0.33weight+0.32bitro.diamete+0.34chest.girth+0.27chest.width

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末迟螺,一起剝皮案震驚了整個(gè)濱河市冲秽,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌矩父,老刑警劉巖锉桑,帶你破解...
    沈念sama閱讀 206,602評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異窍株,居然都是意外死亡民轴,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,442評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)球订,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)后裸,“玉大人,你說(shuō)我怎么就攤上這事冒滩∥⑹唬” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,878評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵旦部,是天一觀的道長(zhǎng)祈搜。 經(jīng)常有香客問(wèn)我,道長(zhǎng)士八,這世上最難降的妖魔是什么容燕? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,306評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮婚度,結(jié)果婚禮上蘸秘,老公的妹妹穿的比我還像新娘。我一直安慰自己蝗茁,他們只是感情好醋虏,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,330評(píng)論 5 373
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著哮翘,像睡著了一般颈嚼。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上饭寺,一...
    開(kāi)封第一講書(shū)人閱讀 49,071評(píng)論 1 285
  • 那天阻课,我揣著相機(jī)與錄音叫挟,去河邊找鬼。 笑死限煞,一個(gè)胖子當(dāng)著我的面吹牛抹恳,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播署驻,決...
    沈念sama閱讀 38,382評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼奋献,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了旺上?” 一聲冷哼從身側(cè)響起瓶蚂,我...
    開(kāi)封第一講書(shū)人閱讀 37,006評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎抚官,沒(méi)想到半個(gè)月后扬跋,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,512評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡凌节,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,965評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了洒试。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片倍奢。...
    茶點(diǎn)故事閱讀 38,094評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖垒棋,靈堂內(nèi)的尸體忽然破棺而出卒煞,到底是詐尸還是另有隱情,我是刑警寧澤叼架,帶...
    沈念sama閱讀 33,732評(píng)論 4 323
  • 正文 年R本政府宣布畔裕,位于F島的核電站,受9級(jí)特大地震影響乖订,放射性物質(zhì)發(fā)生泄漏扮饶。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,283評(píng)論 3 307
  • 文/蒙蒙 一乍构、第九天 我趴在偏房一處隱蔽的房頂上張望甜无。 院中可真熱鬧,春花似錦哥遮、人聲如沸岂丘。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,286評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)奥帘。三九已至,卻和暖如春仪召,著一層夾襖步出監(jiān)牢的瞬間寨蹋,已是汗流浹背松蒜。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,512評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留钥庇,地道東北人牍鞠。 一個(gè)月前我還...
    沈念sama閱讀 45,536評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像评姨,于是被迫代替她去往敵國(guó)和親难述。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,828評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容