對(duì)應(yīng)分析(Correspondence analysis)是因子分析的進(jìn)一步推廣,它是利用降維的思想把R型(對(duì)變量或指標(biāo))因子分析和Q型(對(duì)樣本)因子分析統(tǒng)一起來(lái),利用過(guò)渡矩陣送火,通過(guò)R型因子分析直接得到Q型因子分析的結(jié)果,同時(shí)把變量(指標(biāo))和樣本反映到同一坐標(biāo)系上先匪,以此來(lái)說(shuō)明變量與樣本之間的對(duì)應(yīng)關(guān)系种吸。
多元統(tǒng)計(jì)分析R語(yǔ)言建模|對(duì)應(yīng)分析
1. 簡(jiǎn)單對(duì)應(yīng)分析
簡(jiǎn)單對(duì)應(yīng)分析是對(duì)兩個(gè)分類(lèi)變量進(jìn)行對(duì)應(yīng)分析,建立變量中類(lèi)別之間的對(duì)應(yīng)關(guān)系呀非。
# 加載包
library(ca)
library(dplyr)
# 加載數(shù)據(jù)
data(HairEyeColor)
# 使用卡方檢驗(yàn)判斷行坚俗、列變量是否獨(dú)立
data1 <- HairEyeColor[,,1]
data2 <- HairEyeColor[,,2]
chisq.test(data1)
chisq.test(data2)
## p<0.05,數(shù)據(jù)的行、列變量是不獨(dú)立的
# 對(duì)應(yīng)分析
smca1 <- ca(data1)
summary(smca1)
smca2 <- ca(data2)
summary(smca2)
# 分析結(jié)果可視化
plot(smca1,main = "Male HairEyeColor")
plot(smca2,main = "Female HairEyeColor")
## 在男性的對(duì)應(yīng)分析圖中猖败,黑發(fā)和棕色眼睛離得很近形耗,金發(fā)和藍(lán)色眼睛離得很近,
## 紅發(fā)和綠色眼睛離得很近辙浑,說(shuō)明男性存在黑發(fā)棕色眼睛激涤、金發(fā)藍(lán)色眼睛、
## 紅發(fā)綠色眼睛這樣的事實(shí)情況判呕;而女性也存在這樣的情況倦踢。
男性對(duì)應(yīng)分析結(jié)果.png
女性對(duì)應(yīng)分析結(jié)果
2. 多重對(duì)應(yīng)分析
# 判斷3個(gè)分類(lèi)變量是否獨(dú)立
library(MASS)
loglm(~Sex+Hair+Eye,data=HairEyeColor)
## p>0.05,說(shuō)明3個(gè)變量之間不是成對(duì)獨(dú)立的
# 多重對(duì)應(yīng)分析
mca <- mjca(HairEyeColor)
summary(mca)
# 分析結(jié)果可視化
par(family = "STKaiti")
plot(mca,mass = c(TRUE,TRUE),col = c("black","red","green","blue"),
main="三維列聯(lián)表對(duì)應(yīng)分析")
## Sex=Female侠草、Sex=Male和Hair=Brown的距離較近辱挥,說(shuō)明無(wú)論男性還是女性都是棕色頭發(fā)居多;
## Sex=Female和三種顏色的距離都差不多边涕,說(shuō)明女性的眼睛顏色較隨機(jī)晤碘;
## Sex=Male和Eye=Hazel和距離較近,說(shuō)明男性眼睛偏向于淡褐色功蜓。
多重對(duì)應(yīng)分析結(jié)果
典型相關(guān)分析(Canonical correlation analysis)是研究?jī)山M變量之間相關(guān)關(guān)系的多元統(tǒng)計(jì)分析方法园爷。它主要利用主成分降維的思想,分別對(duì)兩組變量提供主成分式撼,從而將研究?jī)山M變量的相關(guān)性問(wèn)題轉(zhuǎn)化成研究?jī)蓚€(gè)變量的相關(guān)性問(wèn)題童社。
# 加載包
library(candisc)
# 加載數(shù)據(jù)
data(Wine)
# 數(shù)據(jù)處理
wine <- as.data.frame(scale(Wine[,2:14]))
wine_x <- wine[,1:6]
wine_y <- wine[,7:13]
# 典型相關(guān)分析
winecca <- candisc::cancor(wine_x,wine_y)
summary(winecca)
# 典型相關(guān)分析可視化
par(mfrow = c(3,2))
plot(winecca,which = 1)
plot(winecca,which = 2)
plot(winecca,which = 3)
plot(winecca,which = 4)
plot(winecca,which = 5)
plot(winecca,which = 6)
## 六對(duì)典型相關(guān)變量均為正相關(guān),其中第一對(duì)典型相關(guān)變量的相關(guān)系數(shù)為0.9著隆,強(qiáng)正相關(guān)扰楼。
典型相關(guān)分析