相關(guān)分析
是研究現(xiàn)象之間是否存在某種依存關(guān)系漂羊,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法禾锤。
相關(guān)分析研究現(xiàn)象之間是否相關(guān)顿乒、相關(guān)的方向和密切程度,一般不區(qū)別自變量或因變量割捅。
主要有雙變量相關(guān)分析奶躯、偏相關(guān)、距離相關(guān)亿驾。
雙變量相關(guān)分析是相關(guān)分析中最常使用的分析過程嘹黔,主要用于分析兩個變量之間的線性相關(guān)分析,而這種分析方式中又可以選:用Pearson積差相關(guān)莫瞬、Spearman等級相關(guān)儡蔓、Kendall的tau-b等級相關(guān)。
(注意:pearson極差相關(guān)要求是成對數(shù)據(jù)疼邀,每隊數(shù)據(jù)之間要求獨立喂江,樣本容量大于等于30,兩個變量的所屬總體要呈正態(tài)分布旁振,兩個變量都是由測量所得到的連續(xù)型數(shù)據(jù)获询,兩個變量的相關(guān)要求是線性相關(guān),并且要排除公變因數(shù)的影響)
(Kendall的tau-b等級相關(guān)是一種對兩列等級變量的的關(guān)系程度的測量拐袜,結(jié)果為交錯系數(shù))(Spearman等級相關(guān)只有兩個變量吉嚣,兩個變量都是順序變量,或者一個是順序變量蹬铺,另一個是連續(xù)變量)
因為spearman等級相關(guān)不受樣本數(shù)量多少以及變量分布形態(tài)瓦戚,所以當(dāng)數(shù)據(jù)不符合pearson積差相關(guān)的要求時,可以用spearman等級相關(guān)丛塌,但是由于spearman等級相關(guān)在處理的時候會把連續(xù)性數(shù)據(jù)轉(zhuǎn)化成等級數(shù)據(jù)较解,從而導(dǎo)致數(shù)據(jù)的遺漏缺失,這就會造成spearman不如pearson準(zhǔn)確赴邻。
(要先做一個散點圖看一下是否線性相關(guān)印衔,然后根據(jù)數(shù)據(jù)選不同的分析方式)
當(dāng)數(shù)據(jù)文件包括多個變量時,直接對兩個變量進(jìn)行相關(guān)分析往往不能真實反映二者之間的關(guān)系姥敛,此時就需要用到偏相關(guān)分析奸焙,從中剔除其他變量的線性影響。
距離相關(guān)分析是對觀測變量之間差異度或相似程度進(jìn)行的測量,其中距離需要弄清楚与帆,距離分析是對觀測量之間相似或不相似程度的一種測度了赌,是計算一對觀測量之間的廣義距離。這些相似性或距離測度可以用于其他分析過程玄糟,例如因子分析勿她、聚類分析或多維定標(biāo)分析,有助于分析復(fù)雜的數(shù)據(jù)集阵翎。(未深入了解)