基本概念
現(xiàn)實中,事物之間的聯(lián)系是錯綜復(fù)雜的,而事物之間的關(guān)系可以看作兩類:一類是函數(shù)關(guān)系涮总,一類是相關(guān)關(guān)系寻歧。函數(shù)關(guān)系指的是變量間一一對應(yīng)的確定關(guān)系掌栅,相關(guān)關(guān)系指的是兩個變量之間存在的不確定的數(shù)量關(guān)系。
相關(guān)分析主要研究相關(guān)關(guān)系码泛。
在進(jìn)行相關(guān)分析前猾封,最好先繪制散點圖,以初步判斷變量之間是否存在相關(guān)趨勢噪珊、該趨勢是否為直線趨勢晌缘。
相關(guān)分析中最常用的是二元變量的相關(guān)分析,即簡單相關(guān)分析痢站;
三個及三個以上變量之間的關(guān)系稱為復(fù)相關(guān)磷箕,研究一個因變量和兩個自變量之間的關(guān)系;
控制一個變量研究其他兩個變量之間的關(guān)系稱為偏相關(guān)阵难;
不是通過相關(guān)系數(shù)岳枷,而是通過相似性或距離描述變量之間的關(guān)系的方法稱為距離相關(guān)分析。
簡單相關(guān)分析
不同類型的變量數(shù)據(jù),應(yīng)采用不同的相關(guān)分析方法空繁。Pearson相關(guān)適用于數(shù)值變量殿衰;Spearman相關(guān)和Kendall's tau-b相關(guān)適用于順序變量;對于分類變量盛泡,一般采用列聯(lián)表的方式進(jìn)行χ2檢驗的方法研究其相關(guān)性闷祥。
1.Pearson相關(guān)系數(shù)
Pearson相關(guān)系數(shù)適用于測度兩數(shù)值的相關(guān)性。數(shù)值變量的特點是取值用數(shù)字表示傲诵,即可以進(jìn)行運(yùn)算而計算出差異的大小凯砍。則樣本相關(guān)系數(shù)計算公式為:
(r取值在-1與1之間,當(dāng)兩個變量的線性關(guān)系增強(qiáng)時拴竹,相關(guān)系數(shù)趨于1或-1)
當(dāng)|r|≥0.8時果覆,視作高度相關(guān);
0.5≤|r|<0.8時殖熟,視作中度相關(guān)局待;
0.3≤|r|<0.5時,視作低度相關(guān)菱属;
r|<0.3時钳榨,可視作不相關(guān)。
在實際問題中纽门,樣本的相關(guān)系數(shù)計算具有隨機(jī)性薛耻,因此需要對其進(jìn)行顯著性檢驗。
在X赏陵、Y均服從正態(tài)分布饼齿,及原假設(shè)(ρ=0)為真時,統(tǒng)計量
服從自由度為n-2的T分布蝙搔。
2.Spearman相關(guān)系數(shù)
Spearman相關(guān)系數(shù)又稱秩相關(guān)系數(shù)缕溉,適用于測度兩順序變量(等級、秩次)的相關(guān)性吃型。它對原始變量的分布不做要求证鸥,屬于非參數(shù)統(tǒng)計方法。通俗地講勤晚,“順序變量”就是變量的排序等級枉层,如1-非常不滿意,2-滿意赐写,3-非常滿意等鸟蜡。
由于Spearman相關(guān)系數(shù)可以套用Pearson相關(guān)系數(shù)的公式,在此不再重復(fù)計算式和統(tǒng)計量公式挺邀。值得一提的是揉忘,當(dāng)n>30時跳座,檢驗統(tǒng)計量也可以近似的用
來計算。
3.Kendall's tau-b相關(guān)系數(shù)
Kendall相關(guān)系數(shù)有3種形式癌淮,它也是測度兩順序變量的相關(guān)性躺坟。采用的仍是非參數(shù)的方法沦补,它利用變量值的秩數(shù)據(jù)乳蓄,計算同序?qū)?/strong>數(shù)目U和異序?qū)?/strong>數(shù)目V。
所謂同序?qū)οΠ颍傅氖亲兞看笮№樞蛳嗤膬蓚€樣本觀測值虚倒,即X的等級高低順序與Y的等級高低順序相同。否則稱異序?qū)Α?
Kendall相關(guān)系數(shù)公式為:對Kendall相關(guān)系數(shù)也需要進(jìn)行顯著性檢驗产舞。如果n≤30魂奥,可以直接利用等級相關(guān)統(tǒng)計量表,SPSS會自動給出相伴概率值P易猫。如果n>30耻煤,檢驗統(tǒng)計量也可以用近似服從正態(tài)分布的Z值計算:
3.SPSS應(yīng)用
步驟:分析->相關(guān)->雙變量,選入需要分析的變量准颓,如圖:
在“相關(guān)系數(shù)”框組中哈蝇,默認(rèn)的是Pearson相關(guān)系數(shù),也可以根據(jù)需要選擇Spearman相關(guān)系數(shù)和Kendall's tau-b相關(guān)系數(shù)攘已。
輸出結(jié)果:
由此可見炮赦,在0.01的顯著性下,交易量和響應(yīng)時間的相關(guān)性顯著样勃。一個*
表示0.05的顯著性吠勘;2個**
表示0.01的顯著性。
偏相關(guān)分析
在很多情況下峡眶,當(dāng)影響某個變量的因素過多時剧防,常假定其中某些因素不變,考察其他因素的影響辫樱。
偏相關(guān)分析假定變量之間的關(guān)系均為線性關(guān)系诵姜,沒有線性關(guān)系的變量不能進(jìn)行偏相關(guān)分析。因此在進(jìn)行偏相關(guān)分析之前搏熄,可以先通過計算Pearson相關(guān)系數(shù)來考察線性關(guān)系棚唆。
SPSS應(yīng)用
步驟:分析->相關(guān)->偏相關(guān),選入需要分析的變量和需要控制的變量心例,如圖:
輸出結(jié)果:
由表可知宵凌,在排除了成功率的干擾后,相關(guān)系數(shù)0.650<0.899止后,可見簡單相關(guān)分析有夸大的成分瞎惫。交易量和響應(yīng)時間的相關(guān)性屬于弱相關(guān)溜腐。
距離相關(guān)分析
簡單相關(guān)分析和偏相關(guān)分析都是研究兩個變量之間的線性關(guān)系,但由于實際問題的復(fù)雜性瓜喇,我們可以通過距離相關(guān)分析來考察變量之間是否具有相似性挺益,進(jìn)而研究相關(guān)關(guān)系。
距離相關(guān)分析一般不單獨使用乘寒,而是作為聚類分析和因子分析等統(tǒng)計方法的預(yù)分析過程望众。
SPSS應(yīng)用
步驟:分析->相關(guān)->距離,選入需要分析的所有變量伞辛,如圖:
此時我們先選用“基于變量間”計算距離烂翰,選取相似性,默認(rèn)為Pearson相關(guān)系數(shù)蚤氏。
一般而言甘耿,考察變量之間的相似性采用相似性測度;而對于樣本之間的相似性采用不相似性測度竿滨。
輸出結(jié)果:
輸出結(jié)果為3個變量間的相似度矩陣佳恬。可以看出交易量和響應(yīng)時間的相關(guān)系數(shù)同前計算結(jié)果一致于游。也可以進(jìn)行變量間的相關(guān)程度計算毁葱。