上周SPSSAU做了一個(gè)小調(diào)查,結(jié)果讓我們十分意外挤土。得到最多的反饋是大家對(duì)于常見分析方法误算,不知道如何選擇迷殿,如何分析庆寺。
雖說越實(shí)用的方法诉字,往往也越簡(jiǎn)單。但剛開始接觸數(shù)據(jù)分析時(shí)陵霉,確實(shí)就是會(huì)因?yàn)橐恍┢嫫婀止值男g(shù)語(yǔ)看不懂踊挠,讓大家產(chǎn)生很難懂學(xué)不會(huì)的挫敗感冲杀。
為了幫大家快速度過新手期,?我們整理了一份常見分析方法的流程總結(jié)扁凛。
其中包括每種分析方法的分析流程闯传,以及每個(gè)環(huán)節(jié)中可能出現(xiàn)的問題及應(yīng)對(duì)方法甥绿。不會(huì)分析的同學(xué)可以按照?qǐng)D中的流程一步步操作则披,就能得到準(zhǔn)確可靠的結(jié)果。
本文將介紹的是相關(guān)分析的分析流程图谷,即SPSSAU通用方法中的“相關(guān)”阱洪。
為了便于理解冗荸,我們先簡(jiǎn)單介紹下相關(guān)分析,然后按照分析流程順序盔粹,對(duì)每一步可能會(huì)涉及的問題進(jìn)行簡(jiǎn)要說明舷嗡。
相關(guān)分析
我們使用相關(guān)分析,通常是研究?jī)蓚€(gè)變量的相關(guān)性情況捻脖。比如學(xué)習(xí)成績(jī)和聽課質(zhì)量的關(guān)系垮斯;員工敬業(yè)度與薪資的關(guān)系等等。
1.數(shù)據(jù)類型
相關(guān)分析的適用范圍很廣扰肌,理論上講曙旭,凡是考察兩個(gè)變量相關(guān)性晶府,都可以叫做相關(guān)分析。
但依據(jù)習(xí)慣剂习,我們通常說的相關(guān)分析较沪,多指的是兩個(gè)定量數(shù)據(jù)之間的簡(jiǎn)單相關(guān)分析尸曼,這就要求兩個(gè)變量都是定量數(shù)據(jù),即選項(xiàng)數(shù)字大小要可比較冤竹,且有實(shí)際意義茬射。
如果兩個(gè)數(shù)據(jù)均為定類數(shù)據(jù)在抛,則不可以直接用相關(guān)分析,而應(yīng)該使用卡方分析測(cè)量相關(guān)性(準(zhǔn)確說應(yīng)該是差異分析)档悠。
如果一個(gè)是定類數(shù)據(jù),一個(gè)是定量數(shù)據(jù)惰说,則應(yīng)該使用方差分析缘回。
這種誤用常見于分析背景信息題與核心研究題項(xiàng)的相關(guān)情況酥宴。
2.正態(tài)性
相關(guān)分析要求數(shù)據(jù)服從正態(tài)分布拙寡,因此分析前需要檢驗(yàn)數(shù)據(jù)的正態(tài)性。
正態(tài)性有多種檢驗(yàn)方法般堆,常見方法如:正態(tài)圖诚啃、正態(tài)性檢驗(yàn)、P-P圖/Q-Q圖等和橙。
正態(tài)性的判斷標(biāo)準(zhǔn)可以查看之前的文章:
由于相關(guān)分析對(duì)正態(tài)性要求比較寬松魔招,即使違反計(jì)算結(jié)果也比較穩(wěn)健筋搏,只要數(shù)據(jù)基本滿足正態(tài)即可奔脐。如果數(shù)據(jù)完全不正態(tài)吁讨,則可以用Spearman相關(guān)系數(shù)建丧。
3.查看線性趨勢(shì)
當(dāng)兩個(gè)定量數(shù)據(jù)在散點(diǎn)圖上的散點(diǎn)呈現(xiàn)直線趨勢(shì)時(shí),就可以認(rèn)為兩者存在直線相關(guān)趨勢(shì)橄维,這也是相關(guān)分析的一個(gè)基本前提。
例如上圖,當(dāng)X增大時(shí)竞川,可以比較明顯地看出Y會(huì)隨著增大委乌,說明X和Y之間有著正向相關(guān)關(guān)系。如果是負(fù)相關(guān)戈咳,散點(diǎn)圖會(huì)呈現(xiàn)隨著一個(gè)變量值的增加革砸,另一個(gè)變量值降低的趨勢(shì)算利。
非線性關(guān)系
如果數(shù)據(jù)呈現(xiàn)非線性的趨勢(shì),可以選擇對(duì)變量進(jìn)行數(shù)據(jù)轉(zhuǎn)換(如對(duì)數(shù)轉(zhuǎn)換)暂吉,或是使用Spearman相關(guān)系數(shù)進(jìn)行分析慕的。
4.?檢驗(yàn)異常值
相關(guān)分析對(duì)極端值較為敏感挤渔,異常值會(huì)影響分析結(jié)果。需要在分析前查看是否存在異常值嫉父,保證結(jié)果的可靠性眼刃,此步可以和上一步一起通過散點(diǎn)圖查看擂红。
存在異常值
如果存在極端值,需要在分析前進(jìn)行剔除树碱。使用方法:SPSSAU數(shù)據(jù)處理->異常值。
這是上一步中得到的散點(diǎn)圖,有一個(gè)明顯的離群值伦连,研究者需要根據(jù)情況選擇保留或刪除惑淳。建議按照SPSSAU異常值幫助手冊(cè)的說明,對(duì)異常值進(jìn)行處理移斩。
5.相關(guān)系數(shù)類型
當(dāng)完成以上步驟且滿足相關(guān)分析的分析條件后绢馍,即可進(jìn)行相關(guān)分析舰涌。點(diǎn)擊‘通用方法’-‘相關(guān)’。
這時(shí)又出現(xiàn)一個(gè)問題朱躺。SPSSAU提供了三種相關(guān)系數(shù)长搀,分別是Pearson鸡典、Spearman彻况,Kendall相關(guān)系數(shù),該選哪一種呢症汹?
多數(shù)情況下,SPSSAU建議使用pearson相關(guān)系數(shù)。如果數(shù)據(jù)不滿足正態(tài)性或不滿足線性關(guān)系瞒斩,可以考慮使用Spearman相關(guān)系數(shù)涮总。
Kendall相關(guān)系數(shù)用于判斷兩個(gè)變量的等級(jí)相關(guān)性瀑梗,是否具有一致性,比如評(píng)委打分谤职,數(shù)據(jù)排名等允蜈。
關(guān)于三種相關(guān)系數(shù)的比較具體可以查看相關(guān)分析幫助手冊(cè)蒿柳。
6.?SPSSAU操作
終于到了分析這一步了。相對(duì)于其他分析軟件妓蛮,SPSSAU的操作相對(duì)簡(jiǎn)單仔引,將變量從左側(cè)拖拽到分析項(xiàng)處褐奥,點(diǎn)擊‘開始相關(guān)分析’即可撬码。
?
分析項(xiàng)X可選
需要特別強(qiáng)調(diào)的一點(diǎn)是,相關(guān)分析通常不會(huì)特別區(qū)分哪個(gè)變量是X夫否,哪個(gè)變量是Y凰慈。因此分析時(shí)驼鹅,常常是直接把分析項(xiàng)都放入“分析項(xiàng)Y(定量)”里即可。
?
如果有明確的X仲智、Y可以分開放置姻氨,兩種放置方法只在表格的展示格式上有區(qū)別肴焊,結(jié)果是一樣的。
指標(biāo)解讀
分析步驟可參考SPSSAU輸出結(jié)果中的“分析建議”及“智能分析”蛀恩。
需要注意的是相關(guān)系數(shù)代表變量之間的相關(guān)程度,相關(guān)系數(shù)越大席揽,說明相關(guān)程度越緊密幌羞。
P值用于判斷相關(guān)系數(shù)是否有統(tǒng)計(jì)學(xué)意義,P<0.05即說明變量間有相關(guān)關(guān)系熊痴,P值并不代表相關(guān)關(guān)系的強(qiáng)弱聂宾。
平均成績(jī)、能力評(píng)分兩個(gè)分析項(xiàng)交叉處的數(shù)字代表相關(guān)系數(shù)系谐,而星號(hào)代表P值纪他。一個(gè)星號(hào)代表P<0.05,兩個(gè)星號(hào)代表P<0.01。如果沒有星號(hào)梯刚,則說明P值>0.05薪寓。
7.后續(xù)分析
相關(guān)分析的結(jié)果并不能代替回歸分析,而相關(guān)分析通常是作為回歸分析的基礎(chǔ),保證在有相關(guān)性的前提下植康,才可能有回歸影響關(guān)系销睁。
因此后續(xù)可以通過回歸分析,進(jìn)一步得到影響關(guān)系和具體的函數(shù)表達(dá)式睡毒。
總結(jié)
以上就是相關(guān)分析的分析流程梳理演顾。理論上都應(yīng)該按照上述步驟進(jìn)行分析钠至,但在實(shí)際過程中胎源,即使忽略其中的步驟,也能得到穩(wěn)定的結(jié)果宪卿。
因此即使不按照步驟分析万栅,也沒有問題烦粒,而對(duì)于沒有分析經(jīng)驗(yàn)的研究者,SPSSAU建議按提供的步驟進(jìn)行分析邮偎,才是最保險(xiǎn)的做法禾进。
更多內(nèi)容登錄SPSSAU官網(wǎng)查看廉涕。