全流程總結(jié)相關(guān)分析


上周SPSSAU做了一個(gè)小調(diào)查,結(jié)果讓我們十分意外挤土。得到最多的反饋是大家對(duì)于常見分析方法误算,不知道如何選擇迷殿,如何分析庆寺。

雖說越實(shí)用的方法诉字,往往也越簡(jiǎn)單。但剛開始接觸數(shù)據(jù)分析時(shí)陵霉,確實(shí)就是會(huì)因?yàn)橐恍┢嫫婀止值男g(shù)語(yǔ)看不懂踊挠,讓大家產(chǎn)生很難懂學(xué)不會(huì)的挫敗感冲杀。



為了幫大家快速度過新手期,?我們整理了一份常見分析方法的流程總結(jié)扁凛。

其中包括每種分析方法的分析流程闯传,以及每個(gè)環(huán)節(jié)中可能出現(xiàn)的問題及應(yīng)對(duì)方法甥绿。不會(huì)分析的同學(xué)可以按照?qǐng)D中的流程一步步操作则披,就能得到準(zhǔn)確可靠的結(jié)果。

本文將介紹的是相關(guān)分析的分析流程图谷,即SPSSAU通用方法中的“相關(guān)”阱洪。

相關(guān)分析流程總結(jié)


為了便于理解冗荸,我們先簡(jiǎn)單介紹下相關(guān)分析,然后按照分析流程順序盔粹,對(duì)每一步可能會(huì)涉及的問題進(jìn)行簡(jiǎn)要說明舷嗡。


相關(guān)分析

我們使用相關(guān)分析,通常是研究?jī)蓚€(gè)變量的相關(guān)性情況捻脖。比如學(xué)習(xí)成績(jī)和聽課質(zhì)量的關(guān)系垮斯;員工敬業(yè)度與薪資的關(guān)系等等。


1.數(shù)據(jù)類型

相關(guān)分析的適用范圍很廣扰肌,理論上講曙旭,凡是考察兩個(gè)變量相關(guān)性晶府,都可以叫做相關(guān)分析。

但依據(jù)習(xí)慣剂习,我們通常說的相關(guān)分析较沪,多指的是兩個(gè)定量數(shù)據(jù)之間的簡(jiǎn)單相關(guān)分析尸曼,這就要求兩個(gè)變量都是定量數(shù)據(jù),即選項(xiàng)數(shù)字大小要可比較冤竹,且有實(shí)際意義茬射。


如果兩個(gè)數(shù)據(jù)均為定類數(shù)據(jù)在抛,則不可以直接用相關(guān)分析,而應(yīng)該使用卡方分析測(cè)量相關(guān)性(準(zhǔn)確說應(yīng)該是差異分析)档悠。

如果一個(gè)是定類數(shù)據(jù),一個(gè)是定量數(shù)據(jù)惰说,則應(yīng)該使用方差分析缘回。


這種誤用常見于分析背景信息題與核心研究題項(xiàng)的相關(guān)情況酥宴。


2.正態(tài)性

相關(guān)分析要求數(shù)據(jù)服從正態(tài)分布拙寡,因此分析前需要檢驗(yàn)數(shù)據(jù)的正態(tài)性。

正態(tài)性有多種檢驗(yàn)方法般堆,常見方法如:正態(tài)圖诚啃、正態(tài)性檢驗(yàn)、P-P圖/Q-Q圖等和橙。

正態(tài)性的判斷標(biāo)準(zhǔn)可以查看之前的文章:


由于相關(guān)分析對(duì)正態(tài)性要求比較寬松魔招,即使違反計(jì)算結(jié)果也比較穩(wěn)健筋搏,只要數(shù)據(jù)基本滿足正態(tài)即可奔脐。如果數(shù)據(jù)完全不正態(tài)吁讨,則可以用Spearman相關(guān)系數(shù)建丧。



3.查看線性趨勢(shì)

當(dāng)兩個(gè)定量數(shù)據(jù)在散點(diǎn)圖上的散點(diǎn)呈現(xiàn)直線趨勢(shì)時(shí),就可以認(rèn)為兩者存在直線相關(guān)趨勢(shì)橄维,這也是相關(guān)分析的一個(gè)基本前提。


SPSSAU-散點(diǎn)圖


散點(diǎn)圖


例如上圖,當(dāng)X增大時(shí)竞川,可以比較明顯地看出Y會(huì)隨著增大委乌,說明X和Y之間有著正向相關(guān)關(guān)系。如果是負(fù)相關(guān)戈咳,散點(diǎn)圖會(huì)呈現(xiàn)隨著一個(gè)變量值的增加革砸,另一個(gè)變量值降低的趨勢(shì)算利。


非線性關(guān)系

如果數(shù)據(jù)呈現(xiàn)非線性的趨勢(shì),可以選擇對(duì)變量進(jìn)行數(shù)據(jù)轉(zhuǎn)換(如對(duì)數(shù)轉(zhuǎn)換)暂吉,或是使用Spearman相關(guān)系數(shù)進(jìn)行分析慕的。


4.?檢驗(yàn)異常值

相關(guān)分析對(duì)極端值較為敏感挤渔,異常值會(huì)影響分析結(jié)果。需要在分析前查看是否存在異常值嫉父,保證結(jié)果的可靠性眼刃,此步可以和上一步一起通過散點(diǎn)圖查看擂红。


存在異常值

如果存在極端值,需要在分析前進(jìn)行剔除树碱。使用方法:SPSSAU數(shù)據(jù)處理->異常值。


這是上一步中得到的散點(diǎn)圖,有一個(gè)明顯的離群值伦连,研究者需要根據(jù)情況選擇保留或刪除惑淳。建議按照SPSSAU異常值幫助手冊(cè)的說明,對(duì)異常值進(jìn)行處理移斩。


5.相關(guān)系數(shù)類型

當(dāng)完成以上步驟且滿足相關(guān)分析的分析條件后绢馍,即可進(jìn)行相關(guān)分析舰涌。點(diǎn)擊‘通用方法’-‘相關(guān)’。



這時(shí)又出現(xiàn)一個(gè)問題朱躺。SPSSAU提供了三種相關(guān)系數(shù)长搀,分別是Pearson鸡典、Spearman彻况,Kendall相關(guān)系數(shù),該選哪一種呢症汹?


多數(shù)情況下,SPSSAU建議使用pearson相關(guān)系數(shù)。如果數(shù)據(jù)不滿足正態(tài)性或不滿足線性關(guān)系瞒斩,可以考慮使用Spearman相關(guān)系數(shù)涮总。

Kendall相關(guān)系數(shù)用于判斷兩個(gè)變量的等級(jí)相關(guān)性瀑梗,是否具有一致性,比如評(píng)委打分谤职,數(shù)據(jù)排名等允蜈。

關(guān)于三種相關(guān)系數(shù)的比較具體可以查看相關(guān)分析幫助手冊(cè)蒿柳。


6.?SPSSAU操作

終于到了分析這一步了。相對(duì)于其他分析軟件妓蛮,SPSSAU的操作相對(duì)簡(jiǎn)單仔引,將變量從左側(cè)拖拽到分析項(xiàng)處褐奥,點(diǎn)擊‘開始相關(guān)分析’即可撬码。


?

分析項(xiàng)X可選

需要特別強(qiáng)調(diào)的一點(diǎn)是,相關(guān)分析通常不會(huì)特別區(qū)分哪個(gè)變量是X夫否,哪個(gè)變量是Y凰慈。因此分析時(shí)驼鹅,常常是直接把分析項(xiàng)都放入“分析項(xiàng)Y(定量)”里即可。

?


如果有明確的X仲智、Y可以分開放置姻氨,兩種放置方法只在表格的展示格式上有區(qū)別肴焊,結(jié)果是一樣的。


指標(biāo)解讀


分析步驟可參考SPSSAU輸出結(jié)果中的“分析建議”及“智能分析”蛀恩。



需要注意的是相關(guān)系數(shù)代表變量之間的相關(guān)程度,相關(guān)系數(shù)越大席揽,說明相關(guān)程度越緊密幌羞。

P值用于判斷相關(guān)系數(shù)是否有統(tǒng)計(jì)學(xué)意義,P<0.05即說明變量間有相關(guān)關(guān)系熊痴,P值并不代表相關(guān)關(guān)系的強(qiáng)弱聂宾。

平均成績(jī)、能力評(píng)分兩個(gè)分析項(xiàng)交叉處的數(shù)字代表相關(guān)系數(shù)系谐,而星號(hào)代表P值纪他。一個(gè)星號(hào)代表P<0.05,兩個(gè)星號(hào)代表P<0.01。如果沒有星號(hào)梯刚,則說明P值>0.05薪寓。


7.后續(xù)分析

相關(guān)分析的結(jié)果并不能代替回歸分析,而相關(guān)分析通常是作為回歸分析的基礎(chǔ),保證在有相關(guān)性的前提下植康,才可能有回歸影響關(guān)系销睁。

因此后續(xù)可以通過回歸分析,進(jìn)一步得到影響關(guān)系和具體的函數(shù)表達(dá)式睡毒。



總結(jié)

以上就是相關(guān)分析的分析流程梳理演顾。理論上都應(yīng)該按照上述步驟進(jìn)行分析钠至,但在實(shí)際過程中胎源,即使忽略其中的步驟,也能得到穩(wěn)定的結(jié)果宪卿。

因此即使不按照步驟分析万栅,也沒有問題烦粒,而對(duì)于沒有分析經(jīng)驗(yàn)的研究者,SPSSAU建議按提供的步驟進(jìn)行分析邮偎,才是最保險(xiǎn)的做法禾进。

更多內(nèi)容登錄SPSSAU官網(wǎng)查看廉涕。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市卸夕,隨后出現(xiàn)的幾起案子婆瓜,更是在濱河造成了極大的恐慌廉白,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異磅轻,居然都是意外死亡聋溜,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缨称,“玉大人祝迂,你說我怎么就攤上這事型雳。” “怎么了沿量?”我有些...
    開封第一講書人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵冤荆,是天一觀的道長(zhǎng)钓简。 經(jīng)常有香客問我,道長(zhǎng)撤蚊,這世上最難降的妖魔是什么侦啸? 我笑而不...
    開封第一講書人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任匹中,我火速辦了婚禮豪诲,結(jié)果婚禮上堤尾,老公的妹妹穿的比我還像新娘。我一直安慰自己交播,他們只是感情好重虑,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著秦士,像睡著了一般缺厉。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上隧土,一...
    開封第一講書人閱讀 49,111評(píng)論 1 285
  • 那天提针,我揣著相機(jī)與錄音,去河邊找鬼曹傀。 笑死辐脖,一個(gè)胖子當(dāng)著我的面吹牛皆愉,可吹牛的內(nèi)容都是我干的嗜价。 我是一名探鬼主播,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼幕庐,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼久锥!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起异剥,我...
    開封第一講書人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤奴拦,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后届吁,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體错妖,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡绿鸣,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了暂氯。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片潮模。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖痴施,靈堂內(nèi)的尸體忽然破棺而出擎厢,到底是詐尸還是另有隱情,我是刑警寧澤辣吃,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布动遭,位于F島的核電站,受9級(jí)特大地震影響神得,放射性物質(zhì)發(fā)生泄漏厘惦。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一哩簿、第九天 我趴在偏房一處隱蔽的房頂上張望宵蕉。 院中可真熱鬧,春花似錦节榜、人聲如沸羡玛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)稼稿。三九已至,卻和暖如春讳窟,著一層夾襖步出監(jiān)牢的瞬間渺杉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來泰國(guó)打工挪钓, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留是越,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓碌上,卻偏偏與公主長(zhǎng)得像倚评,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子馏予,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 《R語(yǔ)言實(shí)戰(zhàn)》筆記系列 本章學(xué)習(xí)大綱 1.描述性統(tǒng)計(jì)分析 2.頻數(shù)表和列聯(lián)表 3.相關(guān)系數(shù)和協(xié)方差 4.t檢驗(yàn) 5...
    一日如十年閱讀 1,256評(píng)論 0 1
  • 基本概念 現(xiàn)實(shí)中天梧,事物之間的聯(lián)系是錯(cuò)綜復(fù)雜的,而事物之間的關(guān)系可以看作兩類:一類是函數(shù)關(guān)系霞丧,一類是相關(guān)關(guān)系呢岗。函數(shù)關(guān)...
    辛辛辛烷閱讀 5,754評(píng)論 0 15
  • 在很多研究中,研究者都把數(shù)據(jù)的相關(guān)性放在一個(gè)非常重要的位置上。甚至專門寫上一整篇的文章闡述其研究變量之間的相關(guān)關(guān)系...
    spssau閱讀 844評(píng)論 0 0
  • 從Rotterdam火車站上車后豫,一閉眼再一睜眼的功夫就到Amsterdam中央火車站了悉尾。確定從這里步行四十分鐘即可...
    開kai116閱讀 690評(píng)論 1 6
  • 最近進(jìn)簡(jiǎn)書沒有剛開始那會(huì)兒那么頻繁了构眯,主要是因?yàn)橛心敲匆粊G丟的煩躁ヽ(‘⌒′メ)ノ 誠(chéng)然,這是一個(gè)開放的平臺(tái) 所以...
    Minta翁閱讀 201評(píng)論 0 0