在日常分析中米苹,常會(huì)遇到不知道選擇什么分析方法的尷尬情況出現(xiàn)限寞,尤其是在面對(duì)幾種相似的方法忍啸,不知道它們之間有什么差別,一念之差就會(huì)選錯(cuò)方法履植。相信這樣的小盲點(diǎn)计雌,依然困擾著不少人。
因此玫霎,SPSSAU整理了一份相似方法的對(duì)比目錄凿滤,可以一目了然地比較出方法間的差異妈橄。由于方法較多,將分幾部分整理出來(lái)翁脆。
1. 基本描述統(tǒng)計(jì)
頻數(shù)分析是用于分析定類數(shù)據(jù)的選擇頻數(shù)和百分比分布眷蚓。
描述分析用于描述定量數(shù)據(jù)的集中趨勢(shì)、波動(dòng)程度和分布形狀反番。如要計(jì)算數(shù)據(jù)的平均值沙热、中位數(shù)等,可使用描述分析罢缸。
分類匯總用于交叉研究篙贸,展示兩個(gè)或更多變量的交叉信息,可將不同組別下的數(shù)據(jù)進(jìn)行匯總統(tǒng)計(jì)枫疆。
2.?信度分析
信度分析的方法主要有以下三種:Cronbach?α信度系數(shù)法爵川、折半信度法、重測(cè)信度法息楔。
Cronbach α信度系數(shù)法為最常使用的方法寝贡,即通過(guò)Cronbach α信度系數(shù)測(cè)量測(cè)驗(yàn)或量表的信度是否達(dá)標(biāo)。
折半信度是將所有量表題項(xiàng)分為兩半值依,計(jì)算兩部分各自的信度以及相關(guān)系數(shù)圃泡,進(jìn)而估計(jì)整個(gè)量表的信度的測(cè)量方法×郾酰可在信度分析中選擇使用折半系數(shù)或是Cronbach?α系數(shù)洞焙。
重測(cè)信度是指同一批樣本蟆淀,在不同時(shí)間點(diǎn)做了兩次相同的問(wèn)題拯啦,然后計(jì)算兩次回答的相關(guān)系數(shù),通過(guò)相關(guān)系數(shù)去研究信度水平熔任。
3.?效度分析
效度有很多種褒链,可分為四種類型:內(nèi)容效度、結(jié)構(gòu)效度疑苔、區(qū)分效度甫匹、聚合效度。具體區(qū)別如下表所示:
4.?差異關(guān)系研究
T檢驗(yàn)可分析X為定類數(shù)據(jù)惦费,Y為定量數(shù)據(jù)之間的關(guān)系情況兵迅,針對(duì)T檢驗(yàn),X只能為2個(gè)類別薪贫。
當(dāng)組別多于2組恍箭,且數(shù)據(jù)類型為X為定類數(shù)據(jù),Y為定量數(shù)據(jù)瞧省,可使用方差分析扯夭。
如果要分析定類數(shù)據(jù)和定類數(shù)據(jù)之間的關(guān)系情況鳍贾,可使用交叉卡方分析
如果研究定類數(shù)據(jù)與定量數(shù)據(jù)關(guān)系情況,且數(shù)據(jù)不正態(tài)或者方差不齊時(shí)交洗,可使用非參數(shù)檢驗(yàn)骑科。
5.?影響關(guān)系研究
相關(guān)分析用于研究定量數(shù)據(jù)之間的關(guān)系情況,可以分析包括是否有關(guān)系,以及關(guān)系緊密程度等构拳。分析時(shí)可以不區(qū)分XY咆爽,但分析數(shù)據(jù)均要為定量數(shù)據(jù)。
回歸分析通常指的是線性回歸分析置森,一般可在相關(guān)分析后進(jìn)行伍掀,用于研究影響關(guān)系情況,其中X通常為定量數(shù)據(jù)(也可以是定類數(shù)據(jù)暇藏,需要設(shè)置成啞變量)蜜笤,Y一定為定量數(shù)據(jù)。
回歸分析通常分析Y只有一個(gè)盐碱,如果想研究多個(gè)自變量與多個(gè)因變量的影響關(guān)系情況把兔,可選擇路徑分析。
6.?相關(guān)分析匯總
相關(guān)分析用于研究X和Y的關(guān)系情況瓮顽,X县好、Y都為定量數(shù)據(jù)。
?
(1)簡(jiǎn)單相關(guān)分析是分析對(duì)兩個(gè)變量之間的相關(guān)關(guān)系暖混。
(2)當(dāng)兩個(gè)變量都與第三個(gè)變量相關(guān)時(shí)缕贡,為了消除第三個(gè)變量的影響,值關(guān)注這兩個(gè)變量之間的關(guān)系情況拣播,此時(shí)可使用偏相關(guān)分析晾咪。
(3)如果是研究?jī)山M變量之間的整體相關(guān)性,可用典型相關(guān)分析贮配。
7.?線性回歸匯總
線性回歸用于研究X對(duì)于Y的影響谍倦,前提是因變量Y為定量數(shù)據(jù)。
?
如果X很多時(shí)泪勒,可使用逐步回歸自動(dòng)找出有影響的X昼蛀;
如果需要研究多個(gè)線性回歸的層疊變化情況,此時(shí)可使用分層回歸圆存;
如果數(shù)據(jù)中有異常值叼旋,可使用Robust回歸進(jìn)行研究。
8.?Logistic回歸匯總
Logistic回歸用于研究X對(duì)于Y的影響沦辙,因變量Y一定為定類數(shù)據(jù)夫植。
?
如果Y有兩個(gè)選項(xiàng)時(shí),可使用二元Logit回歸怕轿。
如果Y的選項(xiàng)大于2個(gè)時(shí)偷崩,可使用多分類Logit回歸辟拷。
如果Y為定類數(shù)據(jù),且選項(xiàng)有順序大小之分時(shí)阐斜,可使用有序Logit回歸衫冻。
9.?T檢驗(yàn)匯總
T檢驗(yàn)用于分析定類數(shù)據(jù)與定量數(shù)據(jù)之間的關(guān)系情況,且X的組別只限于為兩組谒出。
?
如果是對(duì)比單個(gè)變量與某個(gè)數(shù)字的差異隅俘,可用單樣本T檢驗(yàn)。
如果是對(duì)比兩個(gè)變量之間(X定類笤喳,Y定量)的差異關(guān)系为居,可用獨(dú)立樣本T檢驗(yàn)。
如果兩個(gè)變量是配對(duì)數(shù)據(jù)杀狡,比如對(duì)一個(gè)群體用同一個(gè)工具前后測(cè)量了兩次蒙畴,可用配對(duì)T檢驗(yàn)分析。
10.?方差分析匯總
方差分析用于分析定類數(shù)據(jù)與定量數(shù)據(jù)之間的關(guān)系情況呜象,可分析兩組或兩組以上的變量差異膳凝。
?
如果X為一個(gè),則使用單因素方差分析恭陡,即通用方法里的方差蹬音。
如果X的個(gè)數(shù)為2個(gè),可使用雙因素方差分析休玩。
當(dāng)X個(gè)數(shù)超過(guò)2個(gè)著淆,可使用多因素方差分析。通常雙因素方差分析與多因素方差分析多用于實(shí)驗(yàn)研究中拴疤。
事后檢驗(yàn)是基于方差分析基礎(chǔ)上進(jìn)行永部,如果X的組別超過(guò)兩組,可用事后檢驗(yàn)進(jìn)一步分析兩兩組別之間的差異遥赚。
如果研究中有干擾因素(控制變量)扬舒,可使用協(xié)方差分析阐肤。
11.?多選題研究
多選題分析可分為四種類型包括:多選題凫佛、單選-多選、多選-單選孕惜、多選-多選愧薛。
“多選題分析”是針對(duì)單個(gè)多選題的分析方法,可分析多選題各項(xiàng)的選擇比例情況
“單選-多選”是針對(duì)X為單選衫画,Y為多選的情況使用的方法毫炉,可分析單選和多選題的關(guān)系。
“多選-單選”是針對(duì)X為多選削罩,Y為單選的情況使用的方法瞄勾。
“多選-多選”是針對(duì)X為多選费奸,Y為多選的情況使用的方法。
12.?聚類分析
聚類分析以多個(gè)研究標(biāo)題作為基準(zhǔn)进陡,對(duì)樣本對(duì)象進(jìn)行分類愿阐。
?
如果是按樣本聚類,則使用SPSSAU的進(jìn)階方法模塊中的“聚類”功能趾疚,系統(tǒng)會(huì)自動(dòng)識(shí)別出應(yīng)該使用K-means聚類算法還是K-prototype聚類算法缨历。
如果是按變量(標(biāo)題)聚類,此時(shí)應(yīng)該使用分層聚類糙麦,并且結(jié)合聚類樹狀圖進(jìn)行綜合判定分析辛孵。
13.?權(quán)重研究
權(quán)重研究是用于分析各因素或指標(biāo)在綜合體系中的重要程度,最終構(gòu)建出權(quán)重體系赡磅。權(quán)重研究有多種方法包括:因子分析魄缚、熵值法、AHP層次分析法焚廊、TOPSIS鲜滩、模糊綜合評(píng)價(jià)、灰色關(guān)聯(lián)等节值。
因子分析:因子分析可將多個(gè)題項(xiàng)濃縮成幾個(gè)概括性指標(biāo)(因子)徙硅,然后對(duì)新生成的各概括性指標(biāo)計(jì)算權(quán)重。
熵值法:熵值法是利用熵值攜帶的信息計(jì)算每個(gè)指標(biāo)的權(quán)重搞疗,通成つⅲ可配合因子分析或主成分分析得到一級(jí)權(quán)重,利用熵值法計(jì)算二級(jí)權(quán)重匿乃。
AHP層次分析法:AHP層次分析法是一種主觀加客觀賦值的計(jì)算權(quán)重的方法桩皿。先通過(guò)專家打分構(gòu)造判斷矩陣,然后量化計(jì)算每個(gè)指標(biāo)的權(quán)重幢炸。
TOPSIS法:TOPSIS權(quán)重法是一種評(píng)價(jià)多個(gè)樣本綜合排名的方法泄隔,用于比較樣本的排名。
模糊綜合評(píng)價(jià):是通過(guò)各指標(biāo)的評(píng)價(jià)和權(quán)重對(duì)評(píng)價(jià)對(duì)象得出一個(gè)綜合性評(píng)價(jià)宛徊。
灰色關(guān)聯(lián):灰色關(guān)聯(lián)是一種評(píng)價(jià)多個(gè)指標(biāo)綜合排名的方法佛嬉,用于判斷指標(biāo)排名。
14.?非參數(shù)檢驗(yàn)
非參數(shù)檢驗(yàn)用于研究定類數(shù)據(jù)與定量數(shù)據(jù)之間的關(guān)系情況闸天。如果數(shù)據(jù)不滿足正態(tài)性或方差不齊暖呕,可用非參數(shù)檢驗(yàn)。
單樣本W(wǎng)ilcoxon檢驗(yàn)用于檢驗(yàn)數(shù)據(jù)是否與某數(shù)字有明顯的區(qū)別苞氮。
如果X的組別為兩組湾揽,則使用MannWhitney統(tǒng)計(jì)量,如果組別超過(guò)兩組,則應(yīng)該使用Kruskal-Wallis統(tǒng)計(jì)量結(jié)果库物,SPSSAU可自動(dòng)選擇霸旗。
如果是配對(duì)數(shù)據(jù),則使用配對(duì)樣本W(wǎng)ilcoxon檢驗(yàn)
如果要研究多個(gè)關(guān)聯(lián)樣本的差異情況戚揭,可以用多樣本Friedman檢驗(yàn)定硝。
如果是研究定類數(shù)據(jù)與定量(等級(jí))數(shù)據(jù)之間的差異性,還可以使用Ridit分析毫目。
15.?數(shù)據(jù)分布
判斷數(shù)據(jù)分布是選擇正確分析方法的重要前提蔬啡。
正態(tài)性:很多分析方法的使用前提都是要求數(shù)據(jù)服從正態(tài)性,比如線性回歸分析镀虐、相關(guān)分析箱蟆、方差分析等,可通過(guò)正態(tài)圖刮便、P-P/Q-Q圖空猜、正態(tài)性檢驗(yàn)查看數(shù)據(jù)正態(tài)性。
隨機(jī)性:游程檢驗(yàn)是一種非參數(shù)性統(tǒng)計(jì)假設(shè)的檢驗(yàn)方法恨旱,可用于分析數(shù)據(jù)是否為隨機(jī)辈毯。
方差齊性:方差齊檢驗(yàn)用于分析不同定類數(shù)據(jù)組別對(duì)定量數(shù)據(jù)時(shí)的波動(dòng)情況是否一致,即方差齊性搜贤。方差齊是方差分析的前提谆沃,如果不滿足則不能使用方差分析。
Poisson分布:如果要判斷數(shù)據(jù)是否滿足Poisson分布仪芒,可通過(guò)Poisson檢驗(yàn)判斷或者通過(guò)特征進(jìn)行判斷是否基本符合Poisson分布(三個(gè)特征即:平穩(wěn)性唁影、獨(dú)立性和普通性)
卡方擬合優(yōu)度檢驗(yàn):卡方擬合優(yōu)度檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法,其用于研究實(shí)際比例情況掂名,是否與預(yù)期比例表現(xiàn)一致据沈,但只針對(duì)于類別數(shù)據(jù)。
單樣本T檢驗(yàn):單樣本T檢驗(yàn)用于分析定量數(shù)據(jù)是否與某個(gè)數(shù)字有著顯著的差異性饺蔑。
?
16.?模型研究方法
當(dāng)需要研究多個(gè)變量之間的關(guān)系情況時(shí)锌介,通常可構(gòu)建統(tǒng)計(jì)模型用于分析及預(yù)測(cè)猾警。
如果研究一個(gè)X或多個(gè)X對(duì)Y的影響關(guān)系孔祸,其中Y為定量數(shù)據(jù),可使用線性回歸分析肿嘲,構(gòu)建回歸模型融击。
如果研究一個(gè)X或多個(gè)X對(duì)Y的影響關(guān)系,其中Y為定類數(shù)據(jù)雳窟,可使用Logistic分析,構(gòu)建Logistic回歸模型。
如果要分析1組X與一組Y之間的關(guān)系情況封救,可使用典型相關(guān)分析拇涤。
如果要分析多個(gè)X與多個(gè)Y之間的影響關(guān)系情況,且樣本量較杏帷(通常小于200)鹅士,可使用PLS回歸分析。
如需分析多個(gè)X對(duì)多個(gè)Y的影響關(guān)系惩坑,以及具體哪些X對(duì)哪些Y有影響如何影響掉盅,可使用路徑分析。
還有一種方法稱為結(jié)構(gòu)方程模型以舒,包含測(cè)量模型和結(jié)構(gòu)模型趾痘。如果需要測(cè)量模型和結(jié)構(gòu)模型,可使用結(jié)構(gòu)方程模型蔓钟。
17.?信息濃縮方法
當(dāng)研究中包括有很多題目或很多變量時(shí)永票,可通過(guò)信息濃縮的方法,把數(shù)據(jù)濃縮成一個(gè)或多個(gè)變量滥沫,以便用于后續(xù)的分析侣集。
主成分分析和因子分析都是信息濃縮的方法,即將多個(gè)分析項(xiàng)信息濃縮成幾個(gè)概括性指標(biāo)兰绣。如果希望進(jìn)行將指標(biāo)命名世分,SPSSAU建議使用因子分析。原因在于因子分析在主成分基礎(chǔ)上缀辩,多出一項(xiàng)旋轉(zhuǎn)功能罚攀,該旋轉(zhuǎn)目的即在于命名。
平均值和求和也是信息濃縮的常用方法雌澄,比如要將多個(gè)題項(xiàng)合并成一個(gè)變量斋泄,可通過(guò)求平均值概括成一個(gè)題項(xiàng)。當(dāng)數(shù)據(jù)不滿足正態(tài)镐牺,存在極端值時(shí)炫掐,可用中位數(shù)代替平均值。
18.?一致性研究方法
一致性檢驗(yàn)的目的在于比較不同方法得到的結(jié)果是否具有一致性睬涧。檢驗(yàn)一致性的方法有很多比如:Kappa檢驗(yàn)募胃、ICC組內(nèi)相關(guān)系數(shù)、Kendall W協(xié)調(diào)系數(shù)等畦浓。
Kappa系數(shù)檢驗(yàn)痹束,適用于兩次數(shù)據(jù)(方法)之間比較一致性,比如兩位醫(yī)生的診斷是否一致讶请,兩位裁判的評(píng)分標(biāo)準(zhǔn)是否一致等祷嘶。
ICC組內(nèi)相關(guān)系數(shù)檢驗(yàn),用于分析多次數(shù)據(jù)的一致性情況,功能上與Kappa系數(shù)基本一致论巍。ICC分析定量或定類數(shù)據(jù)均可烛谊;但是Kappa一致性系數(shù)通常要求數(shù)據(jù)是定類數(shù)據(jù)。
Kendall W協(xié)調(diào)系數(shù)嘉汰,是分析多個(gè)數(shù)據(jù)之間關(guān)聯(lián)性的方法丹禀,適用于定量數(shù)據(jù),尤其是定序等級(jí)數(shù)據(jù)鞋怀。
19.?配對(duì)數(shù)據(jù)研究方法
配對(duì)研究是一種醫(yī)學(xué)上常見的研究設(shè)計(jì)双泪,常見于單組樣本前后對(duì)比研究,或者將樣本分為實(shí)驗(yàn)組和對(duì)比組兩組密似,針對(duì)干預(yù)措施進(jìn)行研究焙矛。
如果配對(duì)樣本數(shù)據(jù)為定量數(shù)據(jù)時(shí),可使用配對(duì)樣本T檢驗(yàn)辛友。
如果配對(duì)樣本數(shù)據(jù)為定量數(shù)據(jù)薄扁,但配對(duì)樣本的差值不符合正態(tài)分布,則考慮使用配對(duì)Wilcoxon檢驗(yàn)
如果數(shù)據(jù)為定類數(shù)據(jù)废累,則使用配對(duì)卡方檢驗(yàn)邓梅。
20.?多元統(tǒng)計(jì)研究
判別分析:用于在分類確定前提下,根據(jù)數(shù)據(jù)的特征來(lái)判斷新的未知屬于哪個(gè)類別邑滨。
對(duì)應(yīng)分析:用于分析定類數(shù)據(jù)的分類情況滤馍,并結(jié)合圖形展示秉氧。
曲線分析:如果想要研究X對(duì)Y的影響關(guān)系寿谴,且X和Y不滿足線性關(guān)系(可通過(guò)散點(diǎn)圖觀察)庙楚,而呈現(xiàn)出曲線關(guān)系,建議根據(jù)曲線擬合圖結(jié)果哎壳,選擇擬合程度較好的曲線進(jìn)行曲線回歸分析毅待。
更多干貨內(nèi)容可登錄SPSSAU官網(wǎng)查看