俗話說得好檀轨,方差有三寶:獨立脏款、正態(tài)、齊性好裤园。什么意思呢?就是說使用方差分析需要三個前提條件:1剂府、各樣本須是相互獨立的隨機樣本拧揽;2、各樣本來自正態(tài)分布總體腺占;3淤袜、各總體方差相等,即方差齊衰伯。
縱然方差分析的用途廣泛铡羡,可以不受比較組數的限制,進行多組比較意鲸。然而在實際的數據分析中烦周,我們辛苦收集的數據往往很難符合其使用的條件尽爆。但我們又需要從樣本數據中,獲得盡可能多的信息读慎,此時使用非參數檢驗就再適合不過了漱贱。
非參數檢驗類別
按照樣本數量分類,可以將非參數檢驗方法分為幾個方面:
單樣本非參數檢驗方法
卡方檢驗:用于分析定類數據與定類數據之間的關系情況夭委,例如不同減肥治療方式對于減肥的幫助情況(膽固醇水平)幅狮。卡方檢驗用于研究X和Y之間的關系,且X,Y均為定類數據株灸。并且卡方檢驗需要使用卡方值和對應P值去判斷X與Y之間是否有差異崇摄。通常情況下,共有三種卡方值慌烧,分別是Pearson卡方逐抑,yates校正卡方,fisher卡方杏死;優(yōu)先使用Pearson卡方泵肄,其次為yates校正卡方,最后為fisher卡方淑翼。
二項分布檢驗:是指在只會產生兩種可能結果如陰性腐巢、陽性之一的n次獨立重復試驗(常常稱為n重Bernoulli試驗)中,每次試驗的“陽性”概率保持不變時玄括,出現“陽性”的次數X=0,1,2......n的一種概率分布冯丙。在醫(yī)學研究中較為常用。
單樣本K-S檢驗:單樣本K-S檢驗能夠利用樣本數據推斷樣本來自的總體是否服從某一理論分布(正態(tài)分布遭京,均勻分布胃惜,泊松分布,指數分布)哪雕。適用于探索連續(xù)型隨機變量分布船殉。
單樣本Wilcoxon檢驗:(也稱單樣本wilcoxon符號秩和檢驗,符號秩和檢驗斯嚎,也或者秩和檢驗等)利虫;其被用于檢驗數據是否與某數字有明顯的差異性。首先需要判斷數據是否呈現出正態(tài)性分析特質堡僻,如果數據呈現出正態(tài)性特質糠惫,此時應該使用單樣本T檢驗進行檢驗;如果數據沒有呈現出正態(tài)性特質钉疫,此時應該使用單樣本Wilcoxon檢驗硼讽。
游程檢驗:游程檢驗用于檢驗數據是否具有隨機性,其原始假設是數據序列不具有隨機性牲阁;如果檢驗結果顯示P值小于0.05固阁,則說明數據不具有隨機性壤躲,反之P值大于等于0.05則說明數據具有隨機性。如果數據有上升或下降的趨勢您炉,或有呈周期性變化的規(guī)律等特征時柒爵,均可能表示數據與順序是有關的,或者說序列不是隨機出現的赚爵。通俗來講棉胀,游程檢驗是用于分析數據是否為隨機彬呻。
兩獨立樣本非參數檢驗方法
MannWhitney U 檢驗:是用得最廣泛的兩獨立樣本秩和檢驗方法墅拭。用于研究定類數據與定量數據之間的關系情況强胰。例如研究人員想知道不同性別學生的購買意愿是否有顯著差異逊桦,如果購買意愿沒有呈現出正態(tài)性特質蜡娶,此時建議可使用MannWhitney U 檢驗落蝙。其原假設是:兩獨立樣本來自的兩總體的分布無顯著差異母廷。
W-W游程檢驗:用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯著差異斑举。通過分析游程的大小和數量實現游程檢驗赐纱,從而判斷兩組樣本在混合序列中的排列是否為隨機的脊奋。若兩組樣本在混合序列中的排列是隨機的,則兩組樣本之間沒有顯著性差異疙描。
極端反應檢驗:從另一角度檢驗兩獨立樣本所來自的量總體分布是否存在顯著性差異诚隙。其基本思想是:將一組樣本作為控制樣本,另一組樣本作為實驗樣本起胰。以控制樣本作為對照久又,檢驗試驗樣本相對于控制樣本是否出現了極端反應。如實驗樣本沒有出現極端反應效五,則認為兩總體分布無顯著差異地消,相反則認為存在顯著差異。
兩配對樣本的非參數檢驗方法
McNemar檢驗:用于兩配對樣本的分析畏妖,其將研究對象自身作為對照者檢驗其“前后”變化是否有顯著差異脉执,例如比較同一批觀測對象用藥前后或實驗前后的結果有無差異。該檢驗只適用于二分變量戒劫,即只有兩種可能“是”或“否”半夷,“陽性”或“陰性”,“有反應”或“無反應”等谱仪,對于非二分變量,應在分析前進行數據變換否彩。
符號檢驗:也是用來檢驗配對樣本所來自的總體的分布是否存在顯著性差異的非參數方法疯攒。符號檢驗法是通過兩個相關樣本的每對數據之差的符號進行檢驗,從而比較兩個樣本的顯著性列荔。由于這種方法只考慮符號敬尺,不考察差數的大小枚尼,因而失去樣本所提供的一部分信息,準確度不高砂吞。因此除了小樣本署恍,一般不使用符號檢驗。
配對樣本Wilcoxon檢驗:配對樣本Wilcoxon檢驗用于檢驗配對數據是否具有顯著性差異蜻直,比如實驗組和對照組的成績差異性盯质,手術前和手術后的體重差異性。從功能上講概而,配對樣本Wilcoxon檢驗與配對樣本T檢驗完全一致呼巷,區(qū)別僅在于數據是否正態(tài)。
多獨立樣本的非參數檢驗方法
中位數檢驗:用來檢驗多個獨立樣本來自的總體的中位數是否存在顯著差異赎瑰。其基本思路:先求取混合后數據的中位數王悍,然后利用卡方分布統(tǒng)計量來計算每個樣本組內中位數兩側個案數的差異性。
K-W檢驗:用于檢驗多個總體的分布是否存在顯著差異餐曼。SPSSAU會自動選擇MannWhitney或者Kruskal-Wallis統(tǒng)計量压储。如果X的組別為兩組,比如男和女共兩組源譬,則應該使用MannWhitney統(tǒng)計量集惋,如果組別超過兩組,則應該使用Kruskal-Wallis統(tǒng)計量結果瓶佳。
多個配對樣本非參數檢驗方法
如果是多相關樣本芋膘,并且目的在于研究差異性,則有Friedeman檢驗和CochranQ檢驗兩項可用霸饲,但特別提示一點为朋,CochranQ檢驗涉及的數據一定是二分類(即1和0這樣的數據);如果是研究多相關樣本的一致性情況厚脉,則可使用Kendall協(xié)調系數习寸。
參數或非參數的正確選擇
選擇參數檢驗或非參數檢驗需要結合專業(yè)情況以及數據類型數據形態(tài),綜合參數檢驗和非參數檢驗的優(yōu)缺點進行考量傻工,方法的選擇沒有絕對意義上的標準答案霞溪。
參數檢驗假定總體分布服從正態(tài)或近似正態(tài),如果數據服從正態(tài)分布中捆,參數檢驗是最好的選擇鸯匹。如果不滿足這些條件的情況下,依然使用參數檢驗分析泄伪,很可能讓檢驗結果產生錯誤殴蓬。而非參數檢驗不受數據分布的限制,檢驗條件比較寬松蟋滴,對于總體未知的樣本都可以適用染厅。但非參數檢驗也存在不足痘绎,非參數檢驗對總體假定不多,因而會缺乏針對性肖粮,功效不如參數檢驗孤页。
同時樣本的數量也影響著選擇何種方法。一般來說小樣本用非參數檢驗涩馆,大樣本采用參數檢驗行施。原因是參數檢驗假定了服從某種分布,當樣本量過小時凌净,無法識別數據分布狀態(tài)悲龟,而非參數檢驗對樣本量沒有要求,因此可選擇非參數檢驗冰寻。