何時應該使用非參數檢驗?

俗話說得好檀轨,方差有三寶:獨立脏款、正態(tài)、齊性好裤园。什么意思呢?就是說使用方差分析需要三個前提條件:1剂府、各樣本須是相互獨立的隨機樣本拧揽;2、各樣本來自正態(tài)分布總體腺占;3淤袜、各總體方差相等,即方差齊衰伯。

縱然方差分析的用途廣泛铡羡,可以不受比較組數的限制,進行多組比較意鲸。然而在實際的數據分析中烦周,我們辛苦收集的數據往往很難符合其使用的條件尽爆。但我們又需要從樣本數據中,獲得盡可能多的信息读慎,此時使用非參數檢驗就再適合不過了漱贱。

非參數檢驗類別

按照樣本數量分類,可以將非參數檢驗方法分為幾個方面:

單樣本非參數檢驗方法

卡方檢驗:用于分析定類數據與定類數據之間的關系情況夭委,例如不同減肥治療方式對于減肥的幫助情況(膽固醇水平)幅狮。卡方檢驗用于研究X和Y之間的關系,且X,Y均為定類數據株灸。并且卡方檢驗需要使用卡方值和對應P值去判斷X與Y之間是否有差異崇摄。通常情況下,共有三種卡方值慌烧,分別是Pearson卡方逐抑,yates校正卡方,fisher卡方杏死;優(yōu)先使用Pearson卡方泵肄,其次為yates校正卡方,最后為fisher卡方淑翼。

二項分布檢驗:是指在只會產生兩種可能結果如陰性腐巢、陽性之一的n次獨立重復試驗(常常稱為n重Bernoulli試驗)中,每次試驗的“陽性”概率保持不變時玄括,出現“陽性”的次數X=0,1,2......n的一種概率分布冯丙。在醫(yī)學研究中較為常用。

單樣本K-S檢驗:單樣本K-S檢驗能夠利用樣本數據推斷樣本來自的總體是否服從某一理論分布(正態(tài)分布遭京,均勻分布胃惜,泊松分布,指數分布)哪雕。適用于探索連續(xù)型隨機變量分布船殉。

單樣本Wilcoxon檢驗:(也稱單樣本wilcoxon符號秩和檢驗,符號秩和檢驗斯嚎,也或者秩和檢驗等)利虫;其被用于檢驗數據是否與某數字有明顯的差異性。首先需要判斷數據是否呈現出正態(tài)性分析特質堡僻,如果數據呈現出正態(tài)性特質糠惫,此時應該使用單樣本T檢驗進行檢驗;如果數據沒有呈現出正態(tài)性特質钉疫,此時應該使用單樣本Wilcoxon檢驗硼讽。

游程檢驗:游程檢驗用于檢驗數據是否具有隨機性,其原始假設是數據序列不具有隨機性牲阁;如果檢驗結果顯示P值小于0.05固阁,則說明數據不具有隨機性壤躲,反之P值大于等于0.05則說明數據具有隨機性。如果數據有上升或下降的趨勢您炉,或有呈周期性變化的規(guī)律等特征時柒爵,均可能表示數據與順序是有關的,或者說序列不是隨機出現的赚爵。通俗來講棉胀,游程檢驗是用于分析數據是否為隨機彬呻。

兩獨立樣本非參數檢驗方法

MannWhitney U 檢驗:是用得最廣泛的兩獨立樣本秩和檢驗方法墅拭。用于研究定類數據與定量數據之間的關系情況强胰。例如研究人員想知道不同性別學生的購買意愿是否有顯著差異逊桦,如果購買意愿沒有呈現出正態(tài)性特質蜡娶,此時建議可使用MannWhitney U 檢驗落蝙。其原假設是:兩獨立樣本來自的兩總體的分布無顯著差異母廷。

W-W游程檢驗:用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯著差異斑举。通過分析游程的大小和數量實現游程檢驗赐纱,從而判斷兩組樣本在混合序列中的排列是否為隨機的脊奋。若兩組樣本在混合序列中的排列是隨機的,則兩組樣本之間沒有顯著性差異疙描。

極端反應檢驗:從另一角度檢驗兩獨立樣本所來自的量總體分布是否存在顯著性差異诚隙。其基本思想是:將一組樣本作為控制樣本,另一組樣本作為實驗樣本起胰。以控制樣本作為對照久又,檢驗試驗樣本相對于控制樣本是否出現了極端反應。如實驗樣本沒有出現極端反應效五,則認為兩總體分布無顯著差異地消,相反則認為存在顯著差異。

兩配對樣本的非參數檢驗方法

McNemar檢驗:用于兩配對樣本的分析畏妖,其將研究對象自身作為對照者檢驗其“前后”變化是否有顯著差異脉执,例如比較同一批觀測對象用藥前后或實驗前后的結果有無差異。該檢驗只適用于二分變量戒劫,即只有兩種可能“是”或“否”半夷,“陽性”或“陰性”,“有反應”或“無反應”等谱仪,對于非二分變量,應在分析前進行數據變換否彩。

符號檢驗:也是用來檢驗配對樣本所來自的總體的分布是否存在顯著性差異的非參數方法疯攒。符號檢驗法是通過兩個相關樣本的每對數據之差的符號進行檢驗,從而比較兩個樣本的顯著性列荔。由于這種方法只考慮符號敬尺,不考察差數的大小枚尼,因而失去樣本所提供的一部分信息,準確度不高砂吞。因此除了小樣本署恍,一般不使用符號檢驗。

配對樣本Wilcoxon檢驗:配對樣本Wilcoxon檢驗用于檢驗配對數據是否具有顯著性差異蜻直,比如實驗組和對照組的成績差異性盯质,手術前和手術后的體重差異性。從功能上講概而,配對樣本Wilcoxon檢驗與配對樣本T檢驗完全一致呼巷,區(qū)別僅在于數據是否正態(tài)。

多獨立樣本的非參數檢驗方法

中位數檢驗:用來檢驗多個獨立樣本來自的總體的中位數是否存在顯著差異赎瑰。其基本思路:先求取混合后數據的中位數王悍,然后利用卡方分布統(tǒng)計量來計算每個樣本組內中位數兩側個案數的差異性。

K-W檢驗:用于檢驗多個總體的分布是否存在顯著差異餐曼。SPSSAU會自動選擇MannWhitney或者Kruskal-Wallis統(tǒng)計量压储。如果X的組別為兩組,比如男和女共兩組源譬,則應該使用MannWhitney統(tǒng)計量集惋,如果組別超過兩組,則應該使用Kruskal-Wallis統(tǒng)計量結果瓶佳。

多個配對樣本非參數檢驗方法

如果是多相關樣本芋膘,并且目的在于研究差異性,則有Friedeman檢驗和CochranQ檢驗兩項可用霸饲,但特別提示一點为朋,CochranQ檢驗涉及的數據一定是二分類(即1和0這樣的數據);如果是研究多相關樣本的一致性情況厚脉,則可使用Kendall協(xié)調系數习寸。

參數或非參數的正確選擇

選擇參數檢驗或非參數檢驗需要結合專業(yè)情況以及數據類型數據形態(tài),綜合參數檢驗和非參數檢驗的優(yōu)缺點進行考量傻工,方法的選擇沒有絕對意義上的標準答案霞溪。

參數檢驗假定總體分布服從正態(tài)或近似正態(tài),如果數據服從正態(tài)分布中捆,參數檢驗是最好的選擇鸯匹。如果不滿足這些條件的情況下,依然使用參數檢驗分析泄伪,很可能讓檢驗結果產生錯誤殴蓬。而非參數檢驗不受數據分布的限制,檢驗條件比較寬松蟋滴,對于總體未知的樣本都可以適用染厅。但非參數檢驗也存在不足痘绎,非參數檢驗對總體假定不多,因而會缺乏針對性肖粮,功效不如參數檢驗孤页。

同時樣本的數量也影響著選擇何種方法。一般來說小樣本用非參數檢驗涩馆,大樣本采用參數檢驗行施。原因是參數檢驗假定了服從某種分布,當樣本量過小時凌净,無法識別數據分布狀態(tài)悲龟,而非參數檢驗對樣本量沒有要求,因此可選擇非參數檢驗冰寻。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末须教,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子斩芭,更是在濱河造成了極大的恐慌轻腺,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,640評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件划乖,死亡現場離奇詭異贬养,居然都是意外死亡,警方通過查閱死者的電腦和手機琴庵,發(fā)現死者居然都...
    沈念sama閱讀 93,254評論 3 395
  • 文/潘曉璐 我一進店門误算,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人迷殿,你說我怎么就攤上這事儿礼。” “怎么了庆寺?”我有些...
    開封第一講書人閱讀 165,011評論 0 355
  • 文/不壞的土叔 我叫張陵蚊夫,是天一觀的道長。 經常有香客問我懦尝,道長知纷,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,755評論 1 294
  • 正文 為了忘掉前任陵霉,我火速辦了婚禮琅轧,結果婚禮上,老公的妹妹穿的比我還像新娘踊挠。我一直安慰自己乍桂,他們只是感情好,可當我...
    茶點故事閱讀 67,774評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著模蜡,像睡著了一般。 火紅的嫁衣襯著肌膚如雪扁凛。 梳的紋絲不亂的頭發(fā)上忍疾,一...
    開封第一講書人閱讀 51,610評論 1 305
  • 那天,我揣著相機與錄音谨朝,去河邊找鬼卤妒。 笑死,一個胖子當著我的面吹牛字币,可吹牛的內容都是我干的则披。 我是一名探鬼主播,決...
    沈念sama閱讀 40,352評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼洗出,長吁一口氣:“原來是場噩夢啊……” “哼士复!你這毒婦竟也來了?” 一聲冷哼從身側響起翩活,我...
    開封第一講書人閱讀 39,257評論 0 276
  • 序言:老撾萬榮一對情侶失蹤阱洪,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后菠镇,有當地人在樹林里發(fā)現了一具尸體冗荸,經...
    沈念sama閱讀 45,717評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,894評論 3 336
  • 正文 我和宋清朗相戀三年利耍,在試婚紗的時候發(fā)現自己被綠了蚌本。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,021評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡隘梨,死狀恐怖程癌,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情出嘹,我是刑警寧澤席楚,帶...
    沈念sama閱讀 35,735評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站税稼,受9級特大地震影響烦秩,放射性物質發(fā)生泄漏。R本人自食惡果不足惜郎仆,卻給世界環(huán)境...
    茶點故事閱讀 41,354評論 3 330
  • 文/蒙蒙 一只祠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧扰肌,春花似錦抛寝、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,936評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽晶府。三九已至,卻和暖如春钻趋,著一層夾襖步出監(jiān)牢的瞬間川陆,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,054評論 1 270
  • 我被黑心中介騙來泰國打工蛮位, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留较沪,地道東北人。 一個月前我還...
    沈念sama閱讀 48,224評論 3 371
  • 正文 我出身青樓失仁,卻偏偏與公主長得像尸曼,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子萄焦,可洞房花燭夜當晚...
    茶點故事閱讀 44,974評論 2 355

推薦閱讀更多精彩內容

  • 什么是組間差異檢驗拂封?就是組間的差異分析以及顯著性檢驗解幽,應用統(tǒng)計學上的假設檢驗方法,檢驗組間是否有差異及其差異程度烘苹。...
    周運來就是我閱讀 297,620評論 5 273
  • 1. 簡述相關分析和回歸分析的區(qū)別和聯(lián)系躲株。 回歸分析和相關分析都是研究兩個或兩個以上變量之間關系的方法。 廣義上說...
    安也也閱讀 8,688評論 0 3
  • 假設檢驗也叫顯著性檢驗镣衡,是以小概率反證法的邏輯推理霜定,判斷假設是否成立的統(tǒng)計方法,它首先假設樣本對應的總體參數(或分...
    周運來就是我閱讀 1,931評論 1 8
  • 假設檢驗也叫顯著性檢驗廊鸥,是以小概率反證法的邏輯推理望浩,判斷假設是否成立的統(tǒng)計方法,它首先假設樣本對應的總體參數(或分...
    井底蛙蛙呱呱呱閱讀 120,080評論 4 41
  • 感恩父母身體健康惰说,感恩父母養(yǎng)育之恩磨德,感恩列祖列宗庇佑,感恩家庭和睦吆视,感恩孩子們健康快樂成長典挑,感恩萬物滋養(yǎng)! 感恩早...
    馬名鈞楹閱讀 169評論 0 0