看到一個博客上寫的一般檢驗的R應用總結(jié)酬滤,挺不錯的隧膏,分享一下贿堰。
本文總結(jié)了R in Action一書中提到的關(guān)于樣本檢驗的內(nèi)容,以概要的形式提供給讀者以及自己參考铆帽。
注: H0表示空假設咆耿,即樣本檢測的假設對象。
獨立性檢驗(列聯(lián)表)
卡方檢驗:H0:假設二維表的行和列變量相互獨立爹橱。stats
包的chisq.test()*
Fisher精確檢驗: H0:邊界固定的二維列聯(lián)表行和列獨立萨螺。stats
包的fisher.test()*
Cochran-Mantel-Haenszel檢驗:*H0:兩個名義變量在第三個變量的每一層中都是條件獨立的。stats
包的.test()
相關(guān)性檢驗
常用系數(shù):Pearson, Spearman, Kendall, 偏相關(guān)系數(shù), 多分格polychoric,多系列polyserial
PSK: 相關(guān)系數(shù)cor(), 協(xié)方差cov(),psych
包的corr.test()
偏相關(guān):控制一個或多個定量變量愧驱,檢驗另外兩個變量之間的相關(guān)性慰技。ggm
包的pcor()
其他類型:polycor
包的hetcor()有多種其他類型的相關(guān)函數(shù)
相關(guān)顯著性檢驗
PSK: cor.test(), corr.test().后者可同時檢測多種相關(guān)關(guān)系。
其他類型:psych
包的pcor.test() & r.test()
- 參數(shù)檢驗
獨立樣本t檢驗:H0:被檢驗的兩組樣本獨立且均值相等冯键,并且從正態(tài)總體中抽的惹盼。stats
包的t.test()*
非獨立樣本t檢驗:兩組觀測相關(guān)庸汗,一般通過非獨立組設計獲得惫确,如pre-post design, repeated measures design。 H0:假定組間差異呈正態(tài)分布,且均值相等改化。stats
包的t.test(.掩蛤。, paired=TRUE)*
多于兩組的非獨立樣本:如果對比組大于2且滿足數(shù)據(jù)是從正態(tài)總體中獨立抽樣獲得的假設,可采用ANOVA方差分析陈肛。
- 非參數(shù)檢驗: 通常獨立樣本也被稱作單樣本(one-sample)檢驗揍鸟,非獨立樣本被稱作雙樣本(two-sample) 檢驗。單樣本檢驗的自由度是n1+n2-1句旱,雙樣本檢驗自由度是n/2-1.
兩組獨立樣本:可以使用Wilcoxon秩和檢驗(Mann-Whitney U檢驗), wilcox.test()
兩組非獨立樣本:可以使用Wilcoxon符號秩檢驗阳藻。它適用于兩組成對數(shù)據(jù)且無法保證正態(tài)性假設的情景。stats
包的wilcox.test(.., paired=TRUE)
多于兩組的樣本:如果各組樣本獨立谈撒,則可使用Krushkal-Wallis檢驗腥泥;如果不獨立,可使用Friedman檢驗啃匿。H0:各組的平均值相同蛔外。stats
包的kruskal.test() &friedman.test()。npmc
包的npmc()*函數(shù)可實現(xiàn)非參數(shù)的多組比較溯乒。
樣本檢驗的一般步驟
提出研究問題夹厌,總結(jié)出需要通過數(shù)據(jù)分析得出的問題。
描述空假設和被選假設裆悄∶疲空假設的提出通常需要能夠通過數(shù)據(jù)分析得出“接受”或“拒絕”的結(jié)論,如均值相等灯帮,均值大于X0等崖技。
清楚假設條件。檢驗過程是在一定的假設條件下進行的钟哥,比如通常需要考慮迎献,樣本是否獨立分布,均值和方差的統(tǒng)計分布等腻贰。
根據(jù)樣本數(shù)量和假設條件吁恍,選擇合適的檢驗方法,如t檢驗播演,以及檢驗統(tǒng)計量T冀瓦。
在空假設和觀測樣本的基礎(chǔ)上,計算檢驗的統(tǒng)計分布写烤,如學生分布或正態(tài)分布翼闽。
選擇合適的統(tǒng)計顯著水平p-value感局,常用的5%和1%尼啡。
計算檢驗統(tǒng)計量T的拒絕區(qū)間(critical region),即在該區(qū)間內(nèi)崖瞭,空假設即被拒絕為真。
根據(jù)觀測樣本撑毛,計算檢驗統(tǒng)計量的觀測直t_obs书聚。
得出結(jié)論:如果t_obs落在拒絕區(qū)間里,則拒絕空假設;否則胯杭,無法拒絕空假設歉摧。
相關(guān)鏈接:
Statistical hypothesis testing
Exploratory data analysis
Quick-R: t-test