統(tǒng)計檢驗

參數(shù)檢驗和非參數(shù)檢驗的區(qū)別:

? ? ? ? 期刊文獻(xiàn)中常規(guī)數(shù)據(jù)的主流統(tǒng)計檢驗方法分為兩種:
以T檢驗览濒、方差分析等為代表的參數(shù)檢驗乘粒;以秩和檢驗幢妄、卡方檢驗為代表的非參數(shù)檢驗

????參數(shù)檢驗:假定數(shù)據(jù)服從某分布(一般為正態(tài)分布)着裹,通過樣本參數(shù)的估計量(x±s)對總體參數(shù)(μ)進(jìn)行檢驗赶熟,比如t檢驗瑰妄、u檢驗、方差分析映砖。

????非參數(shù)檢驗:不需要假定總體分布形式间坐,直接對數(shù)據(jù)的分布進(jìn)行檢驗。由于不涉及總體分布的參數(shù),故名 非參數(shù) 檢驗眶诈。比如涨醋,卡方檢驗,秩和檢驗逝撬。

????參數(shù)檢驗的集中趨勢的衡量為均值浴骂,而非參數(shù)檢驗為中位數(shù)。

????參數(shù)檢驗需要關(guān)于總體分布的信息宪潮;非參數(shù)檢驗不需要關(guān)于總體的信息溯警。

????參數(shù)檢驗只適用于變量,而非參數(shù)檢驗同時適用于變量和屬性狡相。

????簡而言之梯轻,若可以假定樣本數(shù)據(jù)來自具有特定分布的總體,則使用參數(shù)檢驗尽棕。如果不能對數(shù)據(jù)集作出必要的假設(shè)喳挑,則使用非參數(shù)檢驗。


????利用ggstatsplot包進(jìn)行數(shù)據(jù)統(tǒng)計檢驗分析和呈圖滔悉,很舒服伊诵。要注意?type = "noparametric" 參數(shù),自己判斷是要非參數(shù)檢驗還是參數(shù)檢驗

? ??提取統(tǒng)計數(shù)據(jù):ggbetweenstats(data, x, y) %>%?extract_stats()

正態(tài)性檢驗回官,同方差性檢驗

? ??方差相同的兩樣本T檢驗曹宴,方差不同的兩樣本T檢驗

? ??其實T檢驗只需滿足一個條件,那就是正態(tài)歉提,方差不齊的情況也可以用T檢驗笛坦。兩獨(dú)立樣本T檢驗就是方差相同的兩樣本T檢驗,滿足兩個條件苔巨,正態(tài)且方差齊性版扩。如果F檢驗把方差齊性的零假設(shè)給reject了,即方差不同侄泽,那么可用Welch t檢驗资厉。方差是否相同,可以計算兩個樣本的方差比值蔬顾,方差相同,則比值應(yīng)該在1左右湘捎,而方差不同诀豁,則比值會偏離1,這個比值稱為F ratio窥妇,可以使用F檢驗來計算方差齊性的顯著性舷胜。(https://guangchuangyu.github.io/statistics_notes/t.html)

? ??但好像論文中這種情況,一般直接用非參數(shù)檢驗,好像更為穩(wěn)健烹骨。

出自 Pterosaur_Zero:【學(xué)習(xí)筆記】組間差異比較及相關(guān)問題總結(jié)?https://blog.csdn.net/qq_33924470/article/details/115068564?spm=1001.2014.3001.5502?| 世威:http://www.reibang.com/p/a0f2ef207059
出自帥哥簡書?http://www.reibang.com/p/ed466c40c049

? ??正態(tài)性檢驗:R 的 shapiro.test?函數(shù)可檢驗數(shù)據(jù)是否服從整體分布翻伺, 若 p 大于0.05,表示與正態(tài)分布無顯著差異沮焕,即樣本服從正態(tài)分布吨岭。shapiro.test() 在 R 中有一個限制,它最多只能應(yīng)用于大小為 5000 的樣本峦树,并且最小樣本大小必須為 3辣辫。有一個假設(shè)檢驗,稱為 Anderson Darling 正態(tài)性檢驗可替代shapiro.test?函數(shù)魁巩。加載 nortest 包并使用 ad.test() 函數(shù)即可急灭。http://www.reibang.com/p/0f6e6ba8b6b4

? ??同方差性檢驗:使用F檢驗,var.test() 函數(shù)檢驗兩組樣本方差是否具有顯著差異谷遂, 若 p 大于0.05葬馋,即兩組樣本的方差沒有顯著差異,方差齊次肾扰。

? ??正態(tài)性檢驗和同方差性檢驗下面都有例子

????所謂雙側(cè)和單側(cè)之別畴嘶,是以做檢驗時拒絕域在數(shù)據(jù)分布的兩側(cè)還是單側(cè)來區(qū)分的,若是雙側(cè)檢驗白对,代表研究者不確定數(shù)據(jù)均值是高于檢驗值還是低于檢驗值掠廓,比如你的數(shù)據(jù),如果你不清楚后測數(shù)據(jù)是否高于前測數(shù)據(jù)甩恼,就想知道前后測的均值是否不同蟀瞧,那就用雙側(cè)檢驗;如果你僅僅想知道后測是不是高于前測条摸,或者僅僅想知道前測是不是低于后測悦污,那可以用單側(cè)檢驗,因為此時你只關(guān)心某一側(cè)的拒絕域钉蒲,對另一側(cè)不感興趣切端。

????簡單來說,雙側(cè)檢驗只能證明你比較的兩個項目之間是有差異的顷啼,但是不能告訴你這兩組中哪個高哪個低踏枣;單側(cè)檢驗就可以告訴你是低于還是高于。從原假設(shè)來判斷的話:雙側(cè)的原假設(shè)用的是a≠a0單側(cè)檢驗的假設(shè)是a>a0或者a<a0钙蒙。


R中常用的比較方法?https://zhuanlan.zhihu.com/p/339147396
http://www.reibang.com/p/8210e4c1079d


參數(shù)檢驗:t檢驗? ? t.test()

????https://zhuanlan.zhihu.com/p/360185346

????當(dāng)前各類期刊對于實驗的生物學(xué)重復(fù)都有一定的要求茵瀑,因此適用于兩樣本比較的卡方檢驗出現(xiàn)頻率逐漸減少币叹,T檢驗常用于兩組數(shù)據(jù)比較碍讨,成為當(dāng)前期刊文章中出現(xiàn)頻率最高的檢驗類型集灌,T檢驗根據(jù)檢驗的數(shù)據(jù)類型又可以分為3種:

1)單樣本T檢驗 :較少被使用。檢驗單組樣本的平均值是否等于目標(biāo)值褐鸥,如:某個班級學(xué)生的平均身高是否達(dá)到全國平均身高等漓穿。

????單樣本均值t檢驗泻轰,用于判斷樣本均值與已知的標(biāo)準(zhǔn)是否具有顯著差異莉御,如判斷一個球隊隊員的平均身高是否與 190cm?有顯著差異

例子:https://mp.weixin.qq.com/s/4q9eHe48eljHPq0KeloVvw

2)獨(dú)立樣本T檢驗:最常被使用,檢驗兩組獨(dú)立樣本的平均值之差是否等于目標(biāo)值匙奴,如:疾病組與健康組的某項指標(biāo)是否存在顯著差異等堆巧。

????兩個相互獨(dú)立的樣本,如果均服從正態(tài)分布饥脑,且方差無顯著差異(方差齊次)恳邀,可以使用?t?檢驗,比較兩樣本的均值是否具有顯著差異

例子:https://mp.weixin.qq.com/s/37Y90UsoXWpNfGfLoYt-jQ

3)配對T檢驗:偶爾被使用灶轰,檢驗相關(guān)或配對觀測之差的平均值是否等于目標(biāo)值谣沸,例如:檢驗一款減肥藥效果,同一個人服藥前后的體重數(shù)據(jù)就是配對的數(shù)值笋颤,檢驗若干個配對的體重數(shù)值是否存在顯著差異乳附。


參數(shù)檢驗:方差分析????aov()或anova()

????方差分析(Analysis of Variance,簡稱ANOVA)伴澄,又稱“變異數(shù)分析”赋除,F(xiàn)檢驗,是R.A.Fisher費(fèi)舍爾發(fā)明的非凌,用于兩個及兩個以上樣本均值差別的顯著性檢驗举农。

? ??當(dāng)因變量的分布不滿足方差齊性的要求時,也可采用FWelch檢驗敞嗡。但論文中一般直接用非參數(shù)檢驗颁糟,更為穩(wěn)健。

? ??概率論中方差用來度量隨機(jī)變量和其數(shù)學(xué)期望(即均值)之間的偏離程度喉悴。

方差的計算方法


非參數(shù)檢驗:Wilcoxon 秩和檢驗????wilcox.test()

????單樣本wilcoxon test:在對單樣本進(jìn)行?t?檢驗時棱貌,如果樣本的分布未能通過正態(tài)性檢驗,通常需要采用非參數(shù)的?wilcoxon?signed?rank test箕肃,檢驗樣本的中位數(shù)與預(yù)設(shè)指標(biāo)間的差異是否具有顯著性婚脱。

單樣本wilcoxon test 例子:https://mp.weixin.qq.com/s/x9cg8MiJFcZlpoyRLEc1oQ

? ??Wilcoxon?test (Mann-Whitney U test)?檢驗兩獨(dú)立 非正態(tài)樣本中位數(shù)差異的顯著性

兩獨(dú)立非正態(tài)樣本wilcoxon test 例子:https://mp.weixin.qq.com/s/Bj2M4zD3U4WGaGV9IbBYYw

? ??正態(tài)性檢驗:R 的 shapiro.test()?或者 nortest 包 ad.test() 函數(shù)分別檢驗兩組數(shù)據(jù)是否服從整體分布, 若均小于0.05勺像, 即兩組樣本均不服從正態(tài)分布障贸。

????wilcoxon test:數(shù)據(jù)不滿足正態(tài)性假設(shè),因此不能使用 t test吟宦,?應(yīng)該使用非參數(shù)的wilcoxon test篮洁。?p 值小于0.05,則兩組樣本間具有顯著差異督函。

? ?* 代表p值小于0.05,**代表p值小于0.01,*** 代表p值小于0.001辰狡。ns代表組間無差異


非參數(shù)檢驗:Kruskal-Wallis 檢驗锋叨,KW秩和檢驗? ??kruskal.test()

????克魯斯卡爾-沃利斯檢驗(Kruskal-Wallis test)亦稱“K-W檢驗”、“H檢驗”等宛篇。用以檢驗兩個以上樣本是否來自同一個概率分布的一種非參數(shù)方法娃磺。被檢驗的幾個樣本必須是獨(dú)立的或不相關(guān)的。與此檢驗對等的參數(shù)檢驗是單因素方差分析叫倍,但與之不同的是偷卧,K-W檢驗不假設(shè)樣本來自正態(tài)分布。它的原假設(shè)是各樣本服從的概率分布具有相同的中位數(shù)吆倦,原假設(shè)被拒絕意味著至少一個樣本的概率分布的中位數(shù)不同于其他樣本听诸。此檢驗并未識別出這些差異發(fā)生在哪些樣本之間以及差異的大小

多組數(shù)據(jù)非參數(shù)檢驗kruskal test 例子:https://mp.weixin.qq.com/s/FujhL2tYwJaiZZ2C3_dE-Q

????分別對n組數(shù)據(jù)(n應(yīng)該是大于2)進(jìn)行正態(tài)性檢驗,p 值均小于 0.05蚕泽,即均不服從正態(tài)分布晌梨。接著使用?Kruskal-Wallis test?進(jìn)行方差分析,結(jié)果顯示 p<0.05须妻,說明至少有一組數(shù)據(jù)與其他組數(shù)據(jù)存在顯著差異仔蝌。

? ??可以接著使用 pairwise.wilcox.test() 函數(shù)(圖基(Tukey)檢驗),進(jìn)行組間兩兩之間分別比較荒吏,結(jié)果可顯示任意兩組間的 p 值是否小于0.05敛惊,若小于說明兩組數(shù)據(jù)間具有顯著差異。(三組以上數(shù)據(jù)比較(KW秩和檢驗時)绰更,配合使用多重比較檢驗瞧挤,獲得兩兩分組間的差異結(jié)果)


非參數(shù)檢驗:卡方分布

http://www.reibang.com/p/8e8ab8b47c7d

????文獻(xiàn)中如此描述卡方檢驗的應(yīng)用:”卡方檢驗用來比較試驗組和控制組在A、B中的分布差異“动知。其中:A將定性變量分為性別(男性皿伺、女性)、年齡段(18-35盒粮、35-55鸵鸥、55以上)、是否吸煙(吸煙丹皱、不吸煙妒穴、以前吸煙)。B將定性變量分為移植物長度(6毫米摊崭、8毫米讼油、9毫米)

????以上性別、年齡段呢簸、移植物長度變量均可視為分類變量矮台,根據(jù)這些變量進(jìn)行分類乏屯。p值大于0.05,反映出變量在試驗組和控制組間無顯著差異瘦赫。即變量的分布與是否分在試驗組還是控制組無關(guān)辰晕、相互獨(dú)立∪肥卡方統(tǒng)計量的值越大含友,對應(yīng)的P值越小。


多重比較(多重檢驗)

? ? 當(dāng)總體檢驗有統(tǒng)計學(xué)意義后校辩,接下來我們會想知道哪兩個組間會存在差異窘问,就涉及到兩兩比較(或者叫多重比較)。參數(shù)檢驗和非參數(shù)檢驗都有多重比較宜咒。以參數(shù)檢驗為例惠赫,多重比較(multiple comparisons)是指方差分析后對各樣本平均數(shù)間是否有顯著差異的假設(shè)檢驗的統(tǒng)稱。方差分析只能判斷各總體平均數(shù)間是否有差異荧呐,多重比較可用來進(jìn)一步確定哪兩個平均數(shù)間有差異汉形,哪兩個平均數(shù)間沒有差異。

? ??比較方法有 N-K(Newman-Keuls)檢驗倍阐、鄧肯(DunCan)檢驗概疆、圖基(Tukey)檢驗、鄧尼特(Dunnett)檢驗峰搪、Dunn 檢驗岔冀、最小顯著差檢驗以及謝費(fèi)(Scheffé)檢驗等它們的理論依據(jù)和應(yīng)用條件都有所不同。R包PMCMR(The Pairwise Multiple Comparison of Mean Ranks Package) 提供了大量的秩和檢驗(包括Kruskal Wallis概耻、Friedman)后的多重比較方法使套。直接利用ggstatsplot包進(jìn)行數(shù)據(jù)統(tǒng)計檢驗分析和呈圖更爽的。

? ??與Wilcoxon檢驗相比鞠柄,Dunn檢驗考慮了Kruskal-Wallis測試所使用的rank侦高。還對tie(數(shù)據(jù)中存在相同的數(shù)值)進(jìn)行了校正。


統(tǒng)計學(xué)學(xué)習(xí)優(yōu)秀博主筆記

http://rvdsd.top/categories/%E7%94%9F%E7%89%A9%E7%BB%9F%E8%AE%A1/


Pearson 和 Spearman 相關(guān)系數(shù)

https://mp.weixin.qq.com/s/0nwiXEHgXUXbEMtZZ4xq7w

? ??pearson?spearman?相關(guān)系數(shù)厌杜,用于分析兩連續(xù)變量之間的相關(guān)性奉呛。

????pearson 相關(guān)系數(shù)是基于原始數(shù)據(jù)的,用于衡量兩變量之間的線性關(guān)系夯尽;spearman 相關(guān)系數(shù)基于排序瞧壮,用于衡量單調(diào)關(guān)系。

????pearson?相關(guān)系數(shù)? ? 正態(tài)分布

????pearson?相關(guān)系數(shù)相關(guān)系數(shù)的取值范圍為 [-1,1]匙握,1 表示強(qiáng)正相關(guān)咆槽,0?表示沒有相關(guān)性,-1 表示強(qiáng)負(fù)相關(guān)圈纺。變量服從正態(tài)分布是應(yīng)用pearson相關(guān)系數(shù)的前提秦忿,p 值大于0.05麦射,則變量的分布與正態(tài)分布無顯著差異,可以計算pearson 相關(guān)系數(shù)灯谣。

? ??cor()?函數(shù)用于計算相關(guān)系數(shù)法褥,參數(shù) x 和 y 分別指定兩個變量,method 用于指定相關(guān)系數(shù)的類型酬屉;cor.test()?函數(shù)不僅能夠計算相關(guān)系數(shù),還能夠顯示相關(guān)系數(shù)結(jié)果的顯著性揍愁,如算出為負(fù)值且p<0.05呐萨,即呈顯著負(fù)相關(guān)。

? ??Spearman 相關(guān)系數(shù)? ? 非正態(tài)分布

????當(dāng)數(shù)據(jù)不能通過正態(tài)性檢驗時莽囤,可以考慮使用spearman相關(guān)系數(shù)谬擦,spearman 相關(guān)系數(shù)的取值范圍為?[-1,1],1?表示強(qiáng)正相關(guān)朽缎,0?表示沒有相關(guān)性惨远,-1 表示強(qiáng)負(fù)相關(guān)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末话肖,一起剝皮案震驚了整個濱河市北秽,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌最筒,老刑警劉巖贺氓,帶你破解...
    沈念sama閱讀 206,723評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異床蜘,居然都是意外死亡辙培,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評論 2 382
  • 文/潘曉璐 我一進(jìn)店門邢锯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來扬蕊,“玉大人,你說我怎么就攤上這事丹擎∥惨郑” “怎么了?”我有些...
    開封第一講書人閱讀 152,998評論 0 344
  • 文/不壞的土叔 我叫張陵鸥鹉,是天一觀的道長蛮穿。 經(jīng)常有香客問我,道長毁渗,這世上最難降的妖魔是什么践磅? 我笑而不...
    開封第一講書人閱讀 55,323評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮灸异,結(jié)果婚禮上府适,老公的妹妹穿的比我還像新娘羔飞。我一直安慰自己,他們只是感情好檐春,可當(dāng)我...
    茶點故事閱讀 64,355評論 5 374
  • 文/花漫 我一把揭開白布逻淌。 她就那樣靜靜地躺著,像睡著了一般疟暖。 火紅的嫁衣襯著肌膚如雪卡儒。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,079評論 1 285
  • 那天俐巴,我揣著相機(jī)與錄音骨望,去河邊找鬼。 笑死欣舵,一個胖子當(dāng)著我的面吹牛擎鸠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播缘圈,決...
    沈念sama閱讀 38,389評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼劣光,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了糟把?” 一聲冷哼從身側(cè)響起绢涡,我...
    開封第一講書人閱讀 37,019評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎遣疯,沒想到半個月后垂寥,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,519評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡另锋,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,971評論 2 325
  • 正文 我和宋清朗相戀三年滞项,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片夭坪。...
    茶點故事閱讀 38,100評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡文判,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出室梅,到底是詐尸還是另有隱情戏仓,我是刑警寧澤,帶...
    沈念sama閱讀 33,738評論 4 324
  • 正文 年R本政府宣布亡鼠,位于F島的核電站赏殃,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏间涵。R本人自食惡果不足惜仁热,卻給世界環(huán)境...
    茶點故事閱讀 39,293評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望勾哩。 院中可真熱鬧抗蠢,春花似錦举哟、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至秽褒,卻和暖如春壶硅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背销斟。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評論 1 262
  • 我被黑心中介騙來泰國打工森瘪, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人票堵。 一個月前我還...
    沈念sama閱讀 45,547評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像逮栅,于是被迫代替她去往敵國和親悴势。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,834評論 2 345

推薦閱讀更多精彩內(nèi)容