參考協(xié)和八——說(shuō)人話的統(tǒng)計(jì)學(xué)
相關(guān)鏈接:
https://mp.weixin.qq.com/s/yIL8xNEJqMUhwSeeb9g9Pw
https://mp.weixin.qq.com/s/HlX3qHKR8dn3C5SDFjruQw
https://mp.weixin.qq.com/s/mEPA_ChhOLn4xayR_LO9Yg
https://mp.weixin.qq.com/s/XtTGLFEk5KjnXQ9FtEoTKA
https://mp.weixin.qq.com/s/LQUiVbuMrpXw6cST9jbUyw
1. p值
- p值是什么
- 在假定原假設(shè)為真時(shí)赞赖,得到與樣本相同或更極端結(jié)果的概率。
- p值不是什么
- p值不是原假設(shè)為真的概率,也不是備選假設(shè)為假的概率
- p值并不能代表你所發(fā)現(xiàn)的效應(yīng)(或差異)的大小
- 0.05是一個(gè)歷史遺留產(chǎn)品
- 在某些領(lǐng)域或話題的研究中粟关,由于犯第一類錯(cuò)誤的成本很高气嫁,因此可以選擇更低的?(比如0.01攀痊、0.001等)义图。(想想在其他因素不變的情況下這意味著統(tǒng)計(jì)功效是降低了還是提高了栖忠?降低了咽瓷。)
- 相反设凹,在某些研究中,則可以把顯著性水平?稍稍放寬一些(一般為0.1茅姜,大于0.1的情況非常少見(jiàn))闪朱。我們偶爾能在科學(xué)文獻(xiàn)中看到作者匯報(bào)p值大于0.05但小于0.1的結(jié)果,一般稱這樣的結(jié)果“趨向統(tǒng)計(jì)學(xué)意義上的顯著性”钻洒,實(shí)際上就是放寬了?奋姿。
2. 統(tǒng)計(jì)功效
- 統(tǒng)計(jì)功效指的是:如果我們感興趣的效應(yīng)或差異的確存在,在給定的顯著性水平的規(guī)定下素标,我們能夠正確地拒絕原假設(shè)的概率称诗。
- 此處引入統(tǒng)計(jì)功效是為了估計(jì)實(shí)驗(yàn)所需的數(shù)據(jù)量。利用統(tǒng)計(jì)功效進(jìn)行數(shù)據(jù)量的估計(jì)头遭,稱為功效分析寓免。
- 順帶提一下第一類錯(cuò)誤(棄真錯(cuò)誤)和第二類錯(cuò)誤(存?zhèn)五e(cuò)誤),犯第一類錯(cuò)誤的概率一般記為α计维,犯第二類錯(cuò)誤的概率一般記為β袜香,在p值足夠小時(shí)才能拒絕原假設(shè)正是為了盡量避免第一類錯(cuò)誤的發(fā)生,而統(tǒng)計(jì)功效的值是1-β鲫惶,一般定為0.8-0.9蜈首。
2.1. 影響統(tǒng)計(jì)功效的因素
- 效應(yīng)的大小
- 數(shù)據(jù)或樣本量的多少
- 數(shù)據(jù)中包含的“噪音”水平
在實(shí)際應(yīng)用中,由于效應(yīng)大小和噪音水平必須互相比較才有意義,因此通常將兩者相除欢策,計(jì)算出標(biāo)準(zhǔn)化的效應(yīng)大小澜术,從而將兩個(gè)量合并成為一個(gè)量。
- 顯著性水平
2.2. 功效分析
- 統(tǒng)計(jì)功效(1-β)猬腰,標(biāo)準(zhǔn)化的效應(yīng)大心穹稀(ES),樣本量(N)姑荷,顯著性水平(α)四者知三推一盒延。
- 常用的估計(jì)效應(yīng)大小的方法
- 試點(diǎn)研究
- meta分析:對(duì)與計(jì)劃進(jìn)行的研究話題、方向鼠冕、對(duì)象相近的已發(fā)表的研究進(jìn)行全面細(xì)致的回顧添寺,合理推算將要進(jìn)行的研究可能獲得的效應(yīng)大小。
- G*Power軟件
2.3. 如何提高統(tǒng)計(jì)功效
2.3.1. 增加數(shù)據(jù)量
- 增加比較容易獲得的組別的樣本量懈费。 但當(dāng)其中一組的樣本量達(dá)到另一組兩倍時(shí)计露,再增加就沒(méi)有太大效果了。
- 盡可能減少數(shù)據(jù)的損失憎乙。 特別是在長(zhǎng)期跟蹤回訪或重復(fù)實(shí)驗(yàn)的縱向研究中票罐。
2.3.2. 放寬顯著性水平的要求
- 報(bào)告p值在0.05和0.1之間的結(jié)果。 但這只在一些特殊情況下可行泞边。
- 使用單側(cè)檢驗(yàn)该押。 同樣的實(shí)驗(yàn),使用單側(cè)檢驗(yàn)得到的p值將會(huì)是雙側(cè)檢驗(yàn)的1/2阵谚,但是使用單側(cè)檢驗(yàn)蚕礼,必須有很強(qiáng)的理論基礎(chǔ),能夠支持我們對(duì)效應(yīng)方向的假設(shè)梢什,而且這一決策必須在分析數(shù)據(jù)前做出奠蹬,切不可在雙側(cè)檢驗(yàn)分析完之后發(fā)現(xiàn)p值不夠小,再來(lái)改用單側(cè)檢驗(yàn)嗡午。
2.3.3. 增加效應(yīng)大卸谠辍(效果量)
- 加大干預(yù)強(qiáng)度。
- 對(duì)極端群體作比較翼馆。 對(duì)于無(wú)法直接控制感興趣的自變量的研究(如回顧性研究)割以,可以采取對(duì)連續(xù)性自變量“取兩頭,棄中間”的辦法应媚。
- 引進(jìn)更多控制變量严沥。
- 采用重復(fù)測(cè)量或組內(nèi)設(shè)計(jì)。 在可行的情況下中姜,采用重復(fù)測(cè)量(在同一組受試者上分別實(shí)施干預(yù)和對(duì)照)設(shè)計(jì)能夠有效降低組間設(shè)計(jì)(在不同的受試者上進(jìn)行不同的干預(yù))中由于個(gè)體不同所帶來(lái)的隨機(jī)噪音消玄。