一阻星、如何深入理解p值的含義
首先,我們來看一下p值的定義:在原假設(shè)H0成立的條件下已添,發(fā)生與樣本結(jié)果相同或更極端結(jié)果的概率妥箕。那么,什么叫與樣本結(jié)果相同或更極端結(jié)果呢更舞?我們以拋硬幣這個例子來說明畦幢。
我們想通過假設(shè)檢驗的方法驗證一枚硬幣是否均勻,那么原假設(shè)H0為:正面朝上的概率為0.5(硬幣是均勻的)缆蝉;備擇假設(shè)H1為:正面朝上的概率不等于0.5(硬幣是不均勻的)∮畲校現(xiàn)在隨機拋該硬幣5次瘦真,發(fā)現(xiàn)有4次正面朝上,那么在顯著性水平為0.05的條件下黍瞧,是否應(yīng)該拒絕原假設(shè)呢诸尽?
首先需要考慮一個問題,這里的p值應(yīng)該如何計算印颤?按照定義您机,如果原價假設(shè)成立,即硬幣是均勻的年局,出現(xiàn)4次正面朝上的概率為 0.15625往产,更極端情況下出現(xiàn)5次正面朝上的概率為0.03125 。此外某宪,我們還應(yīng)該考慮出現(xiàn)4次及以上反面朝上的概率仿村,因為這也是背離原假設(shè)且比樣本結(jié)果更極端的概率,這個概率為0.15625+0.03125=0.1875兴喂。因此蔼囊,p值為上面所有情況的和0.375,因此衣迷,我們不能拒絕原假設(shè)畏鼓,不能認(rèn)為硬幣是不均勻的。
從這里可以看出壶谒,這里的更極端結(jié)果云矫,是指與樣本結(jié)果相比,更加背離原假設(shè)的情況汗菜。因此让禀,p值其實反映了樣本在多大程度上或多大概率上背離原假設(shè),如果p值越小陨界,表明樣本發(fā)生的概率越小巡揍,即更加背離原假設(shè),當(dāng)背離原假設(shè)到一定程度時(小于顯著性水平)菌瘪,我們就會拒絕原假設(shè)腮敌。
二、對p值的錯誤理解
-
1俏扩、p值不代表原假設(shè)為真的概率
p值不反應(yīng)原假設(shè)為真的概率糜工,只是反映樣本與原假設(shè)相悖的程度。原假設(shè)為真的概率录淡,從某種程度上來說是固定的捌木。在拋硬幣的這個例子中,我們可以基于5次拋硬幣的結(jié)果赁咙,利用貝葉斯公式來估計硬幣均勻的概率钮莲,將"拋5次硬幣免钻,4次正面朝上"定義為事件A, "硬幣是均勻的"定義為事件B1,"硬幣是不均勻的"定義為事件B2崔拥,則條件概率為:
這里极舔,原假設(shè)為真的概率為P(B1),是貝葉斯公式里的先驗概率链瓦。因此拆魏,p值的大小并不代表原假設(shè)到底有多真或多假。
-
2慈俯、p值不能代表效應(yīng)(差異)大小
在拋硬幣這個例子中渤刃,如果p值顯著,只能說明硬幣是不均勻的贴膘,但是究竟有多不均勻卖子,只通過p值大小無法確定。不能說p值越小刑峡,硬幣就越不均勻洋闽。樣本量是影響p值的一個因素,實際效應(yīng)值較小突梦,大樣本情況下可能p值較小诫舅,得到顯著的結(jié)果;實際效應(yīng)值較大宫患,樣本數(shù)量不足情況下可能p值較大刊懈,無法得到顯著結(jié)果。
三娃闲、影響p值的因素
- 總體分布的形態(tài)虚汛,確切的說是總體的方差⌒蟮酰總體方差越大泽疆,p值越大,傾向于接受原假設(shè)玲献。
- 樣本的數(shù)量。樣本數(shù)量增加梯浪,p值越小捌年,傾向于拒絕原假設(shè)。
- 樣本與總體的差異挂洛。差異越大礼预,p值越小,傾向于拒絕原假設(shè)虏劲。