(109條消息) p-value,p-adjust栈妆,q-value三者的定義與使用_小C_先生的博客-CSDN博客_adjust p value
(109條消息) p-value胁编,q-value,FDR_hyena_7的博客-CSDN博客_pvalue和qvalue區(qū)別
假陰性錯誤(false-negative errors): 高水平的基因可能偶爾沒有檢測到
假陽性錯誤(false-positive errors): 低水平表達(dá)的基因由于擴(kuò)增偏差厢钧,可能顯得過于豐富,導(dǎo)致假陽性錯誤
錯誤發(fā)現(xiàn)率(False Discovery Rate,FDR):事先犯I-型錯誤的最大概率嬉橙,控制FDR值來決定p值的值域早直,F(xiàn)DR用比較溫和的方法對p值進(jìn)行了校正。其試圖在假陽性和假陰性間達(dá)到平衡市框,將假/真陽性比例控制到一定范圍之內(nèi)
p-value
概率霞扬,反應(yīng)某一事件發(fā)生的可能性大小。
統(tǒng)計學(xué)根據(jù)顯著性檢驗方法得到的P值枫振,通常以P<0.05為顯著喻圃,P<0.01為極顯著,其含義為:
抽樣誤差導(dǎo)致的樣本間的差異的概率小于0.05或0.01粪滤。
根據(jù)定義斧拍,P值可簡單理解為判斷結(jié)果的“出錯率
(即假陽性比率,假陽性:不是樣本本身有差異杖小,是其他原因(比如抽樣)導(dǎo)致的檢測結(jié)果有差異)”肆汹。
p-adjust
有時候我們會在樣本中發(fā)現(xiàn)許多0值,然后少量其它值予权,這種情況就會對p-value的可靠性造成影響昂勉,往往這種情況p-value會很顯著,但很明顯這樣不符合現(xiàn)實扫腺。這種時候我們就需要對p-value進(jìn)行校正岗照,校正的流程這里不細(xì)說了,我們可以簡單理解為笆环,p-adjust是用來判斷p-value是否可信的一個參數(shù)攒至,它來自于p-value,但是相對于p-value可信度更高咧织。這樣我們就可以知道嗓袱,在同時有p-value和p-adjust時,我們應(yīng)該選擇p-adjust用來作為顯著性的閾值习绢。
q-value
q-value另有一些區(qū)別渠抹,它也來自于p-value。
q-value可以簡單理解為表示p-value產(chǎn)生假陽性的概率闪萄,當(dāng)q-value < 0.05時梧却,p-value顯著的假陽性小于0.05。
q值(q-value)是p值校正后的結(jié)果败去。
可定義為:多重假設(shè)檢驗過程中放航,錯誤拒絕(拒絕真的原假設(shè)(零假設(shè)))的個數(shù)占所有拒絕的原假設(shè)個數(shù)的比例的期望值(也是代表出錯率)。
總結(jié):
?p-value和q-value是統(tǒng)計學(xué)檢驗變量圆裕,衡量“假陽性概率”广鳍,應(yīng)用到基因檢測結(jié)果中荆几,可衡量“某個基因差異表達(dá)的假陽性概率”,代表差異顯著性赊时,小于0.05代表結(jié)果有差異吨铸。
?如果p-value或q-value/越低,那么“該基因差異結(jié)果”是假陽性的概率就越低祖秒,可靠性就越高诞吱。
?q-value相比于p-value更加嚴(yán)格,當(dāng)差異基因結(jié)果較少時竭缝,可退而求其次根據(jù)p-value篩選房维。
當(dāng)然,用q值篩選可能會過濾掉少部分真的有差異的基因抬纸,所以咙俩,q值是個雙刃劍。但湿故,相比絕大部分基因的假陽性暴浦,以及真陽性被濾掉的小概率,這部分的真陽性的丟失也不是很重要了晓锻。