差異基因的篩選方法
統(tǒng)計(jì)檢驗(yàn)得到p值
- 比方說你想研究什么基因,可以在全部都是腫瘤組織里面以某個基因分類端蛆,分成高表達(dá)和低表達(dá)的兩組配乓,兩組數(shù)據(jù)進(jìn)行不配對t檢驗(yàn)或者anova方差分析
- 也可以根據(jù)腫瘤和正常樣本進(jìn)行分組
對于基因芯片的數(shù)據(jù)而言雏逾,樣本服從正態(tài)分布,所以用t-test(雙處理)或anova分析(多處理以上)瓤漏。
二代測序RNA-Seq它的抽樣過程是離散的腾夯,結(jié)果是count,服從泊松分布蔬充,樣本間的差異是服從負(fù)二向分布蝶俱。
方差分析(ANOVA)和線性回歸分析(regression)都是同一時(shí)期發(fā)展的兩套緊密相連的理論。方差分析考量的是離散型自變量(因子)對連續(xù)型應(yīng)變量(響應(yīng)變量)的模型分析饥漫,而線性回歸分析只要求響應(yīng)變量是連續(xù)的榨呆,對于自變量無要求。如果響應(yīng)變量不是連續(xù)型分布庸队,就要使用更加一般化的廣義線性模型(generalized linear model),通過一個連接函數(shù)變換響應(yīng)變量期望积蜻,將響應(yīng)變量的期望與自變量建立線性關(guān)系。
倍數(shù)變化fold change
最簡單的是閾值法彻消,用倍數(shù)分析基因表達(dá)水平差異竿拆,即計(jì)算基因在兩個條件下表達(dá)水平的比值(癌癥和正常),確定比值的閾值宾尚,將絕對值大于此閾值的基因判斷為差異基因丙笋。
- 差異基因的上調(diào)與下調(diào)
一般使用log2FC谢澈,大于0上調(diào),小于0下調(diào)
參考:差異分析