差異分析

基因的差異表達(dá),即發(fā)現(xiàn)一組在正常樣本和患病樣本中表達(dá)不同的基因赏寇。

差異基因的篩選方法

1、倍數(shù)變化(fold change)

最簡(jiǎn)單的是閾值法取具,用倍數(shù)分析基因表達(dá)水平差異,即計(jì)算基因在兩個(gè)條件下表達(dá)水平的比值(癌癥和正常)扁耐,確定比值的閾值暇检,將絕對(duì)值大于此閾值的基因判斷為差異基因。

  • 差異基因的上調(diào)和下調(diào)

    • 我們一般使用 log2 (fold change)婉称。當(dāng)expr(A) < expr(B)時(shí)块仆,B對(duì)A的fold change就大于1,log2 fold change就大于0(見下圖)王暗,B相對(duì)A就是上調(diào)悔据;

    • 當(dāng)expr(A) > expr(B)時(shí),B對(duì)A的fold change就小于1瘫筐,log2 fold change就小于0;

    • 通常為了防止取log2時(shí)產(chǎn)生NA蜜暑,我們會(huì)給表達(dá)值加1(或者一個(gè)極小的數(shù)),也就是log2(B+1) - log2(A+1).

    image

通常選擇2~3倍作為閾值策肝,但對(duì)于低表達(dá)的基因肛捍,3倍也是噪音,那些高表達(dá)的基因之众,1.1倍都是生物學(xué)顯著了拙毫。更重要的沒有考慮到組內(nèi)變異,沒有統(tǒng)計(jì)學(xué)意義棺禾。

2缀蹄、統(tǒng)計(jì)檢驗(yàn)

最常用的T-test、ANOVA(方差分析)或者稱為F檢驗(yàn)膘婶。

對(duì)于基因芯片的數(shù)據(jù)而言缺前,由于樣本服從正態(tài)分布,所以可以用t-test(雙處理)或anova分析(多處理以上)悬襟。

二代測(cè)序RNA-Seq它的抽樣過程是離散的衅码,結(jié)果是count,服從泊松分布脊岳,樣本間的差異是服從負(fù)二向分布.

  • 方差分析(ANOVA)和線性回歸分析(regression)都是同一時(shí)期發(fā)展的兩套緊密相連的理論逝段。方差分析考量的是離散型自變量(因子)對(duì)連續(xù)型應(yīng)變量(響應(yīng)變量)的模型分析,而線性回歸分析只要求響應(yīng)變量是連續(xù)的割捅,對(duì)于自變量無要求奶躯。如果響應(yīng)變量不是連續(xù)型分布,就要使用更加一般化的廣義線性模型(generalized linear model),通過一個(gè)連接函數(shù)變換響應(yīng)變量期望亿驾,將響應(yīng)變量的期望與自變量建立線性關(guān)系嘹黔。

T-test 檢驗(yàn)是差異基因表達(dá)檢測(cè)中常用的統(tǒng)計(jì)方法,通過合并樣本間可變的數(shù)據(jù)莫瞬,來評(píng)價(jià)差異表達(dá)儡蔓,用于判斷某一基因在兩個(gè)樣本中是否有差異表達(dá)醉锄。由于芯片實(shí)驗(yàn)成本較高,樣本量較少浙值,從而對(duì)總體方差的估計(jì)不很準(zhǔn)確恳不,T檢驗(yàn)的檢驗(yàn)效能降低。

3开呐、SAM算法

SAM算法就是通過控制FDR值糾正多重假設(shè)檢驗(yàn)中的假陽性率烟勋。SAM 方法檢驗(yàn)差異表達(dá),通過對(duì)分母增加一個(gè)常量 T 檢驗(yàn)過程減小了假陽性發(fā)生的概率筐付。根據(jù)文獻(xiàn)記載卵惦,相比較其他算法,SAM算法更為穩(wěn)定瓦戚,篩選出的結(jié)果也更為準(zhǔn)確沮尿。SAM方法以q-value< 0.05作為篩選差異表達(dá)基因的標(biāo)準(zhǔn),從公式上來看较解,p-value和q-value較為相似畜疾,而差異篩選是一個(gè)典型的多重假設(shè)檢驗(yàn)過程。對(duì)于多重假設(shè)檢驗(yàn)印衔,單次檢驗(yàn)中差異顯著基因的假陽性率(p-value較小)可能會(huì)較大啡捶,而q-valueFDR值較常見的BH校正方法得到的FDR值而言,改進(jìn)了其對(duì)假陽性估計(jì)的保守性奸焙。

image

火山圖

image

火山圖可反映總體基因的表達(dá)情況瞎暑,橫坐標(biāo)代表log2(Fold Change),縱坐標(biāo)表示-log10(P值),每個(gè)點(diǎn)代表一個(gè)基因与帆,顏色用以區(qū)分基因是否差異表達(dá)了赌,圖中橙色的點(diǎn)代表差異表達(dá)基因,藍(lán)色的點(diǎn)代表沒有差異表達(dá)的基因玄糟。

聚類圖

image

聚類圖可以衡量樣本或基因之間表達(dá)的相似性勿她。 如上圖所示的聚類圖中,橫坐標(biāo)代表樣本聚類茶凳,一列代表一個(gè)樣本嫂拴,聚類基于樣本間基因表達(dá)的相似性播揪,樣本間基因表達(dá)越接近贮喧,靠的越近,以此類推猪狈。 縱坐標(biāo)代表基因聚類箱沦,一行代表一個(gè)基因,聚類基于基因在樣本中表達(dá)的相似性雇庙,基因在樣本中表達(dá)越接近谓形,靠的越近灶伊,以此類推。 色階代表基因表達(dá)豐度寒跳,越紅代表上調(diào)得越明顯聘萨,越綠代表下調(diào)得越明顯。

REF:
http://www.reibang.com/p/b55276e46f0c

https://blog.csdn.net/u012325865/article/details/87344725

http://college.gcbi.com.cn/archives/1616

https://www.cnblogs.com/leezx/p/7132099.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末童太,一起剝皮案震驚了整個(gè)濱河市米辐,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌书释,老刑警劉巖翘贮,帶你破解...
    沈念sama閱讀 211,265評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異爆惧,居然都是意外死亡狸页,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門扯再,熙熙樓的掌柜王于貴愁眉苦臉地迎上來芍耘,“玉大人,你說我怎么就攤上這事熄阻〕菟耄” “怎么了?”我有些...
    開封第一講書人閱讀 156,852評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵饺律,是天一觀的道長(zhǎng)窃页。 經(jīng)常有香客問我,道長(zhǎng)复濒,這世上最難降的妖魔是什么脖卖? 我笑而不...
    開封第一講書人閱讀 56,408評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮巧颈,結(jié)果婚禮上畦木,老公的妹妹穿的比我還像新娘。我一直安慰自己砸泛,他們只是感情好十籍,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評(píng)論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著唇礁,像睡著了一般勾栗。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上盏筐,一...
    開封第一講書人閱讀 49,772評(píng)論 1 290
  • 那天围俘,我揣著相機(jī)與錄音,去河邊找鬼。 笑死界牡,一個(gè)胖子當(dāng)著我的面吹牛簿寂,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播宿亡,決...
    沈念sama閱讀 38,921評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼常遂,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了挽荠?” 一聲冷哼從身側(cè)響起烈钞,我...
    開封第一講書人閱讀 37,688評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎坤按,沒想到半個(gè)月后毯欣,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,130評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡臭脓,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評(píng)論 2 325
  • 正文 我和宋清朗相戀三年酗钞,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片来累。...
    茶點(diǎn)故事閱讀 38,617評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡砚作,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出嘹锁,到底是詐尸還是另有隱情葫录,我是刑警寧澤,帶...
    沈念sama閱讀 34,276評(píng)論 4 329
  • 正文 年R本政府宣布领猾,位于F島的核電站米同,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏摔竿。R本人自食惡果不足惜面粮,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望继低。 院中可真熱鬧熬苍,春花似錦、人聲如沸袁翁。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽粱胜。三九已至柄驻,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間年柠,已是汗流浹背凿歼。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評(píng)論 1 265
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留冗恨,地道東北人答憔。 一個(gè)月前我還...
    沈念sama閱讀 46,315評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像掀抹,于是被迫代替她去往敵國(guó)和親虐拓。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容