GSEA定義的富集分?jǐn)?shù)計(jì)算原理
Gene Set Enrichment Analysis (基因集富集分析) 主要用來(lái)評(píng)估一個(gè)給定基因集內(nèi)的基因與表型相關(guān)性強(qiáng)度哼凯,從而判斷其對(duì)表型的貢獻(xiàn)。
根據(jù)計(jì)算基因與表型的關(guān)聯(lián)度(正相關(guān)變化或負(fù)相關(guān)變化),然后判斷基因集內(nèi)的基因是否富集在表型相關(guān)度排序基因表的前部或者后部。從而反映基因集內(nèi)基因的協(xié)同變化是否與表型關(guān)聯(lián)厕鹃。在表型關(guān)聯(lián)研究中,GSEA從基因集的富集角度出發(fā),理論上更容易納入變化水平較低但也與表型協(xié)同變化的基因蚀瘸,尤其是差異倍數(shù)不太大的基因集。
富集得分ES, enrichment score 庶橱,該指標(biāo)反映了基因集(S)內(nèi)成員在基因-表型-相關(guān)性順序表(L)中位于兩端的富集程度贮勃。計(jì)算方式,從順序表(L)的上的第一個(gè)基因開(kāi)始苏章,當(dāng)遇到S內(nèi)成員時(shí)加上統(tǒng)計(jì)值寂嘉,否者降低統(tǒng)計(jì)值。ES分?jǐn)?shù)記錄為統(tǒng)計(jì)值最大的峰值枫绅,ES大于零表示在L的左端富集泉孩,ES小于零表示在L的右端富集。ES的計(jì)算非常類似 Kolmogorov–Smirnov test 統(tǒng)計(jì)量 并淋,反映了基因集(S)與其它基因的分布差異寓搬,如果基因集(S)內(nèi)成員在一端極度富集,經(jīng)驗(yàn)累積分布函數(shù)將在一段快速提升獲得一個(gè)很大的 eCDF差值 县耽,從而反映了基因集(S)的兩端富集情況句喷。
ES顯著性檢驗(yàn) Permutation Test镣典,大量構(gòu)造與觀測(cè)基因集(s)等大的隨機(jī)基因集,這些隨機(jī)構(gòu)造的結(jié)果大概率是與研究表型不具有相關(guān)性的結(jié)果脏嚷,隨機(jī)構(gòu)造集內(nèi)的成員在相關(guān)性順序表(L)中的分布應(yīng)呈接近均勻分布的狀態(tài)骆撇,從而基于Permutation test 生成判斷 觀測(cè)ES 的有效富集顯著性分?jǐn)?shù)「感穑基本過(guò)程就是打亂樣本的表型標(biāo)簽(也可以隨機(jī)抽取觀測(cè)集)神郊,然后重新計(jì)算相關(guān)性順序表(L)和ES得分(一般為執(zhí)行1000次),然后估計(jì)觀測(cè)ES的估計(jì)P-value(根據(jù)抽樣ES的分布來(lái)估計(jì))趾唱,通常呈正態(tài)分布可計(jì)算 P_val = (大于觀測(cè)ES的隨機(jī)觀測(cè)結(jié)果數(shù))/ 1000(總測(cè)試次數(shù))涌乳。當(dāng)ES大于0并且具有統(tǒng)計(jì)學(xué)意義時(shí),就可以說(shuō)基因集S內(nèi)基因相比其他基因表達(dá)上調(diào)甜癞。
NES,Normalized Enrichment Score夕晓,考慮了不同查詢基因集的大小,將觀測(cè)ES除以Permutation Test得到的所有 ES均值 計(jì)算得出NES悠咱。本質(zhì)是考慮了不同基因集所代表的不同總體來(lái)源的觀測(cè)ES的比較問(wèn)題蒸辆,將ES觀測(cè)值轉(zhuǎn)換為與總體背景下的ES均值的距離(類似方差距離的度量)來(lái)作為跨總體比較的結(jié)果。對(duì)于大于總體均值的ES觀測(cè)值析既,NES應(yīng)大于1躬贡。
判斷基因集有效貢獻(xiàn)的標(biāo)準(zhǔn)為 |NES|>1, p-val<0.05眼坏, q-val<0.25
GSA拂玻、GSEA、ssGSEA宰译、GSVA的算法原理及它們的聯(lián)系與區(qū)別
Permutation Test 置換檢驗(yàn) | Public Library of Bioinformatics (plob.org)
一文掌握GSEA檐蚜,超詳細(xì)教程! - 知乎 (zhihu.com)
Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles | PNAS
GSEA的統(tǒng)計(jì)學(xué)原理試講 | 生信菜鳥(niǎo)團(tuán) (bio-info-trainee.com)