GO富集分析(轉(zhuǎn)載)

GO富集介紹
  每個(gè)基因都會(huì)對(duì)應(yīng)有一個(gè)或多個(gè)GO term(也就是GO功能)系吩。
  富集涉及到兩個(gè)概念:前景基因和背景基因。前景基因就是你關(guān)注的要重點(diǎn)研究的基因集绪杏,背景基因就是所有的基因集嵌莉。比如做兩個(gè)樣本對(duì)照組和處理組的轉(zhuǎn)錄組測(cè)序,前景基因就是對(duì)照組vs處理組的差異基因已烤,背景基因就是這兩組樣本的所有表達(dá)基因鸠窗。再比如妓羊,我想知道與整個(gè)廣東省相比,深圳市的大學(xué)生是不是顯著更多(“大學(xué)生”就相當(dāng)于深圳市民的其中一個(gè)GO term)稍计。那么前景就是深圳市的人口躁绸,背景就是廣東省的人口,每個(gè)個(gè)體都會(huì)有一個(gè)標(biāo)簽(如大學(xué)生、中學(xué)生净刮、小學(xué)生等)剥哑。

具體介紹
  Gene Ontology分為分子功能,生物過程和細(xì)胞組成三個(gè)部分淹父。蛋白質(zhì)或者基因可以通過ID對(duì)應(yīng)或者序列注釋的方法找到與之對(duì)應(yīng)的GO號(hào)株婴,而GO號(hào)可對(duì)應(yīng)到Term,即功能類別或者細(xì)胞定位暑认。這也是GO富集的一個(gè)基礎(chǔ)困介。

概念明晰
  功能富集需要有一個(gè)參考數(shù)據(jù)集,通過該項(xiàng)分析可以找出在統(tǒng)計(jì)上顯著富集的GO Term蘸际。該功能或者定位有可能與研究的目的有關(guān)座哩。
  GO功能分類是在某一功能層次上統(tǒng)計(jì)蛋白或者基因的數(shù)目或組成,往往是在GO的第二層次粮彤。此外也有研究者挑選一些Term根穷,而后統(tǒng)計(jì)直接對(duì)應(yīng)到該Term的基因或蛋白數(shù)。結(jié)果一般以柱狀圖或者餅圖表

為什么做基因富集分析导坟?
  我們?cè)诘玫较嚓P(guān)基因的表達(dá)后屿良,做基因差異分析得到了好多差異基因(p值小的,也就是差異很顯著的基因)惫周,做后續(xù)研究時(shí)不可能將所有差異基因都拿來做實(shí)驗(yàn)驗(yàn)證或者拿出來說明問題管引,這時(shí)候就需要挑選了,那怎么挑選呢闯两?或者說拿什么標(biāo)準(zhǔn)來衡量我挑選的基因是否可信褥伴,有一個(gè)統(tǒng)一的挑選標(biāo)準(zhǔn)嗎?
  這就是富集分析需要做的漾狼,能夠給出的結(jié)果重慢。

富集分析一般包括以下步驟:
1.GO分析

根據(jù)挑選出的差異基因,計(jì)算這些差異基因同GO 分類中某(幾)個(gè)特定的分支的超幾何分布關(guān)系逊躁,GO 分析會(huì)對(duì)每個(gè)有差異基因存在的GO 返回一個(gè)p-value似踱,小的p 值表示差異基因在該GO 中出現(xiàn)了富集。

GO 分析對(duì)實(shí)驗(yàn)結(jié)果有提示的作用稽煤,通過差異基因的GO 分析核芽,可以找到富集差異基因的GO分類條目,尋找不同樣品的差異基因可能和哪些基因功能的改變有關(guān)酵熙。

2.Pathway分析

根據(jù)挑選出的差異基因轧简,計(jì)算這些差異基因同Pathway 的超幾何分布關(guān)系,Pathway 分析會(huì)對(duì)每個(gè)有差異基因存在的pathway 返回一個(gè)p-value匾二,小的p 值表示差異基因在該pathway 中出現(xiàn)了富集哮独。
  
pathway 分析對(duì)實(shí)驗(yàn)結(jié)果有提示的作用拳芙,通過差異基因的Pathway 分析,可以找到富集差異基因的Pathway 條目皮璧,尋找不同樣品的差異基因可能和哪些細(xì)胞通路的改變有關(guān)舟扎。與GO 分析不同,pathway 分析的結(jié)果更顯得間接悴务,這是因?yàn)槎孟蓿琾athway 是蛋白質(zhì)之間的相互作用,pathway 的變化可以由參與這條pathway 途徑的蛋白的表達(dá)量或者蛋白的活性改變而引起讯檐。而通過芯片結(jié)果得到的是編碼這些蛋白質(zhì)的mRNA 表達(dá)量的變化邦泄。從mRNA 到蛋白表達(dá)還要經(jīng)過microRNA 調(diào)控,翻譯調(diào)控裂垦,翻譯后修飾(如糖基化顺囊,磷酸化),蛋白運(yùn)輸?shù)纫幌盗械恼{(diào)控過程蕉拢,mRNA 表達(dá)量和蛋白表達(dá)量之間往往不具有線性關(guān)系特碳,因此mRNA 的改變不一定意味著蛋白表達(dá)量的改變。
  
同時(shí)也應(yīng)注意到晕换,在某些pathway 中午乓,如EGF/EGFR 通路,細(xì)胞可以在維持蛋白量不變的情況下闸准,通過蛋白磷酸化程度的改變(調(diào)節(jié)蛋白的活性)來調(diào)節(jié)這條通路益愈。所以芯片數(shù)據(jù)pathway 分析的結(jié)果需要有后期蛋白質(zhì)功能實(shí)驗(yàn)的支持,如Western blot/ELISA夷家,IHC(免疫組化)蒸其,over expression(過表達(dá)),RNAi(RNA 干擾)库快,knockout(基因敲除)摸袁,trans gene(轉(zhuǎn)基因)等。

3.基因網(wǎng)絡(luò)分析

目的:根據(jù)文獻(xiàn)义屏,數(shù)據(jù)庫和已知的pathway 尋找基因編碼的蛋白之間的相互關(guān)系(不超過1000 個(gè)基因)靠汁。

GO數(shù)據(jù)的分析

GO官網(wǎng)的Term enrichment services提供豐富的GO terms分析,可以幫助研究者找到所提交的基因集中是否具有共同的GO術(shù)語或者有共同的上級(jí)GO術(shù)語(某些基因都在某個(gè)GO術(shù)語子集里)闽铐,以幫助發(fā)現(xiàn)哪些輸入基因可能具有某些共同特點(diǎn)(比如說都在某個(gè)催化反應(yīng)中起作用蝶怔,都是某類細(xì)胞器的組成成分,都在某個(gè)通路里執(zhí)行功能等)兄墅。

當(dāng)然踢星,也許我們發(fā)現(xiàn)了(獲得了)一些基因,想知道他在某一個(gè)物種里在哪些部分發(fā)揮功能察迟,他在GO術(shù)語庫中歸屬于哪一個(gè)目錄層次斩狱,這時(shí)GO富集就起作用了。

到哪里找呢扎瓶?

打開GO的官網(wǎng)tools菜單欄里邊選擇對(duì)應(yīng)的工具即可所踊,如下圖所示:

640.jpg

實(shí)例展示

以下為實(shí)例展示GO數(shù)據(jù)庫自帶富集功能,以具體感覺富集的含義:

下面以一份蛋白質(zhì)ID集為例概荷,命名為protein.txt秕岛,格式為每行一個(gè)蛋白質(zhì)ID,
分別使用GO官網(wǎng)提供的兩個(gè)在線分析工具(下圖藍(lán)線)展示


740.jpg
展示一:GO slimmer

設(shè)置如下:


840.jpg

上述設(shè)置你要研究的目標(biāo)基因或基因產(chǎn)物集(protein.txt)误证,基因ID的格式為UniProtKB,要研究的GO參考集(背景集)是宏基因GO條目继薛,提交,等待結(jié)果愈捅。
結(jié)果展示:


940.jpg

生物過程遏考、細(xì)胞組分或者分子功能三大類里的GO術(shù)語選一個(gè),
選擇后具體信息如下:
術(shù)語信息:


640.jpg

本術(shù)語相關(guān)的術(shù)語:
640 (1).jpg

可以用不同形式展示蓝谨,選擇圖表展示(graph view)如下:
740.jpg

在QuickGO里邊查看:

子術(shù)語(Child Terms)灌具,注釋等條目也都會(huì)一一列出來,更多信息各位可以自己去試試譬巫,在此以祖先圖表(Ancestor Chart)為例展示:

可以看到祖先圖表(Ancestor Chart)一欄咖楣,點(diǎn)選表格選項(xiàng)(chart options)可以看到更詳細(xì)的圖標(biāo)內(nèi)容,如下:


90.jpg

局部放大如下:


91.jpg

可以看到各個(gè)GO term子集的GO ID以及GO功能芦昔,連線的不同顏色代表不同的隸屬關(guān)系诱贿,方框中的顏色條也代表不同物種等屬性,這個(gè)具體的說明圖例已經(jīng)給出來了咕缎,如下:


92.jpg
展示二:Enrichment analysis
93.jpg

提交珠十,結(jié)果如下:
點(diǎn)選圖標(biāo),可以以圖表格式查看凭豪,比如選擇通路(pathway)


94.jpg

可以看到protein.txt里的蛋白質(zhì)在這么多通路中起作用宵睦,最顯著的是黃顏色這個(gè)蛋白質(zhì),可以說顯著表達(dá)了墅诡。

其他的選項(xiàng)比如功能分類:


666.jpg

Protein.txt里的蛋白主要還是起結(jié)合蛋白作用(對(duì)應(yīng)歸類到binding這一GO術(shù)語中)的壳嚎。GO數(shù)據(jù)庫提供了其他幾項(xiàng)選項(xiàng),想要詳細(xì)了解的可以自己試一下末早。

總結(jié)

Gene Ontology(GO)包含了基因參與的生物過程烟馅,所處的細(xì)胞位置,發(fā)揮的分子功能三方面功能信息然磷,并將概念粗細(xì)不同的功能概念組織成DAG(有向無環(huán)圖)的結(jié)構(gòu)郑趁。GO常用于提供基因功能分類標(biāo)簽和基因功能研究的背景知識(shí)。利用GO的知識(shí)體系和結(jié)構(gòu)特點(diǎn)姿搜,旨在發(fā)掘與基因差異表達(dá)現(xiàn)象關(guān)聯(lián)的單個(gè)特征基因功能類或多個(gè)特征功能類的組合寡润。

GO富集可以提供基因差異篩選的候選集捆憎,也可以幫助了解前景基因集在功能上的富集,得出基因潛在的可能功能梭纹《愣瑁可以幫助研究者找到所提交的基因集中是否具有共同的GO術(shù)語或者有共同的上級(jí)GO術(shù)語(某些基因都在某個(gè)GO術(shù)語子集里),以幫助發(fā)現(xiàn)哪些輸入基因可能具有某些共同特點(diǎn)(比如說都在某個(gè)催化反應(yīng)中起作用变抽,都是某類細(xì)胞器的組成成分础拨,都在某個(gè)通路里執(zhí)行功能等)。

原文:GO富集分析

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末绍载,一起剝皮案震驚了整個(gè)濱河市诡宗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌击儡,老刑警劉巖塔沃,帶你破解...
    沈念sama閱讀 217,084評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異阳谍,居然都是意外死亡芳悲,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門边坤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來名扛,“玉大人,你說我怎么就攤上這事茧痒“谷停” “怎么了?”我有些...
    開封第一講書人閱讀 163,450評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵旺订,是天一觀的道長(zhǎng)弄企。 經(jīng)常有香客問我,道長(zhǎng)区拳,這世上最難降的妖魔是什么拘领? 我笑而不...
    開封第一講書人閱讀 58,322評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮樱调,結(jié)果婚禮上约素,老公的妹妹穿的比我還像新娘。我一直安慰自己笆凌,他們只是感情好圣猎,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,370評(píng)論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著乞而,像睡著了一般送悔。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,274評(píng)論 1 300
  • 那天欠啤,我揣著相機(jī)與錄音荚藻,去河邊找鬼。 笑死洁段,一個(gè)胖子當(dāng)著我的面吹牛应狱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播眉撵,決...
    沈念sama閱讀 40,126評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼侦香,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼落塑!你這毒婦竟也來了纽疟?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,980評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤憾赁,失蹤者是張志新(化名)和其女友劉穎污朽,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體龙考,經(jīng)...
    沈念sama閱讀 45,414評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蟆肆,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,599評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了晦款。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片炎功。...
    茶點(diǎn)故事閱讀 39,773評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖缓溅,靈堂內(nèi)的尸體忽然破棺而出蛇损,到底是詐尸還是另有隱情,我是刑警寧澤坛怪,帶...
    沈念sama閱讀 35,470評(píng)論 5 344
  • 正文 年R本政府宣布淤齐,位于F島的核電站,受9級(jí)特大地震影響袜匿,放射性物質(zhì)發(fā)生泄漏更啄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,080評(píng)論 3 327
  • 文/蒙蒙 一居灯、第九天 我趴在偏房一處隱蔽的房頂上張望祭务。 院中可真熱鬧,春花似錦怪嫌、人聲如沸待牵。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽缨该。三九已至,卻和暖如春川背,著一層夾襖步出監(jiān)牢的瞬間贰拿,已是汗流浹背蛤袒。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評(píng)論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留膨更,地道東北人妙真。 一個(gè)月前我還...
    沈念sama閱讀 47,865評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像荚守,于是被迫代替她去往敵國和親珍德。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,689評(píng)論 2 354