學(xué)習(xí)g:Profiler基因功能富集分析軟件

g:Profiler主要有四個(gè)可選工具:


g:GOSt用于分析 flat or ranked gene lists以獲得富集特征腺办;

g:Conver用于轉(zhuǎn)換不同類(lèi)別的基因標(biāo)識(shí)符;

g:Orth用于將基因映射到相關(guān)物種中的直系同源基因

g:SNPense抹恳,它將SNP(單核苷酸多態(tài)性)映射到基因名稱(chēng)撕捍,染色體位點(diǎn)和來(lái)自 Sequence Ontology 的 variant consequence terms中钞翔。

g:Profiler除了網(wǎng)頁(yè)版(g:Profiler – a web server for functional enrichment analysis and conversions of gene lists)以外黑忱,還支持CRAN的R 包:gProfileR


g:Profiler使用Fisher精確檢驗(yàn)分析基因列表,并使用修改的Fisher檢驗(yàn)對(duì)基因列表進(jìn)行排列袄膏。它提供了圖形Web界面践图,并可以通過(guò)R和Python編程語(yǔ)言進(jìn)行訪(fǎng)問(wèn)。該軟件更新速度快沉馆,并且gene set database可以以GMT為文件被下載码党。GMT文件是ZIP格式的壓縮包,包含了g:Profiler使用的所有基因集斥黑。

下面使用g:Profiler的g:GOSt工具進(jìn)行g(shù)ene list的功能富集分析揖盘。它是g:Profiler的中心工具。 它將用戶(hù)提供的gene list 映射到各種功能信息來(lái)源锌奴,并確定顯著富集的通路兽狭,過(guò)程和其他注釋。g:GOSt支持基礎(chǔ)和生物醫(yī)學(xué)研究界使用的大多數(shù)基因標(biāo)識(shí)符鹿蜀,包括已鏈接到Ensembl database中的基因的所有標(biāo)識(shí)符箕慧,包括基因,蛋白質(zhì)茴恰,轉(zhuǎn)錄本销钝,基因組數(shù)據(jù)庫(kù)中的序列數(shù)等。

數(shù)據(jù)使用的是在12種類(lèi)型的3,200個(gè)腫瘤的TCGA外顯子組測(cè)序數(shù)據(jù)中鑒定的具有頻繁體細(xì)胞SNV(單核苷酸突變)的gene list

1. 將gene list 粘貼到Query下面的框中琐簇。


粘貼gene list

2.勾選Ordered query選項(xiàng),該選項(xiàng)將輸入視為有序基因列表,并在列表開(kāi)頭優(yōu)先考慮具有較高突變ES的基因婉商。


勾選odered query

3. 點(diǎn)開(kāi)Data source,Gene Ontology勾選下圖的兩個(gè)似忧。No electronic GO annotations選項(xiàng)將丟棄不經(jīng)過(guò)人工審核的不太可靠的GO注釋。


Data source展開(kāi)

4. 生物學(xué)通路選擇Reactome數(shù)據(jù)庫(kù)中的丈秩。


選擇pathway 數(shù)據(jù)庫(kù)

5. miRarBase數(shù)據(jù)庫(kù)用于miRNA的target分析盯捌,TRANSFAC是預(yù)測(cè)TF target的數(shù)據(jù)庫(kù)。TF target的預(yù)測(cè)使用的是TRANSFAC數(shù)據(jù)庫(kù)蘑秽,另一個(gè)用于miRNA target 分析饺著。


分析DNA redulatory motifs 需要用到的數(shù)據(jù)庫(kù)

6.下圖的這兩個(gè)數(shù)據(jù)庫(kù)Human Protein Atlas (HPA) 和CORUMd數(shù)據(jù)庫(kù)是用于蛋白質(zhì)復(fù)合物分析的。


用于蛋白質(zhì)復(fù)合物和蛋白質(zhì)與蛋白質(zhì)之間的相互作用分析

7.HP數(shù)據(jù)庫(kù)用于的生理和疾病表型的基因注釋?zhuān)试S用戶(hù)在人類(lèi)健康的背景下去闡述其基因列表肠牲。


人類(lèi)表型注釋數(shù)據(jù)庫(kù)

8.我在我輸入的數(shù)據(jù)中就在Data source中勾選的選項(xiàng)如下:


9.點(diǎn)開(kāi)Advanced Options如下圖:對(duì)于我輸入的數(shù)據(jù)幼衰,沒(méi)有勾選任何一項(xiàng),都是以默認(rèn)的方式進(jìn)行分析缀雳。


Advanced Options

10.設(shè)置完選項(xiàng)之后點(diǎn)擊Run query.就可以得到數(shù)據(jù)分析的結(jié)果渡嚣。


開(kāi)始進(jìn)行分析

11. 一會(huì)兒就可以看到結(jié)果,將頁(yè)面往下拉肥印,最先看到的是這樣一幅圖识椰。改圖可以以png格式的圖片保存到本地。該圖片中的每一個(gè)點(diǎn)代表一個(gè)基因

rerult

12. 點(diǎn)擊Detailed Results,可以看到詳細(xì)的結(jié)果深碱,如下圖:該熱圖中腹鹉,橫軸是基因名,縱軸是生物學(xué)通路敷硅,每一行代表一個(gè)通路上的基因集功咒。其中還有矯正后的p值和GO號(hào)


Detailed Results

該結(jié)果的保存方式有三種:GEM,PNG竞膳,和CSV.點(diǎn)擊GEM保存Enrichment Map分析所需要的輸入文件航瞭。Enrichment Map是對(duì)pathway富集分析結(jié)果進(jìn)行可視化的一個(gè)軟件,它是簡(jiǎn)化具有許多冗余過(guò)程和基因功能的復(fù)雜結(jié)果的有用方法坦辟。g:GOSt提供了一種特殊的輸出格式(GEM)刊侯,可以直接上傳到 Cytoscape 進(jìn)行可視化network分析。


保存GME格式的結(jié)果

13.點(diǎn)擊name.gmt下載g:Profiler分析時(shí)使用的所有基因集锉走。


下載gmt的ZIP壓縮包


gme文件內(nèi)容如下:

gme文件

下載的ZIP壓縮包里面有這些文件:


ZIP壓縮包


參考:

Reimand J , Arak T , Vilo J . g:Profiler--a web server for functional interpretation of gene lists (2011 update)[J]. Nucleic Acids Research,2011, 39(suppl):W307-W315.

學(xué)習(xí)文獻(xiàn):Reimand J, Isserlin R, Voisin V, et al. Pathway enrichment analysis and visualization of omics data using g:Profiler, GSEA, Cytoscape and EnrichmentMap[J]. Nature Protocols, 2019, 14(2): 482-517.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末滨彻,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子挪蹭,更是在濱河造成了極大的恐慌亭饵,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件梁厉,死亡現(xiàn)場(chǎng)離奇詭異辜羊,居然都是意外死亡踏兜,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)八秃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)碱妆,“玉大人,你說(shuō)我怎么就攤上這事昔驱≌钗玻” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵骤肛,是天一觀的道長(zhǎng)纳本。 經(jīng)常有香客問(wèn)我,道長(zhǎng)腋颠,這世上最難降的妖魔是什么繁成? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮秕豫,結(jié)果婚禮上朴艰,老公的妹妹穿的比我還像新娘。我一直安慰自己混移,他們只是感情好祠墅,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著歌径,像睡著了一般毁嗦。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上回铛,一...
    開(kāi)封第一講書(shū)人閱讀 48,954評(píng)論 1 283
  • 那天狗准,我揣著相機(jī)與錄音,去河邊找鬼茵肃。 笑死腔长,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的验残。 我是一名探鬼主播捞附,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼您没!你這毒婦竟也來(lái)了鸟召?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤氨鹏,失蹤者是張志新(化名)和其女友劉穎欧募,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體仆抵,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡跟继,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年种冬,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片还栓。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡碌廓,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出剩盒,到底是詐尸還是另有隱情,我是刑警寧澤慨蛙,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布辽聊,位于F島的核電站,受9級(jí)特大地震影響期贫,放射性物質(zhì)發(fā)生泄漏跟匆。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一通砍、第九天 我趴在偏房一處隱蔽的房頂上張望玛臂。 院中可真熱鬧,春花似錦封孙、人聲如沸迹冤。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)泡徙。三九已至,卻和暖如春膜蠢,著一層夾襖步出監(jiān)牢的瞬間堪藐,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工挑围, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留礁竞,地道東北人突梦。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓盏檐,卻偏偏與公主長(zhǎng)得像杀迹,于是被迫代替她去往敵國(guó)和親刃泌。 傳聞我的和親對(duì)象是個(gè)殘疾皇子卷哩,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容