將GO甫贯、Pathway富集結(jié)果整合在一張高顏值圓圈圖上

富集分析是生物醫(yī)學(xué)論文中非常常見的一類分析马靠,例如GO富集分析奄抽,Pathway富集分析等蔼两。其結(jié)果一般包括以下幾個(gè)要素:1,名字(GO term或者KEGG description)逞度;2额划,該名字所包含的基因數(shù)目;3档泽,該名字所包含的基因與進(jìn)行富集分析的輸入基因的重疊數(shù)目俊戳;4,富集的P值馆匿、FDR值等抑胎。富集結(jié)果的常見繪圖方式包括:氣泡圖,條形圖渐北,弦圖等圆恤。今天我們利用circlize R包整合富集結(jié)果,繪制一個(gè)高大上的圈圖腔稀。

圖1.GO盆昙、Pathway富集圈圖

如圖1所示,從外到內(nèi)共4個(gè)track焊虏,中間的為圖例(從上到下依次為:分類淡喜,p值,上調(diào)或者下調(diào))

1)分類track

相同顏色的為同一分類诵闭,例如黃色表示BP炼团,藍(lán)色表示MF,最外圈刻度表示總的基因數(shù)疏尿,10的次方表示瘟芝。總的基因數(shù)即圖2中所有黃色圈所包含的基因去重后的基因數(shù)褥琐,或者推薦使用比所有條目中基因數(shù)最大值更大的一個(gè)值(一般設(shè)置為整百或者整千)锌俱。

2)term里邊的基因數(shù)

矩形長(zhǎng)度表示該term中包含的基因數(shù)(例如GO:0031625這個(gè)term中包含306個(gè)基因),與最外圈的刻度成比例敌呈。矩形的顏色表示該term的富集p值(或者FDR值贸宏,q值等,經(jīng)過-log10轉(zhuǎn)化)磕洪,顏色越深表示P越小吭练。

3)重疊基因數(shù)

矩形長(zhǎng)度表示該term中包含的基因與進(jìn)行基因富集分析時(shí)所輸入的基因的重疊基因數(shù)。例如進(jìn)行富集分析的基因有500個(gè)析显,其中與GO:0031625中306個(gè)基因重疊的基因?yàn)?8個(gè)鲫咽。由于這個(gè)數(shù)字一般較小,因此矩形的長(zhǎng)度與該track中最的基因數(shù)成比例。一般我們要么使用up的基因分尸,要么使用down的基因進(jìn)行富集分析姊舵,因此這里僅一種顏色。

4)富集分?jǐn)?shù)bar

Bar的高度即第三個(gè)track里的基因數(shù)占第二個(gè)track里對(duì)應(yīng)基因數(shù)的比例(如圖2所示)寓落。數(shù)值范圍為0到1括丁,這里每個(gè)小圈表示0.2。

圖2. 基因數(shù)及比例來源示意圖

1伶选,打開繪圖頁面

首先史飞,使用瀏覽器(推薦chrome或者edge)打開富集圈圖繪制頁面。左側(cè)為常見作圖與分析導(dǎo)航仰税,中間為數(shù)據(jù)輸入框和可選參數(shù)构资,右側(cè)為描述和結(jié)果示例。也可以在主頁搜索框中搜索GO陨簇,找到繪圖頁面吐绵。

http://www.bioinformatics.com.cn/plot_basic_go_pathway_circlize_plot_140

圖3.富集圈圖繪圖頁面

2,示例數(shù)據(jù)

點(diǎn)擊右側(cè)“示例數(shù)據(jù)”鏈接下載excel格式的示例數(shù)據(jù)河绽。

圖4. 輸入數(shù)據(jù)示例

示例數(shù)據(jù)(僅供參考)包括7列:

第1列:GO或者KEGG條目ID己单。推薦使用ID,因?yàn)槊珠L(zhǎng)短不一耙饰,很難統(tǒng)一纹笼。

第2列:分類名」豆颍可以包含1類廷痘,2類,3類件已,或者4類笋额,例如單獨(dú)繪制KEGG通路富集結(jié)果;同時(shí)繪制GO-BP篷扩,KEGG兄猩;同時(shí)繪制BP、CC瞻惋、MF厦滤;甚至同時(shí)繪制BP援岩、CC歼狼、MF、KEGG享怀。同一分類放在一起羽峰,不要相互穿插。

第3列:總基因數(shù)∶诽耄總基因數(shù)即圖2中所有黃色圈所包含的基因去重后的基因數(shù)值纱,或者推薦使用比所有條目中基因數(shù)最大值更大的一個(gè)值。例如第4列中最大的數(shù)值是470坯汤,這里可以使用1200虐唠,用來從整體上控制第二個(gè)track的矩形長(zhǎng)度,是一個(gè)比較松散的值(一般設(shè)置為整百或者整千)惰聂。

第4列:數(shù)據(jù)庫中某term包含的基因數(shù)疆偿。在使用同一個(gè)數(shù)據(jù)庫版本的情況下,這個(gè)數(shù)值是固定不變的搓幌,例如GO:0010498里邊就包含470個(gè)基因杆故。

第5列:某term富集的p值(或者q值,F(xiàn)DR值等)溉愁。

第6列:做富集分析時(shí)輸入的基因與該term中包含基因的重疊基因數(shù)(見圖2)处铛。

第7列:第6列與第4列的比值(見圖2)。

3拐揭,粘貼示例數(shù)據(jù)

直接復(fù)制示例數(shù)據(jù)中的A-G列數(shù)據(jù)撤蟆,然后粘貼到輸入框。

圖5. 必需輸入

注意:不是拷貝excel文件堂污,是拷貝excel文件里邊的數(shù)據(jù)枫疆。另外粘貼到輸入框后,格式亂了沒關(guān)系敷鸦,只要在excel中是整齊的就行息楔。并且數(shù)據(jù)矩陣中不能有空的單元格,中文字符等扒披。

4值依,修改參數(shù),并提交

我們?cè)O(shè)置了圖片尺寸碟案,字體大小愿险,顏色,字體類型等參數(shù)价说,基本能滿足日常繪圖使用辆亏。如需更高級(jí)的定制,請(qǐng)聯(lián)系我們鳖目。

圖6.字體扮叨、顏色等可調(diào)參數(shù)

5,提交出圖

粘貼好輸入數(shù)據(jù)领迈,調(diào)整好參數(shù)(或者全部默認(rèn))后彻磁,點(diǎn)擊提交按鈕碍沐,約8秒后,會(huì)在頁面右側(cè)出現(xiàn)預(yù)覽圖衷蜓。我們提供了4種圖片格式供下載使用,兩種矢量圖(pdf斋陪,svg)和兩種標(biāo)量圖(600 dpi?tiff和300 dpi?png)。

圖7.預(yù)覽與下載

Tips:

1鳍贾,該圖最大限度地利用有限的空間展示更多的數(shù)據(jù)內(nèi)容。因此條目不能過多交洗,推薦總共30個(gè)以內(nèi)的GO和KEGG條目骑科,否則太擁擠。

2构拳,第4個(gè)track最大值默認(rèn)為1.0置森,可以修改成其他值斗埂,以整體上降低或者降低柱子的高度。

3凫海,一般我們使用up或者down的基因做富集分析呛凶,對(duì)于使用up+down富集結(jié)果不適合這個(gè)圖。

4行贪,對(duì)于DAVID等富集分析結(jié)果,各列的名字可能不一樣啰脚,需要根據(jù)數(shù)值代表的意思調(diào)整成示例數(shù)據(jù)即可橄浓。

沒有預(yù)覽就是沒有出圖宴猾,這時(shí)請(qǐng)參考示例數(shù)據(jù),檢查自己輸入數(shù)據(jù)的格式。

遇到文字截?cái)嗳沓郏枰薷淖煮w戴已、調(diào)整字體大小等,使用科研作圖實(shí)操:用inkscape編輯svg矢量圖

微生信助力高分文章锅减,用戶67000,引用880

?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末劫狠,一起剝皮案震驚了整個(gè)濱河市拴疤,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌独泞,老刑警劉巖呐矾,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異懦砂,居然都是意外死亡蜒犯,警方通過查閱死者的電腦和手機(jī)组橄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來罚随,“玉大人玉工,你說我怎么就攤上這事√云校” “怎么了遵班?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)潮改。 經(jīng)常有香客問我狭郑,道長(zhǎng),這世上最難降的妖魔是什么汇在? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任翰萨,我火速辦了婚禮,結(jié)果婚禮上糕殉,老公的妹妹穿的比我還像新娘亩鬼。我一直安慰自己,他們只是感情好糙麦,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布辛孵。 她就那樣靜靜地躺著,像睡著了一般赡磅。 火紅的嫁衣襯著肌膚如雪魄缚。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天焚廊,我揣著相機(jī)與錄音冶匹,去河邊找鬼。 笑死咆瘟,一個(gè)胖子當(dāng)著我的面吹牛嚼隘,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播袒餐,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼飞蛹,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了灸眼?” 一聲冷哼從身側(cè)響起卧檐,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎焰宣,沒想到半個(gè)月后霉囚,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡匕积,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年盈罐,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了榜跌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡盅粪,死狀恐怖钓葫,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情湾揽,我是刑警寧澤瓤逼,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布笼吟,位于F島的核電站库物,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏贷帮。R本人自食惡果不足惜戚揭,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望撵枢。 院中可真熱鬧民晒,春花似錦、人聲如沸锄禽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽沃但。三九已至磁滚,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間宵晚,已是汗流浹背垂攘。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留淤刃,地道東北人晒他。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像逸贾,于是被迫代替她去往敵國和親陨仅。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容