歡迎關(guān)注生信寶典翁巍,獲取更好閱讀體驗(yàn)裙品。??
功能富集泡泡圖
功能富集分析用來展示某一組基因(一般是單個樣品上調(diào)或下調(diào)的基因)傾向參與哪些功能調(diào)控通路堤器,對從整體理解變化了的基因的功能和潛在的調(diào)控意義具有指導(dǎo)作用愤估,也是文章發(fā)表中一個有意義的美圖。通常會用柱狀圖肴楷、泡泡圖和熱圖進(jìn)行展示茬暇。熱圖的畫法之前已經(jīng)介紹過首昔,這次介紹下富集分析泡泡圖,
其展示的信息是最為全面的,也是比較抓人眼球的糙俗。
做基因功能富集分析勒奇、KEGG富集分析、GSEA分析首選clusterProfilerhttp://mp.weixin.qq.com/s/9M3lprc3rL6XII3ffpDHAw巧骚,Y叔的良心之作赊颠,數(shù)據(jù)集更新及時格二,結(jié)果準(zhǔn)確,自帶語義分析合并相似條目竣蹦、出圖漂亮顶猜。
但有時出來的結(jié)果還需要進(jìn)行一些篩選處理然后重新繪圖,本文就介紹下如何根據(jù)clusterProfiler的輸出結(jié)果繪制富集分析圖痘括。本文雖主推clusterProfiler, 但繪圖方法適用于所有富集分析的輸出結(jié)果长窄。
一步繪制富集分析圖
假設(shè)有這么一個富集分析結(jié)果矩陣 (文件名為GOenrichement.xls) 存儲了EHBIO樣品和Baodian樣品中各自上調(diào)的基因富集的通路。
Description 為GO通路的描述纲菌,也可以是KEGG通路挠日。
GeneRatio 為對應(yīng)通路差異基因占總差異基因的比例,本列可以用分?jǐn)?shù)或小數(shù)表示翰舌,都可以處理嚣潜。
qvalue 表示對應(yīng)通路富集的顯著性程度,可以是log處理過的椅贱,也可以是原始的懂算。
Count 為對應(yīng)通路差異基因數(shù)目。
Type 這個矩陣合并了EHBIO樣品和Baodian樣品中各自上調(diào)的基因富集的通路庇麦,用Type列做區(qū)分计技。如果只有一個樣品可不要。
考慮到手機(jī)屏幕小能顯示的字符有限山橄,只保留了輸出結(jié)果中用到的列酸役,實(shí)際使用時,整個輸出結(jié)果文件可以作為輸入驾胆,不相關(guān)的列會忽略掉,不影響出圖贱呐。
Description GeneRatio qvalue Count Type
ERBB signaling pathway 7/320 0.001836081 7 EHBIO_up
regulation of ERBB signaling pathway 5/320 0.003886659 5 EHBIO_up
negative regulation of cell cycle G1/S phase transition 4/320 0.016153254 4 EHBIO_up
Wnt signaling pathway 13/320 0.01680096 13 EHBIO_up
cell-cell signaling by wnt 13/320 0.0171473 13 EHBIO_up
negative regulation of cell cycle process 8/320 0.019453085 8 EHBIO_up
extrinsic apoptotic signaling pathway 9/320 0.024164034 9 EHBIO_up
positive regulation of extrinsic apoptotic signaling pathway 4/320 0.025708228 4 EHBIO_up
cell cycle G1/S phase transition 7/320 0.035797856 7 EHBIO_up
negative regulation of apoptotic signaling pathway 8/320 0.038684745 8 EHBIO_up
regulation of Notch signaling pathway 4/320 0.041592045 4 EHBIO_up
regulation of cell cycle G1/S phase transition 5/320 0.047407619 5 EHBIO_up
negative regulation of BMP signaling pathway 3/320 0.049460847 3 EHBIO_up
regulation of ERK1 and ERK2 cascade 14/342 0.000629602 14 Baodian_up
positive regulation of cell adhesion 17/342 0.000827275 17 Baodian_up
ERK1 and ERK2 cascade 14/342 0.001086508 14 Baodian_up
regulation of cell growth 17/342 0.002228511 17 Baodian_up
positive regulation of cytoskeleton organization 10/342 0.004406867 10 Baodian_up
regulation of cell-cell adhesion 15/342 0.005075219 15 Baodian_up
regulation of cytoskeleton organization 15/342 0.019685646 15 Baodian_up
negative regulation of Notch signaling pathway 3/342 0.020578211 3 Baodian_up
neuron apoptotic process 10/342 0.040284925 10 Baodian_up
繪圖用到的腳本名字為sp_enrichmentPlot.sh, 首先看看它的使用方法和出圖效果丧诺。
單樣品分開繪制
示例矩陣中包含兩個樣品上調(diào)基因的富集通路,現(xiàn)在先取出一個樣品繪制奄薇。
Linux命令不熟悉的去生信寶典文章集錦中查看Linux學(xué)習(xí)指南
grep -v'Baodian_up'GOenrichement.xls >GOenrichement.ehbio.xls
# -f: 指定輸入文件驳阎,格式如上面描述# -o: 指定橫軸的變量,單個樣品一般選擇GeneRatio或樣品名字# -T: 指定橫軸變量的類似馁蒂,是字符串還是數(shù)值# -v: 指定Y軸顯示的內(nèi)容呵晚,一般為富集條目的描述# -c: 指定用哪一列設(shè)置顏色展示,一般為qvalue或p.adjust# -s: 指定用哪一列設(shè)置點(diǎn)的大小沫屡,一般為Count# -l: 指定某一列進(jìn)行對數(shù)操作饵隙,一般選qvalue列;如果已做過對數(shù)操作沮脖,則忽略# -a: 設(shè)置圖片輸出高度# -x, -y: 設(shè)置橫軸和縱軸標(biāo)題金矛,注意多個單詞需要引號括起來
sp_enrichmentPlot.sh -f GOenrichement.ehbio.xls -o GeneRatio -T numeric -v Description -c qvalue -s Count -l qvalue -a 12 -x"GeneRatio"-y"GO description"
如果不想展示GeneRatio也可以芯急。
# -o: 指定橫軸的變量,單個樣品一般選擇GeneRatio或樣品名字# -T: 如果是樣品名字驶俊,指定為字符串
sp_enrichmentPlot.sh -f GOenrichement.ehbio.xls -o Type -T string -v Description -c qvalue -s Count -l qvalue -a 12 -x"Sample"-y"GO description"
多樣品合并繪制
# 多出來的參數(shù)是-S用來指定樣品分組娶耍,不同類型的基因的富集分析用不同的形狀表示
sp_enrichmentPlot.sh -f GOenrichement.xls -o GeneRatio -T numeric -v Description -c qvalue -s Count -l qvalue -a 12 -x"GeneRatio"-y"GO description"-S Type
通過這張圖解釋下,富集分析的結(jié)果怎么解讀饼酿。富集分析實(shí)際是查找哪些通路里面包含的差異基因占總差異基因的比例顯著高于通路中總基因占所有已經(jīng)注釋的基因的比例榕酒。這一顯著性通常用多重假設(shè)檢驗(yàn)矯正過的pvalue(又稱qvalue, FDR或p.adjust)來表示。在圖中體現(xiàn)為點(diǎn)的顏色故俐。從綠到紅富集顯著性逐漸增高想鹰。點(diǎn)的大小表示對應(yīng)通路中包含的差異基因的數(shù)目。點(diǎn)的形狀代表了不同類型的基因购披,如EHBIO中上調(diào)的基因和Baodian中上調(diào)的基因杖挣。橫軸表示對應(yīng)通路包含的差異基因占總的差異基因的比例, 本圖中最高不過5%, 這個值越大說明通路被影響的越多。
如果不想展示GeneRatio也可以刚陡。
# 跟單個樣品不顯示GeneRatio的命令一樣惩妇,不同的樣品分列展示。sp_enrichmentPlot.sh -f GOenrichement.xls -o GeneRatio -T numeric -v Description -c qvalue -s Count -l qvalue -a 12 -x"GeneRatio"-y"GO description"-S Type
今天先到這筐乳,明天再對用到的R代碼進(jìn)行解讀歌殃。需要繪圖腳本的,還是請幫助轉(zhuǎn)發(fā)下蝙云,謝謝氓皱。
有了clusterProfiler富集分析神器,又有了enrichmentPlot.sh一鍵繪圖工具勃刨,得到了好的結(jié)果波材,是不是就能發(fā)出好文章呢? 看上去差不多了身隐,實(shí)際在有一個好的平臺廷区,發(fā)大文章,拿千萬獎金的機(jī)會就來了贾铝。
有這么一個人隙轻,有著駱駝般的耐力,三觀端正 (五官不可描述)垢揩,簡稱駱觀正玖绿。端正在以下三方面,
年少癡情叁巨,為了愛人斑匪,徒步南京
年青有為,一篇JBC解密體細(xì)胞重編程機(jī)理俘种,一篇Cell開創(chuàng)甲基化修飾新領(lǐng)域
年富力強(qiáng)秤标,曾經(jīng)的控球后衛(wèi)绝淡,猶如魔術(shù)師約翰遜,靈巧多姿苍姜;現(xiàn)在的中山大學(xué)博導(dǎo)牢酵,冉冉升起的表觀新星
還有兩觀令人發(fā)指
舍得給錢,博士后12-16萬衙猪,特聘副研19-25萬馍乙,而且還有數(shù)不清的績效
舍得給名,發(fā)表論文共通訊垫释,并有教授直通車機(jī)會
駱教授畢業(yè)于中科院遺傳所王秀杰老師實(shí)驗(yàn)室
(說到這兒丝格,就知道我為啥推薦他了),后隨RNA表觀修飾開創(chuàng)者芝加哥大學(xué)何川教授進(jìn)行博士后研究棵譬。2年內(nèi)一作出品Cell, Nature
Review, Nature Communications等多篇高水平論文显蝌,專注于RNA甲基化m6A和新型的DNA修飾6mA的研究。
回國后订咸,居安思危曼尊,開拓進(jìn)取
繼續(xù)DNA甲基化6mA的功能研究,已有數(shù)據(jù)支持其與核小體存在互作脏嚷,輔之以6mA reader的發(fā)現(xiàn)骆撇,又是一個有深遠(yuǎn)影響的科研成果和一篇領(lǐng)域的硬通貨。
研發(fā)低樣本量的單堿基RNA修飾識別技術(shù)父叙,推動RNA修飾在早期胚胎和腫瘤中的研究神郊,看看最近早期胚胎中DNA甲基化和組蛋白甲基化的CNS頻出,就知道這是一個人神向往的領(lǐng)域趾唱。RNA修飾的獨(dú)特性涌乳,使得只有部分實(shí)驗(yàn)室有這個能力去做,你來甜癞,機(jī)會就是你的爷怀。
CAS9這幾年一直很火,應(yīng)用CAS9改變DNA或RNA的m6A修飾對主動研究這些修飾的調(diào)控功能具有重要的科研意義和疾病的診治意義带欢。之前有報道m(xù)iRNA可以調(diào)控RNA上的m6A甲基化修飾,后續(xù)CAS9的跟進(jìn)將會促進(jìn)DNA/RNA修飾編輯的研究和拓展烤惊。
招兵選將乔煞,再創(chuàng)輝煌
分子生物學(xué)/生物化學(xué)方向博士后和特聘副研究員各一名
生物信息學(xué)方向博士后和特聘副研究員各一名
特聘副研究員:要求博士畢業(yè)3年以內(nèi),有兩項(xiàng)以上學(xué)術(shù)成果
博士后:要求應(yīng)屆博士畢業(yè)柒室,有至少一項(xiàng)學(xué)術(shù)成果
工資根據(jù)之前的研究基礎(chǔ)和經(jīng)歷來定渡贾。合同為年薪制,博士后年薪12至16萬雄右,特聘副研究員19-25萬空骚。優(yōu)秀者可有獨(dú)立辦公室纺讲,發(fā)表論文與合作導(dǎo)師共享通訊作者。
注:以上待遇為基本待遇囤屹,實(shí)驗(yàn)室將根據(jù)情況提供績效獎勵等熬甚。專職科研人員無明確教學(xué)任務(wù),可申請各類科研項(xiàng)目肋坚,優(yōu)秀者在聘期結(jié)束后或聘期內(nèi)可直接申報學(xué)校的教授/副教授位置乡括。
請將詳細(xì)簡歷(包括學(xué)歷、工作經(jīng)驗(yàn)智厌、發(fā)表文章等)通過電子郵件發(fā)至:luogzh5@mail.sysu.edu.cn請注明職位申請诲泌。
本招聘啟事長期有效。
Reference
http://blog.genesino.com/2017/07/enrichmentPlot
R繪圖學(xué)習(xí)
R語言學(xué)習(xí) ?- ?入門環(huán)境Rstudio
R語言學(xué)習(xí) ?- 熱圖繪制 ?(heatmap)
R語言學(xué)習(xí) ?- ?基礎(chǔ)概念和矩陣操作
R語言學(xué)習(xí) - 箱線圖(小提琴圖铣鹏、抖動圖敷扫、區(qū)域散點(diǎn)圖)
R語言學(xué)習(xí) - 富集分析泡泡圖 (文末有彩蛋)
文章集錦
Linux學(xué)習(xí)??R統(tǒng)計繪圖??Python教程??Perl學(xué)習(xí)
生信傻瓜??NGS持續(xù)更新中
(鏈接失效,點(diǎn)擊菜單知識庫查看)
關(guān)注生信寶典诚卸,換個角度學(xué)生信
關(guān)注宏基因組葵第,再專業(yè)一點(diǎn)