?前幾天有個(gè)客戶給過來一個(gè)需求,簡(jiǎn)單說就是一堆基因列表附帶數(shù)值,需要將其按照數(shù)值不同涂色在KEGG pathway上解孙。
?????? 這個(gè)活兒我還真沒干過,記得KEGG官網(wǎng)上有工具抛人,去看了一下弛姜,現(xiàn)在叫KEGG mapper,弄了半天居然沒弄懂妖枚。
?????? 算了廷臼,換個(gè)別的工具吧。
記得clusterProfiler包里有涂色工具绝页,去查了下荠商,是來源于pathview包的,于是看了下后者续誉,這個(gè)包其實(shí)主要就一個(gè)函數(shù)就叫pathview莱没,大致研究了一下,連參數(shù)詳情都沒有遍覽呢酷鸦,反正不需要畫compound什么的饰躲,試了幾下畫成功了牙咏,就把代碼記錄下來。
?????? 以后有更復(fù)雜的需求再研究一下這個(gè)包吧嘹裂。
?????? pathview包可以畫(涂色)兩類圖妄壶,一類是KEGG pathway map,另一類是使用Gviz包畫的圖寄狼。Gviz我還沒開始學(xué)習(xí)呢丁寄,先擱置,反正目前無此需求泊愧。
?????? 我的數(shù)據(jù)整理了一下伊磺,共兩列。第一列為Entrez ID拼卵,第二列為基因數(shù)值,在此處它的范圍是-90~90蛮艰。物種為大鼠腋腮。
?????? 先以cell cycle這個(gè)pathway為例來畫圖吧,map id為04110壤蚜。
?????? pathview函數(shù)要求的輸入數(shù)據(jù)為vector或者matrix即寡,vector是單樣本時(shí)的數(shù)據(jù),元素名稱就是gene ID袜刷。matrix適用于多樣本情況下聪富。
?????? 這里一個(gè)樣本我照樣用matrix吧。
?????? 代碼如下:
>library(pathview)
>demo<-read.table(file="demo.txt",sep="\t",,header= TRUE)
#demo數(shù)據(jù)為兩列著蟹,第一列為EntrezID墩蔓,第二列為基因變化數(shù)據(jù)
>head(demo)
>rownames(demo)<-demo[,1]
#將行命名為EntrezID
>head(demo)
>demo.data<-data.matrix(demo)
>class(demo.data)
>pv.out<-pathview(gene.data=demo.data[,2],pathway.id="04110",species="rno",limit=list(gene=90),out.suffix="demo")
#limit = list(gene=90) 是指定色階范圍為-90~90,不指定時(shí)默認(rèn)為-1~1萧豆。#若色階范圍是-100~50奸披,則可以指定為limit = list(gene=c(-100,50)
這樣,一個(gè)pathway的涂色就完成了涮雷,結(jié)果如圖阵面。
網(wǎng)上找到一篇很好的教程,地址是https://www.bioinfo-scrounger.com/archives/639/
今天先把這個(gè)活兒完成洪鸭,以后有機(jī)會(huì)好好研究一下這個(gè)包样刷,連同Gviz什么的一起搞定。