無痛解決基因全稱與縮寫的轉(zhuǎn)換

“山窮水盡疑無路昌妹,柳暗花明又一村”

某天捶枢,想收集一類藥物的作用靶點,上了Drugbank獲取了全部數(shù)據(jù)飞崖,加載到R中烂叔,解析出來后蒙圈了,它居然一個基因靶點對應(yīng)了多個名稱固歪。這就很為難了蒜鸡。
怎么從基因全稱獲取它的縮寫呢?
我知道Uniprot可以弄牢裳,但小白一個個輸入查詢逢防,那就很痛苦了!

能不能從基因的全稱來批量獲取其縮寫呢蒲讯?

org.Hs.eg.db包可以做忘朝!
代碼如下:

library(org.Hs.eg.db)#org.Hs.eg.db 是用于geneID轉(zhuǎn)換的包。物種為人類判帮。Bioconductor上還有提供其他物種的局嘁。
eg2Symbol=toTable(org.Hs.egSYMBOL)##將包中g(shù)ene_symbol轉(zhuǎn)換成數(shù)據(jù)框
eg2name=toTable(org.Hs.egGENENAME)##將包中GENENAME轉(zhuǎn)換成數(shù)據(jù)框
anno=merge(eg2Symbol,eg2name,by='gene_id')#根據(jù)gene_id合并兩個數(shù)據(jù)框
genes=read.table('symbol.txt',stringsAsFactors = F)[,1]##導(dǎo)入自己的gene數(shù)據(jù)
anno[match(genes,anno$gene_name),]##match函數(shù)匹配索引,獲得自己的數(shù)據(jù)在包中整出來的數(shù)據(jù)框中的行位置
write.csv(anno[match(genes,anno$symbol),],'symbol2name.csv')##寫出文件0
#首字母轉(zhuǎn)小寫
cap_low <- function (string) {
  
  capped <- grep("^[A-Z]", string, invert = F)
  substr(string[capped], 1, 1) <- tolower(substr(string[capped], 
                                                 1, 1))
  return(string)
}

代碼里面很巧妙地用了兩次Totable函數(shù),雖然還不太懂它的作用晦墙,但好不好用导狡,看效果,一運行就得到了基因和全稱對應(yīng)的數(shù)據(jù)框偎痛。
這樣的數(shù)據(jù)放到R里可是輕輕松松可以認識的!

OK旱捧,之后導(dǎo)入數(shù)據(jù)執(zhí)行代碼。
幾秒鐘,瞬間無痛解決基因從全稱到縮寫的轉(zhuǎn)換問題枚赡!
雖然Drugbank有點坑氓癌,有些基因全稱因為和包中提供的全稱不一致所有沒辦法匹配上,但總算是最大程度解決了我的困惑贫橙。


此外贪婉,讀了下生信菜鳥團的相關(guān)推文,發(fā)現(xiàn)這個包還有其他轉(zhuǎn)換的用法卢肃。
看一眼包中的所含的信息

keytypes(org.Hs.eg.db)#包里面有的數(shù)據(jù)注釋類別共有26個
# [1] "ACCNUM"       "ALIAS"        "ENSEMBL"    "ENSEMBLPROT"  "ENSEMBLTRANS" "ENTREZID"    
 #[7] "ENZYME"       "EVIDENCE"     "EVIDENCEALL"  "GENENAME"     "GO"           "GOALL"       
#[13] "IPI"          "MAP"          "OMIM"         "ONTOLOGY"     "ONTOLOGYALL"  "PATH"        
#[19] "PFAM"         "PMID"         "PROSITE"      "REFSEQ"       "SYMBOL"       "UCSCKG"      
#[25] "UNIGENE"      "UNIPROT"  

比如疲迂,可以借助select函數(shù)從ENSG0編號或是ENTREZID獲取對應(yīng)的基因名稱及全稱。當(dāng)然從基因的名稱或者全稱反過來獲取前兩者也是可以的莫湘。
select函數(shù)的結(jié)構(gòu)
select(org.Hs.eg.db, keys= , columns= , keytype=" ")

##例如 想通過基因全稱獲取它的縮寫和ENTREZID 尤蒿。這里的基因名就是keytype 
ensids <- c("tumor protein p53")#基因的全稱
cols <- c("SYMBOL","ENTREZID")#想提取的包中含有的相應(yīng)信息所在的列
select(org.Hs.eg.db, keys=ensids, columns=cols, keytype="GENENAME")##keytype設(shè)置輸入的類型。這里是基因的名字幅垮。

bingo!運行完的結(jié)果


image.png

以此類推腰池,要獲取什么類別的信息,只要改函數(shù)中數(shù)據(jù)的key忙芒、colums對象示弓,和keytype就好了!


最后呵萨,飲水思源奏属,附上技能樹相關(guān)鏈接!
課程分享
生信技能樹全球公益巡講
https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末潮峦,一起剝皮案震驚了整個濱河市囱皿,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌跑杭,老刑警劉巖铆帽,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異德谅,居然都是意外死亡爹橱,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進店門窄做,熙熙樓的掌柜王于貴愁眉苦臉地迎上來愧驱,“玉大人,你說我怎么就攤上這事椭盏∽檠猓” “怎么了?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵掏颊,是天一觀的道長糟红。 經(jīng)常有香客問我艾帐,道長,這世上最難降的妖魔是什么盆偿? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任柒爸,我火速辦了婚禮,結(jié)果婚禮上事扭,老公的妹妹穿的比我還像新娘捎稚。我一直安慰自己,他們只是感情好求橄,可當(dāng)我...
    茶點故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布今野。 她就那樣靜靜地躺著,像睡著了一般罐农。 火紅的嫁衣襯著肌膚如雪条霜。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天啃匿,我揣著相機與錄音蛔外,去河邊找鬼蛆楞。 笑死溯乒,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的豹爹。 我是一名探鬼主播裆悄,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼臂聋!你這毒婦竟也來了光稼?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤孩等,失蹤者是張志新(化名)和其女友劉穎艾君,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體肄方,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡冰垄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了权她。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片虹茶。...
    茶點故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖隅要,靈堂內(nèi)的尸體忽然破棺而出蝴罪,到底是詐尸還是另有隱情,我是刑警寧澤步清,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布要门,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏欢搜。R本人自食惡果不足惜询微,卻給世界環(huán)境...
    茶點故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望狂巢。 院中可真熱鬧撑毛,春花似錦、人聲如沸唧领。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽斩个。三九已至胯杭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間受啥,已是汗流浹背做个。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留滚局,地道東北人居暖。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子憔杨,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,630評論 2 359