ID轉換大全-3-使用R語言獲取人類所有基因的名字结胀,ID,symbol以及別名

使用R語言獲取人類所有基因的名字永毅,ID把跨,symbol以及別名

參考https://vip.biotrainee.com/d/761-r-id-symbol

首先肯定是需要自行搜索了解 entrez gene ID, HUGO symbol, refseq ID, ensembl ID 這些專有名詞咯人弓。

然后直接把下面的代碼運行一下沼死,把輸出的all_gene_bioconductor.html文件好好看看, 就明白了崔赌。

rm(list=ls())
getwd()
library(org.Hs.eg.db)
eg2symbol=toTable(org.Hs.egSYMBOL)
eg2name=toTable(org.Hs.egGENENAME)
eg2alias=toTable(org.Hs.egALIAS2EG)
eg2alis_list=lapply(split(eg2alias,eg2alias$gene_id),function(x){paste0(x[,2],collapse = ";")})
GeneList=mappedLkeys(org.Hs.egSYMBOL)
if( GeneList[1] %in% eg2symbol$symbol ){
  symbols=GeneList
  geneIds=eg2symbol[match(symbols,eg2symbol$symbol),'gene_id']
}else{
  geneIds=GeneList
  symbols=eg2symbol[match(geneIds,eg2symbol$gene_id),'symbol']
}
geneNames=eg2name[match(geneIds,eg2name$gene_id),'gene_name']
geneAlias=sapply(geneIds,function(x){ifelse(is.null(eg2alis_list[[x]]),"no_alias",eg2alis_list[[x]])})

createLink <- function(base,val) {
  sprintf('<a href="%s" class="btn btn-link" target="_blank" >%s</a>',base,val) ##target="_blank" 
}
gene_info=data.frame(   symbols=symbols,
                        geneIds=createLink(paste0("http://www.ncbi.nlm.nih.gov/gene/",geneIds),geneIds),
                        geneNames=geneNames,
                        geneAlias=geneAlias,
                        stringsAsFactors = F
) 
#library("xtable") 
#print(xtable(gene_info), type="html",include.rownames=F, file='all_gene.anno',sanitize.text.function = force)
file='C:/Users/ljx/Desktop/programmelanguage/5years-master/ID_transfer/all_gene_bioconductor.html'

?
library(BiocManager)
BiocManager::install("DT")

library(DT)
y <- DT::datatable(gene_info,escape = F,rownames=F)
DT::saveWidget(y,file)

在輸出的文件里面可以搜索:

symbols geneIds geneNames geneAlias
EGFR 1956 epidermal growth factor receptor ERBB;ERBB1;HER1;NISBD2;PIG61;mENA;EGFR
ERBB2 2064 erb-b2 receptor tyrosine kinase 2 CD340;HER-2;HER-2/neu;HER2;MLN 19;NEU;NGL;TKR1;ERBB2
ERBB3 2065 erb-b2 receptor tyrosine kinase 3 ErbB-3;HER3;LCCS2;MDA-BF-1;c-erbB-3;c-erbB3;erbB3-S;p180-ErbB3;p45-sErbB3;p85-sErbB3;ERBB3
ERBB4 2066 erb-b2 receptor tyrosine kinase 4 ALS19;HER4;p180erbB4;ERBB4

可以看到意蛀,有趣的是 ERBB1家族的 ERBB1的正式名字就是大名鼎鼎的EGFR, 而 大名鼎鼎的HER-2 正式名字卻是ERBB2

其實基因名總是讓我困惑健芭,可能是我生物學基礎知識不夠扎實县钥,比如

  • SMARCA4 (BRG1; Santa Cruz Biotechnology, sc-17796, 1:300 dilution)
  • SMARCC2 (BAF170; Bethyl Laboratories, A301-039A, 1:1,000 dilution)
  • SMARCD1 (BAF60A; Bethyl Laboratories, A301-595A, 1:3,000 dilution), SMARCE1 (BAF57; Bethyl Laboratories, A300-810A, 1:3,000 dilution), SMARCB1 (SNF5; Bethyl Laboratories, A301-087A, 1:5,000 dilution), ACTL6A (BAF53A; Bethyl Laboratories, A301-391A, 1:3,000 dilution)

都是 SWI/SNF Related, Matrix Associated, Actin Dependent Regulator Of Chromatin,我是在genecard里面 檢查 SMARC發(fā)現(xiàn)的
http://www.genecards.org/Search/Keyword?queryString=SMARC
但是大部分文章里面卻總是使用它們的別名慈迈。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末若贮,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子痒留,更是在濱河造成了極大的恐慌谴麦,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,029評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件伸头,死亡現(xiàn)場離奇詭異匾效,居然都是意外死亡,警方通過查閱死者的電腦和手機恤磷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,395評論 3 385
  • 文/潘曉璐 我一進店門面哼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來野宜,“玉大人,你說我怎么就攤上這事魔策⌒僮樱” “怎么了?”我有些...
    開封第一講書人閱讀 157,570評論 0 348
  • 文/不壞的土叔 我叫張陵闯袒,是天一觀的道長旬牲。 經常有香客問我,道長搁吓,這世上最難降的妖魔是什么原茅? 我笑而不...
    開封第一講書人閱讀 56,535評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮堕仔,結果婚禮上擂橘,老公的妹妹穿的比我還像新娘。我一直安慰自己摩骨,他們只是感情好通贞,可當我...
    茶點故事閱讀 65,650評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著恼五,像睡著了一般昌罩。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上灾馒,一...
    開封第一講書人閱讀 49,850評論 1 290
  • 那天茎用,我揣著相機與錄音,去河邊找鬼睬罗。 笑死轨功,一個胖子當著我的面吹牛,可吹牛的內容都是我干的容达。 我是一名探鬼主播古涧,決...
    沈念sama閱讀 39,006評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼花盐!你這毒婦竟也來了羡滑?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,747評論 0 268
  • 序言:老撾萬榮一對情侶失蹤算芯,失蹤者是張志新(化名)和其女友劉穎柒昏,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體也祠,經...
    沈念sama閱讀 44,207評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡昙楚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,536評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了诈嘿。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片堪旧。...
    茶點故事閱讀 38,683評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡削葱,死狀恐怖,靈堂內的尸體忽然破棺而出淳梦,到底是詐尸還是另有隱情析砸,我是刑警寧澤,帶...
    沈念sama閱讀 34,342評論 4 330
  • 正文 年R本政府宣布爆袍,位于F島的核電站首繁,受9級特大地震影響,放射性物質發(fā)生泄漏陨囊。R本人自食惡果不足惜弦疮,卻給世界環(huán)境...
    茶點故事閱讀 39,964評論 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蜘醋。 院中可真熱鬧胁塞,春花似錦、人聲如沸压语。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,772評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽胎食。三九已至扰才,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間厕怜,已是汗流浹背衩匣。 一陣腳步聲響...
    開封第一講書人閱讀 32,004評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留酣倾,地道東北人舵揭。 一個月前我還...
    沈念sama閱讀 46,401評論 2 360
  • 正文 我出身青樓谤专,卻偏偏與公主長得像躁锡,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子置侍,可洞房花燭夜當晚...
    茶點故事閱讀 43,566評論 2 349

推薦閱讀更多精彩內容

  • ----前不久拿到公司給的轉錄組測序結果映之,Gene ID是以ENMUST開頭,查了一下蜡坊,ENST為EMBL 核酸數(shù)...
    佳名閱讀 66,782評論 17 44
  • 在進行測序數(shù)據(jù)下游分析的時候常常需要用到不同的數(shù)據(jù)庫杠输,而這些數(shù)據(jù)庫的分析的輸入文件經常是各有區(qū)別,因此我們常常需要...
    井底蛙蛙呱呱呱閱讀 13,798評論 1 20
  • 傍晚和折妹騎著共享單車去買水果秕衙,對于我這種生活經驗不足買水果只看“顏值”的人來說折妹真是生活的行家蠢甲,很會選...
    與風一起行走閱讀 164評論 0 1
  • 今天看了pathon程序的異常處理,異常處理:try-expect語句和異常的高級用法据忘。
    83700d631507閱讀 167評論 0 1
  • 昨天早上兒子請假沒有去學校鹦牛,下午早早去了搞糕,昨晚到今天劉軒祎的狀態(tài)不錯。 今天中午兒子催我吃完飯去買書曼追,他說:擔心他...
    菩提樹WO慧心閱讀 372評論 1 0