人鼠基因轉(zhuǎn)換

背景: 由于人和小鼠研究進(jìn)展差異抹竹,人類基因功能/注釋研究會更加深入,一些數(shù)據(jù)庫只有人的注釋稍算。又或者研究中通常采用小鼠模型進(jìn)行驗(yàn)證虱痕,這種情況下就會涉及一些基因 name / id 轉(zhuǎn)換。

下面就介紹下一般基因轉(zhuǎn)換方式钝尸,概括如下:

特殊基因 id/name 轉(zhuǎn)換: R包(biomaRt)

全基因組 id/name 轉(zhuǎn)換: 從Ensembl中直接下載對應(yīng)關(guān)系文件并進(jìn)行轉(zhuǎn)換

另一個(gè)有意思的R包(模式物種基因各大數(shù)據(jù)庫注釋查詢):? AnnotationDbi?

同源基因數(shù)據(jù)庫列表:?List of orthology databases

1. 基于R包(biomaRt)

安裝biomaRt包:

library("BiocManager")

BiocManager::install("biomaRt")

library("biomaRt")

listMarts()

##? ? ? ? ? ? ? biomart? ? ? ? ? ? ? ? version

##1 ENSEMBL_MART_ENSEMBL? ? ? Ensembl Genes 106

##2? ENSEMBL_MART_MOUSE? ? ? Mouse strains 106

##3? ? ENSEMBL_MART_SNP? Ensembl Variation 106

##4 ENSEMBL_MART_FUNCGEN Ensembl Regulation 106


小鼠基因轉(zhuǎn)人類基因:

library("biomaRt")

human = useEnsembl(biomart="ensembl", dataset = "hsapiens_gene_ensembl")

mouse = useEnsembl(biomart="ensembl", dataset = "mmusculus_gene_ensembl")

# Basic function to convert mouse to human gene names

convertMouseGeneList <- function(x){

? genesV2 = getLDS(attributes = c("mgi_symbol"), filters = "mgi_symbol", values = x , mart = mouse, attributesL = c("hgnc_symbol"), martL = human, uniqueRows=T)

? humanx <- unique(genesV2[, 2])

? # Print the first 6 genes found to the screen

? return(humanx)

}

musGenes <- c("Hmmr", "Tlx3", "Cpeb4")

convertMouseGeneList(musGenes)

## 測試

musGenes <- c("Hmmr", "Tlx3", "Cpeb4")

convertMouseGeneList(musGenes)

## [1] "HMMR" "CPEB4" "TLX3"

#將代轉(zhuǎn)換基因放在文件中括享,并讀取

mmu_genes =? read.table("Gene.mmu",header = TRUE,sep= "\t")

head(mmu_genes$Gene)

## [1] "Xkr4"? ? "Gm1992"? "Gm19938" "Rp1"? ? "Sox17"? "Gm37587"

報(bào)錯(cuò):

##Error: biomaRt has encountered an unexpected server error.

##Consider trying one of the Ensembl mirrors (for more details look at ?useEnsembl)

人類基因轉(zhuǎn)小鼠基因:

hsa = read.table("hsa.raw",header = TRUE,sep= "\t")

head(hsa)

##? ? Gene

##1? ? Xkr4

##2? Gm1992

convertHumanGeneList <- function(x){

? genesV2 = getLDS(attributes = c("hgnc_symbol"), filters = "hgnc_symbol", values = x , mart = human,? ? ? ? attributesL = c("mgi_symbol"), martL = mouse, uniqueRows=T)

? humanx <- unique(genesV2[, 2])

? # Print the first 6 genes found to the screen

? return(humanx)

}

humGenes <-hsa$Gene

convertHumanGeneList(humGenes)

## Error: biomaRt has encountered an unexpected server error.

##Consider trying one of the Ensembl mirrors (for more details look at ?useEnsembl)

經(jīng)過上述嘗試發(fā)現(xiàn),輸入部分基因 name list 轉(zhuǎn)換可以很好的完成珍促;拿全部基因組的gene name做轉(zhuǎn)換還是會出現(xiàn)問題铃辖,具體討論解決方案可見: 鏈接

2.?從Ensembl中直接下載對應(yīng)關(guān)系文件并進(jìn)行轉(zhuǎn)換

Step1:Enaembl 官網(wǎng)->BioMart; 選擇對應(yīng)基因組 : 鏈接

Step2: 屬性中選擇“Homologues”: Gene stable ID, Gene name ;

Step3:選擇對應(yīng)orthologs的物種(根據(jù)首字母)

Step4: 下載: Result -> Go


Step5: 查看下載結(jié)果猪叙,寫腳本自己轉(zhuǎn)換吧娇斩;

? ? 轉(zhuǎn)換結(jié)果:小鼠原始gene 數(shù)目:24784

? ? ? ? ? ? ? ? ? ? 轉(zhuǎn)換后gene數(shù)目:16412

3.??其他

另外,發(fā)現(xiàn)了一個(gè)比較有意思的R包穴翩,對于探索基因功能注釋以及富集分析會有幫助:AnnotationDbi 犬第, org.Hs.eg.db;

安裝:

Library(BiocManager)

BiocManager::install("Orthology.eg.db")

keytypes(org.Hs.eg.db)? ? ##查看基因注釋數(shù)據(jù)庫

## [1] "ACCNUM"? ? ? "ALIAS"? ? ? ? "ENSEMBL"? ? ? "ENSEMBLPROT"? "ENSEMBLTRANS"

## [6] "ENTREZID"? ? "ENZYME"? ? ? "EVIDENCE"? ? "EVIDENCEALL"? "GENENAME"? ?

## [11] "GO"? ? ? ? ? "GOALL"? ? ? ? "IPI"? ? ? ? ? "MAP"? ? ? ? ? "OMIM"? ? ? ?

## [16] "ONTOLOGY"? ? "ONTOLOGYALL"? "PATH"? ? ? ? "PFAM"? ? ? ? "PMID"? ? ? ?

## [21] "PROSITE"? ? ? "REFSEQ"? ? ? "SYMBOL"? ? ? "UCSCKG"? ? ? "UNIGENE"? ?

## [26] "UNIPROT"? ?

columns(org.Hs.eg.db)? #查看通用數(shù)據(jù)庫中id注釋

## [1] "ACCNUM"? ? ? "ALIAS"? ? ? ? "ENSEMBL"? ? ? "ENSEMBLPROT"? "ENSEMBLTRANS"

## [6] "ENTREZID"? ? "ENZYME"? ? ? "EVIDENCE"? ? "EVIDENCEALL"? "GENENAME"? ?

## [11] "GO"? ? ? ? ? "GOALL"? ? ? ? "IPI"? ? ? ? ? "MAP"? ? ? ? ? "OMIM"? ? ? ?

## [16] "ONTOLOGY"? ? "ONTOLOGYALL"? "PATH"? ? ? ? "PFAM"? ? ? ? "PMID"? ? ? ?

## [21] "PROSITE"? ? ? "REFSEQ"? ? ? "SYMBOL"? ? ? "UCSCKG"? ? ? "UNIGENE"? ?

## [26] "UNIPROT"

實(shí)施方案具體搜索哈~

4. 同源基因數(shù)據(jù)庫推薦:鏈接

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末芒帕,一起剝皮案震驚了整個(gè)濱河市歉嗓,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌背蟆,老刑警劉巖鉴分,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異带膀,居然都是意外死亡志珍,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進(jìn)店門本砰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來碴裙,“玉大人,你說我怎么就攤上這事点额。” “怎么了莺琳?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵还棱,是天一觀的道長。 經(jīng)常有香客問我惭等,道長珍手,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮琳要,結(jié)果婚禮上寡具,老公的妹妹穿的比我還像新娘。我一直安慰自己稚补,他們只是感情好童叠,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著课幕,像睡著了一般厦坛。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上乍惊,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天杜秸,我揣著相機(jī)與錄音,去河邊找鬼润绎。 笑死撬碟,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的莉撇。 我是一名探鬼主播呢蛤,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼稼钩!你這毒婦竟也來了顾稀?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤坝撑,失蹤者是張志新(化名)和其女友劉穎静秆,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體巡李,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡抚笔,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了侨拦。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片殊橙。...
    茶點(diǎn)故事閱讀 37,989評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖狱从,靈堂內(nèi)的尸體忽然破棺而出膨蛮,到底是詐尸還是另有隱情,我是刑警寧澤季研,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布敞葛,位于F島的核電站,受9級特大地震影響与涡,放射性物質(zhì)發(fā)生泄漏惹谐。R本人自食惡果不足惜持偏,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望氨肌。 院中可真熱鬧鸿秆,春花似錦、人聲如沸怎囚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽桩了。三九已至附帽,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間井誉,已是汗流浹背蕉扮。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留颗圣,地道東北人喳钟。 一個(gè)月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像在岂,于是被迫代替她去往敵國和親奔则。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容