Emsenbl的BioMart工具: http://asia.ensembl.org/biomart/martview/db73e9d48b0fb03717654a65c72012c4
文章目錄
0 數(shù)據(jù)輸入格式與輸出要求
1 選擇人類基因數(shù)據(jù)庫
(1)-> Emsenbl
(2)-> 點BioMart
(3)-> 點Dataset
(4)-> 選擇輸入的基因來自什么庫
2 輸入的ID列表
(1)-> 點Fliters(過濾器)
(2)-> 勾選Input ereferences ID list
(3)-> 選擇輸入的基因ID類別
(4) 文本框內(nèi)輸入Gene Name列表
3 輸出的屬性選項
(1)-> Attributes(屬性)
(2)-> GENE -> Ensembl 選擇輸出格式
(3)-> External References
4 結(jié)果的輸出及下載保存
(1)-> (網(wǎng)頁左上角)點Results
(2)-> 下載格式選 XLS
(3)-> GO
下面開始BioMart的技術(shù)總結(jié)
附 Excel分列小技巧
數(shù)據(jù)輸入格式與輸出要求
首先,看一下我們的例子芝雪,我們的數(shù)據(jù)是人類的miRNA的Gene name侮邀,目的是轉(zhuǎn)換得到 Gene ID庆寺、Transcript ID、miRBase ID雄人。
1 選擇人類基因數(shù)據(jù)庫
(1)-> Emsenbl
? Emsenbl 網(wǎng)址:http://asia.ensembl.org/index.html
(2)-> 點BioMart
(3)-> 點Dataset
(4)-> 選擇輸入的基因來自什么庫
人類基因選擇:選擇 Ensembl Genes 92和Human genes(GRCh38.p12)
2 輸入的ID列表
(1)-> 點Fliters(過濾器)
(2)-> 勾選Input ereferences ID list
(3)-> 選擇輸入的基因ID類別
? 我們的數(shù)據(jù)是miRNA的Gene Name傅联,如圖選Gene Name(s)
(4) 文本框內(nèi)輸入Gene Name列表
如果數(shù)據(jù)是Gene ID:ENSG12345678910這樣的撒妈,選Gene stable ID(s)。以此類推运褪。
? 根據(jù)自己數(shù)據(jù)的類型惊楼,選擇對應(yīng)的ID格式。(注意看選項后括號里給出的例子秸讹,要和自己的數(shù)據(jù)完全對應(yīng)上)
3 輸出的屬性選項
(1)-> Attributes(屬性)
(2)-> GENE -> Ensembl 選擇輸出格式
? 注意檀咙,所有要顯示在結(jié)果里的輸出格式都要選(包括我們輸入的是Gene name格式,那么“Gene name”選擇一樣要選璃诀。否則弧可,結(jié)果里不會顯示輸入的數(shù)據(jù),只有一堆轉(zhuǎn)換后的ID劣欢,無法輸入輸出一一對應(yīng))棕诵。
? 所以裁良,我們選擇了Gene stable ID(輸出)、Transcript stable ID(輸出)校套、Gene name(輸入)价脾。
如果需要其他格式,比如ENTRREZID笛匙,選擇External鏈接侨把。
(3)-> External References
? 同樣還在Attributes下GENE里的子選項,下拉妹孙。在External References 中座硕,其它的輸出格式按需求選擇。我們選擇了miRBase ID(輸出)涕蜂。此處最多能選擇3項华匾。
4 結(jié)果的輸出及下載保存
(1)-> (網(wǎng)頁左上角)點Results
? 得到結(jié)果,包括了我們的輸入列Gene name机隙,輸出列 Gene stable ID蜘拉、Transcript stable ID和miRBase ID。
(2)-> 下載格式選 XLS
(3)-> GO
? 然后就可以下載到這個表格的xls版本啦有鹿。
下面開始BioMart的技術(shù)總結(jié)
流程就是以上這么個流程旭旭,步驟做一遍就清晰了。
關(guān)鍵是輸入格式要選對葱跋,注意BioMart所給的ID例子持寄,一定要完全對應(yīng),否則無法識別娱俺。
輸出選項里稍味,注意要把輸入格式也選上,否則輸入選項并不會顯示在結(jié)果里荠卷。
例子里一共選了4個屬性選項模庐,所以得到4個輸出列。合理運用BioMart油宜,按需選擇輸入格式和輸出格式掂碱,就能對多種RNA做多種ID轉(zhuǎn)換了。
附 Excel分列小技巧
之前同學(xué)的同學(xué)問我怎么把帶版本號的mRNA的Gene ID轉(zhuǎn)換成mRNA的Gene name慎冤。
一開始他是在NCBI一個一個查疼燥,我覺得吧,可以是可以蚁堤,沒必要是真的沒必要醉者,這時BioMart就很好用啦。
他的原數(shù)據(jù)是這樣的(第一列):
由于他的原始數(shù)據(jù)中mRNA Gene ID 是帶小數(shù)的,而這個小數(shù)并不影響轉(zhuǎn)換得到對應(yīng)Gene name湃交,直接把放入BioMart作為Gene stable ID又無法被識別熟空。可以選擇用excel的分列功能搞莺,批量將小數(shù)刪去息罗。(當然還有很多種刪掉小數(shù)的方法,這里只是示范一種簡單的方法才沧,來讓我們的數(shù)據(jù)和BioMart的要求對應(yīng)上迈喉。)
操作如下:
用Excel打開數(shù)據(jù) -> 全選我們的數(shù)據(jù) -> 工具欄[數(shù)據(jù)] -> [分列] -> 選[分隔符號] -> [下一步]
-> 選[其它] -> 輸入“.” -> [下一步] -> [完成]
結(jié)果如下圖。
歡迎留言討論與交流~
————————————————
版權(quán)聲明:本文為CSDN博主「lotusng」的原創(chuàng)文章温圆,遵循CC 4.0 BY-SA版權(quán)協(xié)議挨摸,轉(zhuǎn)載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/lotusng/article/details/88399218