今天突然發(fā)現(xiàn)enseml數(shù)據(jù)庫(kù)感覺比NCBI數(shù)據(jù)庫(kù)好用饺著。尤其對(duì)于我這種小白來說箫攀。
我的任務(wù)就是找到果蠅中編碼漆酶的基因序列,該序列轉(zhuǎn)錄之后形成的轉(zhuǎn)錄本幼衰,以及這些轉(zhuǎn)錄本翻譯成的蛋白質(zhì)是什么靴跛。
這樣就到達(dá)了果蠅漆酶2的基因組的界面绝葡,從這里我們可以看到果蠅漆酶2的ensembl的ID號(hào)是:FBgn0259247.這個(gè)ID的命名是由規(guī)律的深碱,F(xiàn)B代表的是果蠅這一個(gè)物種,gn代表的是這是一個(gè)基因藏畅。如果我們?cè)倏聪旅娣蠊瑁蜁?huì)看到有一個(gè)Transcript ID,我們可以看到愉阎,它也是FB開頭绞蹦,但是后面跟著的是tr,這可能代表的就是轉(zhuǎn)錄本的意思榜旦。
除此之外我們還可以看到laccase2位于果蠅染色體2R的第5413744個(gè)堿基到5456095個(gè)堿基上幽七,也就是這個(gè)基因內(nèi)含子加外顯子總共長(zhǎng)42352bp。
在最下面我們還可以看到這個(gè)基因由于可變剪接形成了5個(gè)轉(zhuǎn)錄本章办,可以看到他們的名字锉走,ID,序列長(zhǎng)度藕届,以及編碼的蛋白質(zhì)的氨基酸的個(gè)數(shù)挪蹭,接下來是Uniprot,它顯示的是該轉(zhuǎn)錄本在Uniprot數(shù)據(jù)庫(kù)中的版本號(hào)(?accession number)休偶,這個(gè)版本號(hào)的命名規(guī)則可以看http://www.biotrainee.com/thread-411-1-3.html
真心覺得總結(jié)的很好梁厉,自己學(xué)到了很多。
并且可以鏈接到該數(shù)據(jù)庫(kù)中去踏兜。最后一列是5種轉(zhuǎn)錄本在NCBI的Refseq數(shù)據(jù)庫(kù)中中的ID號(hào)词顾。Refseq是一個(gè)去掉冗余的數(shù)據(jù)庫(kù),它為基因組注釋提供了參考碱妆。對(duì)于它的ID號(hào)來說肉盹,基因組DNA以NC_####這種格式。轉(zhuǎn)錄組中如果是mRNA疹尾,則是NM_####這種格式上忍,如果是非編碼RNA,則是NR_####這種格式纳本。如果是蛋白的話窍蓝,是以NP_####為模板的這種形式。所以在最后一列繁成,可以看到有5個(gè)NM_開頭的吓笙,這是他的5個(gè)轉(zhuǎn)錄本,最后一個(gè)是NP_開頭的巾腕,這對(duì)應(yīng)于每一個(gè)轉(zhuǎn)錄本翻譯出來的蛋白質(zhì)面睛。