嗨嗨伺帘,好久不見,太久沒有更新啦忌锯。前幾天和老師討論實(shí)驗(yàn)的時候伪嫁,他提到了這個數(shù)據(jù)庫挺方便,之前只是聽說過偶垮,沒有研究過怎么用张咳,回來之后我就仔細(xì)看了下,今天順便記錄一些基本操作哈似舵。
首先脚猾,phytozome是一個收錄了植物基因組的數(shù)據(jù)庫和在線工具,注釋信息砚哗、基因組數(shù)據(jù)的獲取龙助、可視化瀏覽都十分方便。
1.數(shù)據(jù)下載
作為一個數(shù)據(jù)庫蛛芥,其最最主要的功能就是提供?數(shù)據(jù)的下載?提鸟,作為一個有原則的網(wǎng)站,phytozome要求你注冊后才能下載它的數(shù)據(jù)仅淑,所以乖乖注冊称勋。
選擇你需要的物種,以擬南芥為例涯竟,annotation?注釋文件夾赡鲜,assembly?組裝文件夾。
不清楚這些文件是干啥的昆禽,請翻閱往期文章:
基因家族生信分析基礎(chǔ)蝗蛙,基礎(chǔ)到教你序列下載的那種基礎(chǔ)Sァ(一)
基因家族生信分析基礎(chǔ)醉鳖,基礎(chǔ)到教你序列下載的那種基礎(chǔ)!(二)
2.批量提取基因序列
選擇物種應(yīng)該不用多說哮内,比較方便的是?keywords?部分可以輸入基因功能盗棵,家族名稱壮韭,某個結(jié)構(gòu)域等等都可以,然后GO纹因。
3.單個基因檢索
主頁Tools——Keywords?search——選家族(可自行輸入或點(diǎn)選下方樹狀圖)喷屋,輸入關(guān)鍵詞,GO瞭恰。
于是我們先來看看基本信息屯曹,點(diǎn)G。
1.Functional Annotation:根據(jù)Pfam數(shù)據(jù)庫呈現(xiàn)出蛋白結(jié)構(gòu)域等部分惊畏。
2.Genomic:該基因在基因組上的位置恶耽,可視化一下外顯子內(nèi)含子啥的。
3.Sequences:這一部分我個人覺得挺有用颜启,UTR等位置都標(biāo)注的很清楚偷俭。
4.Protein?Homologs:同源蛋白,顯示該蛋白在其他物種里的一些同源蛋白及其基本信息等缰盏,起碼和NCBI比起來涌萤,這個網(wǎng)站速度快很多哈。
5.Gene?Ancestry:基因進(jìn)化相關(guān)信息等口猜。
6.Expression:可以查看該基因收錄在不同文獻(xiàn)中的表達(dá)情況(expression)负溪,還可以查看與該基因呈現(xiàn)共表達(dá)情況的相關(guān)基因(coexpression),correlation則表示共表達(dá)程度济炎,非常好用笙以。
至于點(diǎn)擊B,就可以直接看到基因可視化信息冻辩,如下圖猖腕,放大縮小啥的自己多點(diǎn)點(diǎn)就明白了。
4.啟動子序列的獲取
在上一步的3.sequences中點(diǎn)開Genomic?sequence恨闪,輸入你需要的長度參數(shù)倘感,可以直接獲取上下游序列。
5.Blast查找同源基因或者檢測引物特異性
可參考文章:論引物特異性的重要性咙咽,順便帶你看懂花花綠綠的結(jié)果老玛,方法大同小異,相信你能搞定钧敞。
最后蜡豹,如果沒看明白本教程還可以直奔網(wǎng)課:植物基因組數(shù)據(jù)庫Phytozome,講的非常詳細(xì)溉苛,五塊錢镜廉,兩人一起好像一塊錢,買它買它買它(無利益關(guān)系愚战,單純推薦哈