“ 話不多說湾戳,直接開始今天的主題——給大家梳理一下如何通過測序得到的序列獲得最后呈現(xiàn)給讀者的系統(tǒng)發(fā)育樹蚓曼!”
1脉执、序列準(zhǔn)備:
通過測序獲得需要鑒定的目標(biāo)菌株的序列信息踢代,一般細(xì)菌測16S rDNA(全長大約1.5 kb左右)盲憎,真菌測ITS序列(500-750 bp)。
2胳挎、將序列上傳至NCBI數(shù)據(jù)庫與已知菌種序列進(jìn)行比較:
以細(xì)菌的16S rDNA序列為例(需要FASTA格式):
>菌種描述信息
ATCG..................
1)打開NCBI官網(wǎng)(https://www.ncbi.nlm.nih.gov/)饼疙,點擊右側(cè)的BLAST,選擇Nucleotide BLAST慕爬,進(jìn)入比對頁面:(16S rDNA序列比較也可以通過EzBioCloud(https://www.ezbiocloud.net/)數(shù)據(jù)庫進(jìn)行比對)
2)在blastn選項下面粘貼入比對的序列(粘貼的序列中間不能有空格)窑眯,其他選項見下圖:
3)點擊BLAST進(jìn)行序列比對(需要一定時間屏积,頁面隔幾秒刷新一次);
3磅甩、根據(jù)比對結(jié)果篩選并下載10-12條比對序列:
1)結(jié)果頁面包含了圖中所示的要素炊林,我們可以根據(jù)相似度及評分、序列長短篩選我們想要的序列:
2)篩選規(guī)則:與我們提交序列相似度最高的一條或多條16S序列即是我們所提交序列的匹配結(jié)果(菌種鑒定時卷要,16S序列比對結(jié)果在屬水平上具有說服力渣聚,所以會顯示有多個同屬但是不同種的結(jié)果,這說明我們的菌種屬于該屬僧叉,至于是什么種還需要通過功能基因進(jìn)行進(jìn)一步鑒定)奕枝。由于我們提交的序列全長為1500 bp左右,所以篩選過程中盡量選擇與之長短相差不大的模式菌株序列瓶堕,實在找不到與之長度相當(dāng)?shù)陌溃M可能選擇全基因組序列,數(shù)量在10-13條左右(一條相似度大于98.6%的以及其他相似度小于98.6%的)捞烟,且相似度最好不要集中在很小的一個范圍內(nèi)(太集中作圖效果會大大折扣)薄声。
3)選中序列后下載FASTA格式的txt文檔就行。
4题画、利用MEGA軟件進(jìn)行多序列比對:
(大家自行去官網(wǎng)或其他途徑下載即可默辨,任何版本都可以)
1)數(shù)據(jù)整理:將我們自己的序列和下載的序列整理到一起,然后在下載一條與比對結(jié)果顯示的屬屬于同一科的遠(yuǎn)緣屬加入到其中作為外群苍息;
2)打開MEGA軟件缩幸,點擊Align,選擇Create a new alignment竞思,點擊OK表谊,然后根據(jù)需要選擇核酸(DNA)或者氨基酸(Protein),然后在彈出的的窗口中直接復(fù)制粘貼準(zhǔn)備好的序列盖喷,也可以選擇lnsert Sequence From File爆办,選擇序列文件(可多選)。序列文件加載之后呈藍(lán)色背景(選中狀態(tài))课梳,點擊W選擇Align DNA(核酸序列)或者Align protein(氨基酸序列)距辆,在彈出的窗口中設(shè)置參數(shù)(一般默認(rèn)即可,無需修改)暮刃,點擊OK跨算,開始序列比對。
3)比對完成后椭懊,需要截齊兩端含有的序列诸蚕,選中無的或者上面是---序列,按Delete刪除即可,截齊之后保存文件為:filename.mas背犯。
5坏瘩、構(gòu)建系統(tǒng)發(fā)育樹:
多序列比對窗口點擊Data,選擇Phylogenetic Analysis漠魏,彈出窗口詢問:所有序列是否編譯蛋白質(zhì)桑腮,根據(jù)實際情況選擇Yes或No。
此時蛉幸,返回MEGA主界面進(jìn)行系統(tǒng)發(fā)育樹的構(gòu)建破讨。MEGA主界面點擊Phylogeny,選擇Construct/Test Neighbor-Joining Tree奕纫,彈出的對話框詢問:是否使用當(dāng)前激活的數(shù)據(jù)提陶,選擇Yes。這時彈出建樹參數(shù)設(shè)置對話框匹层,根據(jù)實際需要設(shè)置即可(參數(shù)見下圖)隙笆,然后點擊Compute,完成建樹彈出建好的系統(tǒng)發(fā)育樹升筏。
6撑柔、發(fā)育樹美化:
得到系統(tǒng)發(fā)育樹后,我們可以將其復(fù)制粘貼至word或者PPT進(jìn)行美化您访,可以得到如下效果圖: