基因序列的多物種比對與進化分析是研究物種間遺傳關(guān)系和功能保守性等的關(guān)鍵步驟漫雷。今天,我們將以T2R41
基因為例食呻,手把手教大家如何下載基因序列、進行多序列比對仅胞,以及構(gòu)建分子進化樹。
1. 搜索基因并下載序列
首先渠欺,打開NCBI官網(wǎng)https://www.ncbi.nlm.nih.gov/椎眯,在搜索欄輸入目標基因名稱T2R41
。
[圖片上傳失敗...(image-9fc25e-1734336014273)]
<figcaption>輸入名稱</figcaption>
進入搜索結(jié)果頁面后舔稀,選擇Gene
類型内贮,可以看到該基因在13個物種中有記錄汞斧。
[圖片上傳失敗...(image-7681bc-1734336014273)]
<figcaption>尋找基因</figcaption>
在檢索到的Gene
結(jié)果表格中,選擇感興趣的物種分別點擊鏈接進行下載竞端。
[圖片上傳失敗...(image-47e59-1734336014273)]
<figcaption>選擇物種</figcaption>
我們這里以human(人類)庙睡、mouse(小鼠)乘陪、monkey(猴子)為例,進入基因頁面并點擊右上角的Download Datasets
按鈕饺谬,選擇Gene Sequence (FASTA)
格式下載基因序列谣拣。建議將下載文件重命名為易識別的名稱森缠,方便后續(xù)整理。
[圖片上傳失敗...(image-bf595-1734336014273)]
<figcaption>下載對應序列</figcaption>
下載得到序列后列肢,我們分別將其解壓到各自文件夾。
[圖片上傳失敗...(image-36e5dc-1734336014273)]
<figcaption>下載后的文件</figcaption>
2. 整理序列數(shù)據(jù)
下載得到的壓縮文件解壓后拴还,基因序列會存儲在gene.fna
文件中欧聘,如下圖怀骤。
[圖片上傳失敗...(image-89aed9-1734336014273)]
<figcaption>單獨文件中的內(nèi)容</figcaption>
將各個物種的序列文件整理到一個總文件中,我們在此創(chuàng)建一個新的All.fa
文件.弓摘。打開記事本痕届,將每個gene.fna
文件中的內(nèi)容復制粘貼到All.fa
爷抓,并對>
后的描述信息進行簡化阻塑,如下圖:
[圖片上傳失敗...(image-ce6283-1734336014273)]
<figcaption>整理后的fa文件</figcaption>
3. 多序列比對
我們打開MEGA軟件陈莽,將剛剛整理好的All.fa
文件拖入軟件。
[圖片上傳失敗...(image-664543-1734336014273)]
<figcaption>打開MEGA軟件</figcaption>
拖入后會詢問是否是比對或?qū)Ρ葘Y(jié)果分析独柑,因為我們這是原始數(shù)據(jù)私植,所以需要先選擇Align
進行比對,點擊后序列被自動導入比對窗口曲稼。
[圖片上傳失敗...(image-2f0d3d-1734336014273)]
<figcaption>比對結(jié)果</figcaption>
目前展示的序列并沒有被對齊贫悄,因此我們選擇Alignment
菜單中的 Align by ClustalW
進行比對。
Tips: ClustalW和MUSCLE都是比對序列的算法唤反,可以相互替換,都可以嘗試肠缨。
[圖片上傳失敗...(image-e6877c-1734336014273)]
<figcaption>Alignment菜單</figcaption>
點擊后拥刻,會跳出窗口般哼,選擇OK
,全部序列進行比對漾橙。
[圖片上傳失敗...(image-3a9dfe-1734336014273)]
<figcaption>全部比對</figcaption>
接著彈出參數(shù)設(shè)置對話框楞卡,參數(shù)默認即可。
[圖片上傳失敗...(image-5b361e-1734336014273)]
<figcaption>默認比對參數(shù)</figcaption>
等待數(shù)秒后淘捡,接著我們會發(fā)現(xiàn)序列經(jīng)過比對焦除,已經(jīng)被對齊作彤。
[圖片上傳失敗...(image-c5170b-1734336014273)]
<figcaption>image-20241207134329586</figcaption>
比對結(jié)果中竭讳,不同的背景顏色代表不同的堿基,最上方有*
號的代表這個位置的堿基在物種間保守灿渴。
在Data
菜單中,我們可以選擇Export Alignment
中的MEGA Format
或FASTA Format
導出胰舆,如果后續(xù)分析僅計劃在MEGA軟件則導出第一種MEGA Format
骚露,如果后續(xù)還打算導入結(jié)果到其他軟件推薦FASTA Format
。
[圖片上傳失敗...(image-a0f384-1734336014273)]
<figcaption>比對結(jié)果導出</figcaption>
4. 構(gòu)建分子進化樹
接著我們返回軟件主頁面思瘟,點擊DATA
圖標打開剛才生成的結(jié)果荸百,導入剛才的結(jié)果。
[圖片上傳失敗...(image-4a964f-1734336014273)]
<figcaption>進化樹構(gòu)建</figcaption>
[圖片上傳失敗...(image-61ab23-1734336014273)]
<figcaption>導入數(shù)據(jù)后</figcaption>
接著選擇PHYLOGENY > Constract/Test Neighbor-Joining Tree
滨攻,使用鄰接法(NJ)構(gòu)建進化樹够话。 Tips:進化樹構(gòu)建有三種方法:若有合適的分子進化模型可供選擇蓝翰,則最大似然法獲得的結(jié)果較好;對于近緣物種序列女嘲,通常情況下使用最大簡約法;而對于遠緣物種序列欣尼,一般使用鄰接法或最大似然法爆雹。在這里我們選擇鄰接法進行展示。
[圖片上傳失敗...(image-b4ae45-1734336014272)]
<figcaption>構(gòu)建NG進化樹</figcaption>
接著進入分析選項窗口愕鼓,參數(shù)默認钙态,選擇OK
即可
[圖片上傳失敗...(image-55c0e7-1734336014272)]
<figcaption>參數(shù)默認</figcaption>
接下來我們就得到了分子進化樹,如下圖菇晃,我們可以在左側(cè)工具欄調(diào)整效果册倒,如文字大小,進化樹長度等設(shè)置磺送。
[圖片上傳失敗...(image-603fc3-1734336014272)]
<figcaption>進化樹結(jié)果</figcaption>
[圖片上傳失敗...(image-a9513b-1734336014272)]
<figcaption>MEGA可以展示circle圖</figcaption>
圖片美化好后驻子,可以選擇Image
菜單進行圖片的導出。
[圖片上傳失敗...(image-914dc0-1734336014272)]
<figcaption>圖片保存</figcaption>
5. 導出nwk
文件
此外估灿,可以將進化樹導出nwk
文件崇呵,點擊File
中的Export Current Tree(Newick)
導出結(jié)果,進一步在其它工具中進行美化馅袁,如iTOL等網(wǎng)站域慷。
[圖片上傳失敗...(image-710d58-1734336014272)]
<figcaption>nwk結(jié)果導出</figcaption>
Tips: nwk格式文件內(nèi)容如下:
[圖片上傳失敗...(image-3bc78d-1734336014272)]
<figcaption>nwk格式文件內(nèi)容</figcaption>
總結(jié)
通過以上步驟,完成了基因多物種比對與分子進化樹的構(gòu)建司顿。從序列下載到比對分析芒粹,再到進化樹的生成與美化兄纺,這些步驟展示了DNA序列比對的基本流程大溜。希望這篇教程能幫助大家快速上手DNA多序列比對及基因進化分析,探索更多基因奧秘估脆!